肯尼亞“喂養(yǎng)”GPT-4
本文來自:時代周報APP,,作者:劉沐軒,編輯:梁勵,頭圖來自:視覺中國
積灰的吊扇慵懶地轉(zhuǎn)著,,十幾個肯尼亞人盯著笨重的臺式電腦屏幕,不斷露出驚訝的神情,。
考慮到這里是肯尼亞內(nèi)羅畢的基貝拉貧民窟,,一個過半居民沒有工作,連自來水和干凈的廁所都難得一見的地方,,可能有人會誤以為,,他們一定是“村里剛通上網(wǎng)”,才會露出這種沒見過世面的反應(yīng)吧,?
與想象的不同,,實際上,他們在為全球最先進,、最熱門的AI產(chǎn)品ChatGPT工作,。這些人被稱作數(shù)據(jù)標注師,正是他們保障了ChatGPT“健康成長”,,使其成為一個彬彬有禮,、夸夸其談的聊天AI。
近半個月以來,,隨著ChatGPT最新版本GPT-4的發(fā)布,,全球科技公司紛紛跟進,例如英偉達宣布在芯片硬件和云服務(wù)領(lǐng)域上全面支持AI的開發(fā),,百度發(fā)布文心一言,,而AI也再次成為全球焦點。
但在光鮮亮麗的社會變革和投資熱潮背后,,卻是一群時薪不到兩美元的肯尼亞人來教會AI,,何為善惡。
而且這份工作,,并不光鮮,。
一、“精神污染”
互聯(lián)網(wǎng)上的言論總是充滿著“戾氣”,,幾條惡毒的言論就可以影響一個人的心情,。如果有這樣一份工作,要求員工每天高強度閱讀9個小時的惡意內(nèi)容,,時薪多少能讓人接受,?
為OpenAI閱讀和標記這些內(nèi)容的肯尼亞人,實得工資約為每小時1.32美元至2美元(約合9~13.7元人民幣),。
這些肯尼亞數(shù)據(jù)標注師的工作內(nèi)容類似于鑒黃師,,但更重口。
為了教會ChatGPT什么內(nèi)容不該學(xué),數(shù)據(jù)標注公司Sama從暗網(wǎng)上找來了各種由人性最黑暗面產(chǎn)生的文本和圖片,,包括但不限于無碼的血腥酷刑,、反人類的犯罪現(xiàn)場、兒童性虐待和仇恨言論,。
一位負責(zé)為OpenAI閱讀和標記惡意文本的肯尼亞數(shù)據(jù)標注師表示,,他在閱讀了一則跨物種獵奇性行為的圖片后,反復(fù)出現(xiàn)幻覺,?!澳鞘且环N折磨,即便是在一周后,,我還是偶爾會想起那張圖片,,止不住地犯惡心?!?/p>
用中文互聯(lián)網(wǎng)的流行語來形容,,就是“我的腦子不干凈了”,或“辣眼睛”,。
一張圖片的影響已如此之大,,但除了圖片之外,肯尼亞的數(shù)據(jù)標注師們每天還需要閱讀150至250段文本,,長度從大約100個單詞到1000多個單詞不等,。
這些讓人心理和生理上不適的內(nèi)容,不斷撕裂著數(shù)據(jù)標注師的三觀,,每個人都積攢了大量的精神壓力,。最終,沒人能堅持超過3個月,。
因此,,雇傭他們的Sama公司在2022年2月終止了為OpenAI提供服務(wù)的合同,比計劃提前了八個月,。
Sama是一家總部位于美國舊金山的公司,,長期在肯尼亞、烏干達和印度雇用員工,,為谷歌,、Meta和微軟等硅谷公司提供類似的數(shù)據(jù)標注業(yè)務(wù)。Sama將自己定位為一家“有道德的AI公司”,,聲稱已幫助50000多人擺脫貧困,。
自稱是改善社會生產(chǎn)方式的變革,但AI的源頭卻從這樣令人痛苦的工作開始,。剝削貧困國家的廉價勞動力去做最基礎(chǔ)的工作,,是否會成為AI誕生的“原罪”?
二、離不開人的AI
即便是最先進的AI,,也仍然離不開人,,哪怕這個人來自相對貧困落后的國家。因此,,肯尼亞數(shù)據(jù)標注師們的工作對OpenAI而言至關(guān)重要,。
事實上,ChatGPT的前身GPT-3,,就已經(jīng)具備了令人印象深刻的語言表達能力和邏輯認知能力。但由于缺乏對于互聯(lián)網(wǎng)信息的篩選機制,,GPT-3也會被充滿惡意的信息誘導(dǎo),,輸出一些仇恨、暴力,、歧視的內(nèi)容,。
在全面推廣后,一旦發(fā)生類似“AI支持納粹”這樣的公關(guān)危機,,整個行業(yè)都有可能被偏見推上風(fēng)口浪尖,,導(dǎo)致技術(shù)進步停滯。
如今,,大多數(shù)的互聯(lián)網(wǎng)平臺都有著運用AI技術(shù)的信息審核機制,,從最基礎(chǔ)的關(guān)鍵詞初篩,到高級的識圖和從語言邏輯中判斷惡意內(nèi)容,,都離不開AI技術(shù)的身影,。
想要構(gòu)建這樣能夠自我學(xué)習(xí)和進化的信息審核機制,OpenAI借鑒了Facebook等社交媒體的做法,。那便是先收集那些帶有血腥,、暴力、仇恨言論和性虐待標簽的素材,,由遠在肯尼亞的數(shù)據(jù)標注師進行人工評級打分,,再教給ChatGPT。
經(jīng)歷多輪人工校對后,,ChatGPT將建立自己的“善惡觀”,,在產(chǎn)生惡意言論之前,就將其過濾掉,。
現(xiàn)在呈現(xiàn)在世界面前的,,這個禮貌、成熟,,甚至表現(xiàn)出一定共情能力的GPT-4,,可以說是AI見慣了人間百態(tài)之后的樣子。
OpenAI“誕下”了GPT-4,但雇了一批肯尼亞“保姆”,,干著最臟最累的活來“養(yǎng)育”GPT-4,。
“ChatGPT和其他語言模型AI令人印象深刻,但他們并不神奇,?!比斯ぶ悄軅惱韺W(xué)家安德魯·斯特雷特表示,因為這些AI仍然依賴于大量人力和數(shù)據(jù),,其中大部分是未經(jīng)授權(quán)和未經(jīng)同意使用的,,連這個領(lǐng)域最明星的企業(yè)OpenAI也沒能解決這些嚴重的基礎(chǔ)性問題。
三,、為什么是肯尼亞,?
對于外界而言,崎嶇的山脈,、茂密的森林和野生動物豐富的大草原,,構(gòu)成了他們眼中的肯尼亞。
然而在這片不到60萬平方公里的國土上,,生活著5300萬肯尼亞人,,其中不少人選擇了從事與計算機相關(guān)的數(shù)字工作。
據(jù)2021年肯尼亞媒體《肯尼亞華爾街》的一份報告,,肯尼亞成年人口中有超過120萬數(shù)字工作者,。相比于2019年的63.8萬人,這一數(shù)據(jù)有了顯著增長,。
他們從事線上營銷、線上助理,、學(xué)術(shù)寫作,、軟件開發(fā)和數(shù)據(jù)科學(xué)等工作。
根據(jù)市場分析機構(gòu)埃森哲的預(yù)測,,到2025年,,數(shù)字經(jīng)濟預(yù)計將占肯尼亞GDP的9.24%。但這一數(shù)字仍遠低于世界銀行統(tǒng)計的全球平均水平15%,。
盡管肯尼亞的互聯(lián)網(wǎng)普及率不高,,貧富差距極大,但還是有一部分人率先享受到了線上工作的便利,。
政府對數(shù)字經(jīng)濟的推動,,極低的工資標準,以及勞動法執(zhí)行的紕漏,,促使肯尼亞成為發(fā)達國家的數(shù)字外包“工廠”,。
就拿數(shù)據(jù)標注師的工資而言,,雇傭美國人的平均月薪約為4374美元(約合3萬元人民幣),雇傭印度人的平均月薪要1.67萬盧比(約合1400元人民幣),,而雇傭肯尼亞人僅需每月2萬肯尼亞先令(折合約1044元人民幣),。
美國《時代周刊》曾采訪多名承擔(dān)ChatGPT外包數(shù)據(jù)標注師的肯尼亞Sama員工,他們都表示并沒有收到公司承諾的“全身心保障”福利,,比如心理咨詢,、冥想、護理和游戲等,。
但對于工資,,他們并未表達出明確的不滿,Sama承諾的每月21000~40000肯尼亞先令的工資水平,,已經(jīng)遠遠高于當(dāng)?shù)刈畹驮滦綐藴?5000先令,。為了生計,他們也都不愿透露姓名,。
遭受“精神污染”的數(shù)據(jù)標記師終究還是少數(shù),,大多數(shù)肯尼亞數(shù)據(jù)標記師處理著相對正常的內(nèi)容,。對于討生活的肯尼亞人而言,,與其考慮自己是否“被剝削”,還不如接受這份高薪的外包工作,。
這也促使科技巨頭們打著“幫助當(dāng)?shù)匕l(fā)展人工智能”的口號,,變本加厲地在這些國家攫取廉價勞動力資源。
或許在他們看來,,一個工業(yè)結(jié)構(gòu)不完整,,政局不穩(wěn)定的貧困非洲國家,僅憑一群學(xué)歷都不高的員工幫助國際科技巨頭們做點外包工作,,怎么可能實現(xiàn)所謂“人工智能領(lǐng)域的彎道超車”呢,?
本文來自:時代周報APP,作者:劉沐軒,,編輯:梁勵
本內(nèi)容為作者獨立觀點,,不代表虎嗅立場。未經(jīng)允許不得轉(zhuǎn)載,,授權(quán)事宜請聯(lián)系[email protected]
如對本稿件有異議或投訴,,請聯(lián)系[email protected]End
想漲知識 關(guān)注虎嗅視頻號!
隨便看看:
- [業(yè)內(nèi)]雙曲線二號驗證火箭動力系統(tǒng)試車成功 可用于驗證運載火箭的重復(fù)
- [業(yè)內(nèi)]新方法可使植物塑料降解成肥料
- [業(yè)內(nèi)]“綠電”出海 中國推動全球新能源合作
- [業(yè)內(nèi)]新研究揭示龜殼可記錄放射性污染
- [業(yè)內(nèi)]想購買既精美又好用的手機,來看看顏值黨的福音,,OPPORen
- [業(yè)內(nèi)]百城萬家經(jīng)銷商受益 快手汽車協(xié)同流通協(xié)會發(fā)布繁星計劃
- [業(yè)內(nèi)]廣西電網(wǎng)助力我國西部地區(qū)首臺“華龍一號”核電機組并網(wǎng)發(fā)電
- [業(yè)內(nèi)]2023前沿科學(xué)創(chuàng)新大會舉行
- [科技]區(qū)塊鏈成數(shù)據(jù)要素關(guān)鍵技術(shù) 信通院TBI成立首個專項研究組
- [業(yè)內(nèi)]中國第13次北冰洋科學(xué)考察隊正式開始大洋科考作業(yè)
相關(guān)推薦:
網(wǎng)友評論:
推薦使用友言,、多說、暢言(需備案后使用)等社會化評論插件
- 易通博源科技:AI課程助力學(xué)員開啟副業(yè)增收新征程
- SeaLink —— 打破水下無信號的桎梏,,開啟實
- ZF LIFETEC繼續(xù)增長 將持續(xù)深耕中國市場
- 專訪首驅(qū)科技產(chǎn)品經(jīng)理夏思蓮:無感智能,,讓出行回歸本
- 小天鵝空調(diào)好用嗎?深度解析小天鵝空調(diào)的硬核實力
- "從設(shè)計到施工,,盎銳科技數(shù)字孿生技術(shù)減少
- 與《乘風(fēng)2025》攜手共舞,,三星Galaxy S2
- 當(dāng)3.15撕開行業(yè)遮羞布,太陽電纜如何用“每一米國
- 樂其創(chuàng)新SmallRig與深職大未來技術(shù)學(xué)院共筑“
- 共筑美好未來,!寰行盛世愛心捐贈助力興寧縣教育發(fā)展
- 熱點搶先看|2024南方網(wǎng)通第二十五屆渠道商交流會
- 《大數(shù)據(jù)平臺云化改造實踐指南(2024)》發(fā)布,,天
- 覺卿諦語智能科技在全國12355心理健康大會上展示
- 當(dāng)好“兩個稀土基地”建設(shè)主力軍,北方嘉軒永磁電機大
- 大模型助力工業(yè)智能化發(fā)展
- 工商業(yè)光伏發(fā)電施工指南-太陽庫光伏
- 科技賦能,,避震嬰兒車或成為行業(yè)硬通貨
- 龍旗科技進軍AI PC市場,,激發(fā)行業(yè)創(chuàng)新活力
- 科技賦能教育:核桃編程亮相“科創(chuàng)中國·北京創(chuàng)新薈”
- 英偉達搶占高位,市場急需尋求新機遇,,這三支AI股值