人工智能訓(xùn)練師:讓機(jī)器更“懂”人類(lèi)
人工智能訓(xùn)練師:
讓機(jī)器更“懂”人類(lèi)(新職?新知③)
彭訓(xùn)文 張嘉幸 《 人民日?qǐng)?bào)海外版 》( 2023年07月31日 第 05 版)
打開(kāi)電腦,將采集的風(fēng)聲,、雨聲,、溪流聲等聲音數(shù)據(jù)輸入,“清洗”掉夾雜其間的噪音,,對(duì)助聽(tīng)器數(shù)據(jù)模型進(jìn)行“訓(xùn)練”,,測(cè)試模型在真實(shí)場(chǎng)景的靈敏度……伴隨著手指敲擊鍵盤(pán)的“啪嗒啪嗒”聲,騰訊天籟實(shí)驗(yàn)室人工智能訓(xùn)練師付聰一天的工作就此開(kāi)始,。
近幾年,,隨著人工智能技術(shù)不斷發(fā)展,這個(gè)被稱(chēng)為人工智能訓(xùn)練師的職業(yè)逐漸壯大,。作為“數(shù)字職業(yè)”之一,,人工智能訓(xùn)練師的出現(xiàn),加速了人工智能由技術(shù)研發(fā)走向行業(yè)應(yīng)用的過(guò)程,,將產(chǎn)生較高的經(jīng)濟(jì)價(jià)值和社會(huì)價(jià)值,。
為模型不斷“喂”數(shù)據(jù)
每次出門(mén)時(shí),付聰總會(huì)在耳朵上戴一個(gè)大“耳環(huán)”,。
這個(gè)“耳環(huán)”其實(shí)是一個(gè)測(cè)試版的助聽(tīng)器,。“耳環(huán)”里的聲音各式各樣,,有呼呼的噪聲,,有尖銳刺耳的吵鬧聲……這些經(jīng)過(guò)助聽(tīng)器放大后產(chǎn)生的噪聲,是很多佩戴助聽(tīng)器的聽(tīng)障人士長(zhǎng)期面臨的困擾,。
付聰和他的團(tuán)隊(duì)正在嘗試?yán)盟惴ㄔO(shè)計(jì),、通過(guò)人工智能技術(shù)“訓(xùn)練”數(shù)據(jù)模型,讓助聽(tīng)器更加“智慧”地降低噪聲,讓聽(tīng)障人群聽(tīng)得清,、聽(tīng)得懂,、聽(tīng)得舒服。
付聰解釋說(shuō),,助聽(tīng)器數(shù)據(jù)模型很小,,因此需要針對(duì)不同場(chǎng)景進(jìn)行優(yōu)化,很多場(chǎng)景充滿挑戰(zhàn),,“比如一個(gè)聽(tīng)障人士在餐廳吃飯,,周?chē)泻芏嗳苏f(shuō)話,他想跟對(duì)面的人聊天,,四周聲音特別嘈雜,,作為一個(gè)正常人都可能聽(tīng)不清楚,更何況一個(gè)有聽(tīng)力障礙的人,?我們希望利用模型,,把需要的聲音提取出來(lái),降低噪聲,,幫助更多聽(tīng)障人群”,。
理想很豐滿,但是實(shí)際的模型算法研發(fā)過(guò)程卻像是一場(chǎng)反復(fù)進(jìn)行的“戰(zhàn)役”,。
模型的研發(fā)過(guò)程大致分為以下幾步:數(shù)據(jù)采集,、數(shù)據(jù)“清洗”、模型訓(xùn)練,、場(chǎng)景測(cè)試,、調(diào)整算法,經(jīng)過(guò)幾次迭代之后再測(cè)試,、調(diào)整,,“如果測(cè)試結(jié)果不理想,需要把這個(gè)過(guò)程再走一遍,,直到得到最優(yōu)效果”,。付聰說(shuō),。
數(shù)據(jù)采集要有針對(duì)性,。為了讓模型更“聰明”,需要針對(duì)不同場(chǎng)景采集各種特殊數(shù)據(jù),。付聰和團(tuán)隊(duì)成員不僅需要到早晚高峰的地鐵,、熱鬧喧天的餐廳、人來(lái)人往的馬路等場(chǎng)景,,采集數(shù)百個(gè)小時(shí)的聲音數(shù)據(jù),,還要戴上助聽(tīng)器體驗(yàn)這些聲音的差別,“比如風(fēng)聲,正常人聽(tīng)到是呼呼聲,,但戴上助聽(tīng)器以后,,是很吵的噗噗聲,像是去KTV唱歌,,聲音使勁砸到麥克風(fēng)上”,。道路騎行、海邊風(fēng)浪……為了采集各種風(fēng)噪數(shù)據(jù),,付聰錄制了多種場(chǎng)景的風(fēng)聲,。
數(shù)據(jù)“清洗”是將不需要的數(shù)據(jù)“洗掉”。付聰舉了一個(gè)例子――風(fēng)聲,,真實(shí)場(chǎng)景下會(huì)夾雜汽車(chē)?guó)Q笛,、人交談等聲音。在整理時(shí)要把這些數(shù)據(jù)剔除出來(lái),,保留一個(gè)比較純粹的風(fēng)聲,,這樣模型才會(huì)“認(rèn)識(shí)”風(fēng)。
模型訓(xùn)練是將“清洗”好的數(shù)據(jù)“喂”給模型,。除了采集的特殊數(shù)據(jù),,付聰和他的同事們還會(huì)加入諸如世界各國(guó)的語(yǔ)言和一些非語(yǔ)音聲音等數(shù)據(jù),“基本涵蓋了人們生活中遇到的所有噪聲和語(yǔ)音”,。
和人類(lèi)不同,,人工智能模型在訓(xùn)練過(guò)程中,不會(huì)疲憊,、煩躁,、發(fā)脾氣,它們的“智慧”取決于模型參數(shù),、訓(xùn)練策略,、數(shù)據(jù)量等?!八鼈兙拖褚粋€(gè)‘孩子’,,會(huì)越來(lái)越‘聰明’,識(shí)別到越來(lái)越多的聲音,,我特別有成就感,。”付聰說(shuō),。
考驗(yàn)?zāi)托?、?xì)致和忍受力
模型訓(xùn)練完成后,并不意味立刻能應(yīng)用到聽(tīng)障人群的助聽(tīng)器上,,還要經(jīng)歷較長(zhǎng)時(shí)間的迭代,、調(diào)整過(guò)程,。
比如,為了讓聽(tīng)障人群適配到合適的助聽(tīng)器,,傳統(tǒng)方式是患者反復(fù)到線下的驗(yàn)配店去試戴,,過(guò)程繁雜。付聰解釋說(shuō),,一般情況下,,根據(jù)發(fā)病原因不同可以將聽(tīng)力下降分為三類(lèi):感音神經(jīng)性、傳導(dǎo)性,、混合性耳聾,;根據(jù)聽(tīng)力下降的程度不同,分為輕度,、中度,、重度及極重度耳聾。針對(duì)不同的類(lèi)型,,助聽(tīng)器的適配方式有所不同,。
有沒(méi)有可能把適配過(guò)程搬到“線上”,利用人工智能算法和深度學(xué)習(xí)能力,,讓聽(tīng)障人群在線上就能做準(zhǔn)確的聽(tīng)力驗(yàn)配,?帶著這個(gè)疑問(wèn),付聰開(kāi)始研發(fā)適配算法,。他將這個(gè)過(guò)程比喻為做應(yīng)用題,,需要查詢國(guó)內(nèi)外文獻(xiàn)、檢索現(xiàn)有方案,,根據(jù)具體的使用環(huán)境,,利用現(xiàn)有知識(shí)開(kāi)展合理想象、設(shè)計(jì)實(shí)驗(yàn),、尋找答案,。
這個(gè)過(guò)程考驗(yàn)人工智能訓(xùn)練師的耐心、細(xì)致,。在測(cè)試助聽(tīng)器音質(zhì)時(shí),,不同的佩戴方式,對(duì)應(yīng)不同的測(cè)試結(jié)果,。付聰和同事需要以“N×N”排列組合設(shè)計(jì)不同的佩戴方式,,并且不斷重復(fù)試驗(yàn),來(lái)研究其對(duì)音質(zhì)產(chǎn)生的影響,。
這個(gè)過(guò)程十分考驗(yàn)人工智能訓(xùn)練師的忍受力,。“一個(gè)人工智能訓(xùn)練師的基本素養(yǎng),,就是強(qiáng)迫自己聽(tīng)很多次刺耳的聲音。”付聰表示,,這是因?yàn)橛?xùn)練師需要定量衡量聽(tīng)障患者能正常聽(tīng)到的聲音極限點(diǎn),,而這些聲音的分貝數(shù)是正常人耳難以忍受的,“很多時(shí)候恨不得把耳機(jī)摔掉,。經(jīng)過(guò)一天測(cè)試,,整個(gè)腦袋都感覺(jué)疼”。
經(jīng)過(guò)不斷迭代,、調(diào)整,,內(nèi)置了算法的助聽(tīng)器終于完成了。最讓付聰難忘的是他們第一次到廣東韶關(guān)捐贈(zèng)產(chǎn)品,,他們把助聽(tīng)器挨個(gè)交到聽(tīng)障老人手上,,開(kāi)機(jī)、戴設(shè)備,、調(diào)整增益……“雖然我對(duì)模型很有信心,,但當(dāng)時(shí)還是感覺(jué)心提到了嗓子眼,因?yàn)樵诖酥?,老人們是無(wú)法正常交流的,。”付聰說(shuō),。
他小心地詢問(wèn)一個(gè)老人:“您能聽(tīng)到我在說(shuō)什么嗎,?”
“可以了?!崩先司徛謭?jiān)定地從口中說(shuō)出3個(gè)字,。
“那時(shí)候我覺(jué)得,我們做的這個(gè)事情挺有意義的,?!备堵斦f(shuō)。
用技術(shù)解決人類(lèi)需求
人工智能訓(xùn)練師是一個(gè)需要忍受孤獨(dú)的職業(yè),,因?yàn)樗麄兇罅康臅r(shí)間是在設(shè)計(jì)方案,、寫(xiě)代碼、采集數(shù)據(jù),、訓(xùn)練模型中度過(guò)的,。
“我戰(zhàn)勝孤獨(dú)的秘密是興趣?!备堵?shù)膶?zhuān)業(yè)是通信,,其中很多課程和信號(hào)處理相關(guān),他平時(shí)比較喜歡音樂(lè),,因此就將自己的興趣和專(zhuān)業(yè),、工作結(jié)合起來(lái),,聚焦音頻領(lǐng)域,大學(xué)畢業(yè)后參與了很多有關(guān)音頻信號(hào)處理的工作,,經(jīng)歷了音頻算法從傳統(tǒng)算法到人工智能算法,,再到大規(guī)模深度學(xué)習(xí)的各個(gè)階段。
在付聰看來(lái),,人工智能技術(shù)是一個(gè)很好的工具,,目的是將人類(lèi)從很多腦力勞動(dòng)中解放出來(lái),用規(guī)?;姆绞饺ヌ娲壳俺杀据^高的個(gè)體勞動(dòng),。對(duì)整個(gè)社會(huì)而言,這是一種生產(chǎn)力的進(jìn)步,,有著巨大的社會(huì)價(jià)值和商業(yè)價(jià)值,。
成熟的人工智能技術(shù)是什么樣?付聰認(rèn)為需要經(jīng)過(guò)3個(gè)階段:一是感知智能,,核心在于模擬人的視覺(jué),、聽(tīng)覺(jué)和觸覺(jué)等感知能力,比如人臉識(shí)別,、語(yǔ)音識(shí)別等,;二是認(rèn)知智能,具有人類(lèi)思維理解,、知識(shí)共享,、行動(dòng)協(xié)同或博弈等特征,“能夠真正理解人在說(shuō)什么,,根據(jù)一些提示,,提供相對(duì)完整的回答”;三是行為智能,,也就是像自動(dòng)駕駛一樣,,真正可以在物理世界發(fā)揮作用。
達(dá)到這樣的目標(biāo),,需要對(duì)人工智能模型不斷進(jìn)行訓(xùn)練,。付聰表示,首先需要針對(duì)問(wèn)題準(zhǔn)備足夠多的數(shù)據(jù),,“多到盡量涵蓋解決這個(gè)問(wèn)題時(shí)所遇到的所有情形”,;其次需要設(shè)計(jì)很好的算法,并根據(jù)用戶反饋不斷優(yōu)化,。
“人工智能技術(shù)領(lǐng)域日新月異,,要求人工智能訓(xùn)練師有廣闊的視野、深厚的人文情懷和社會(huì)責(zé)任感,,用業(yè)界最新想法,、理念和正確的倫理觀來(lái)幫助人類(lèi)解決生產(chǎn)生活中遇到的問(wèn)題,。”付聰說(shuō),。
隨便看看:
- [業(yè)內(nèi)]2023第十屆世界雷達(dá)博覽會(huì)開(kāi)幕,,多項(xiàng)雷達(dá)新品亮相
- [業(yè)內(nèi)]2022年中國(guó)科幻產(chǎn)業(yè)總營(yíng)收達(dá)877.5億元
- [業(yè)內(nèi)]“電博會(huì)”上帶您看“數(shù)聚未來(lái)”
- [業(yè)內(nèi)]美國(guó)研發(fā)出可實(shí)時(shí)監(jiān)測(cè)腎移植排異反應(yīng)的電子設(shè)備
- [業(yè)內(nèi)]杭州亞運(yùn)會(huì),、亞殘運(yùn)會(huì)在亞運(yùn)史上首次實(shí)現(xiàn)碳中和
- [業(yè)內(nèi)]人工智能首次自主設(shè)計(jì)并完成化學(xué)反應(yīng)
- [業(yè)內(nèi)]或搭第二代驍龍7+ 小米Civi 3首現(xiàn)身:顏值有望創(chuàng)新高#
- [業(yè)內(nèi)]蘇寧易購(gòu)下沉市場(chǎng)啟動(dòng)雙11,推出四個(gè)“1”優(yōu)惠活動(dòng)
- [業(yè)內(nèi)]“九章三號(hào)”量子計(jì)算原型機(jī)問(wèn)世 中國(guó)確立算力新里程碑
- [業(yè)內(nèi)]科普:人體氣味分子可遠(yuǎn)距離吸引蚊子
相關(guān)推薦:
網(wǎng)友評(píng)論:
推薦使用友言,、多說(shuō),、暢言(需備案后使用)等社會(huì)化評(píng)論插件
- AI大模型對(duì)傳統(tǒng)行業(yè)認(rèn)知的顛覆性分析
- 鴻蒙數(shù)字版權(quán)(HMDC)助力擴(kuò)大內(nèi)需擊碎關(guān)稅壁壘
- 盤(pán)點(diǎn)2025電線電纜十大品牌:規(guī)模擴(kuò)張后的價(jià)值重構(gòu)
- DODR首映“聚焦絲路新平臺(tái) 引領(lǐng)數(shù)字經(jīng)濟(jì)新生態(tài)”
- 家裝電線品牌大揭秘:這十大品牌品質(zhì)出色,值得信賴,!
- 易通博源科技:AI課程助力學(xué)員開(kāi)啟副業(yè)增收新征程
- SeaLink —— 打破水下無(wú)信號(hào)的桎梏,,開(kāi)啟實(shí)
- ZF LIFETEC繼續(xù)增長(zhǎng) 將持續(xù)深耕中國(guó)市場(chǎng)
- 專(zhuān)訪首驅(qū)科技產(chǎn)品經(jīng)理夏思蓮:無(wú)感智能,讓出行回歸本
- 小天鵝空調(diào)好用嗎,?深度解析小天鵝空調(diào)的硬核實(shí)力
- 熱點(diǎn)搶先看|2024南方網(wǎng)通第二十五屆渠道商交流會(huì)
- 《大數(shù)據(jù)平臺(tái)云化改造實(shí)踐指南(2024)》發(fā)布,,天
- 覺(jué)卿諦語(yǔ)智能科技在全國(guó)12355心理健康大會(huì)上展示
- 當(dāng)好“兩個(gè)稀土基地”建設(shè)主力軍,北方嘉軒永磁電機(jī)大
- 大模型助力工業(yè)智能化發(fā)展
- 工商業(yè)光伏發(fā)電施工指南-太陽(yáng)庫(kù)光伏
- 科技賦能,,避震嬰兒車(chē)或成為行業(yè)硬通貨
- 龍旗科技進(jìn)軍AI PC市場(chǎng),,激發(fā)行業(yè)創(chuàng)新活力
- 科技賦能教育:核桃編程亮相“科創(chuàng)中國(guó)·北京創(chuàng)新薈”
- 英偉達(dá)搶占高位,市場(chǎng)急需尋求新機(jī)遇,,這三支AI股值