AI為何會(huì)“一本正經(jīng)地胡說八道”
◎本報(bào)記者 羅云鵬
想象一下,,向人工智能(AI)聊天機(jī)器人詢問一個(gè)不存在的歷史事件,,比如“誰贏得了1897年美國和南極洲之間的戰(zhàn)斗?”即使沒有這樣的戰(zhàn)斗,,AI聊天機(jī)器人也可能會(huì)提供一個(gè)虛構(gòu)的答案,,例如“1897年的戰(zhàn)斗是由美國贏得的,,約翰?多伊將軍帶領(lǐng)部隊(duì)取得了勝利?!边@種AI編造信息“一本正經(jīng)地胡說八道”的情況屢見不鮮,。
在專業(yè)領(lǐng)域,AI“一本正經(jīng)地胡說八道”這種現(xiàn)象被稱為AI幻覺,?!癆I幻覺指的是AI會(huì)生成貌似合理連貫,但同輸入問題意圖不一致,、同世界知識(shí)不一致,、與現(xiàn)實(shí)或已知數(shù)據(jù)不符合或無法驗(yàn)證的內(nèi)容,。”近日,,長期從事自然語言處理,、大模型和人工智能研究的哈爾濱工業(yè)大學(xué)(深圳)特聘校長助理張民教授在接受科技日?qǐng)?bào)記者采訪時(shí)表示。
AI幻覺普遍存在
記者梳理發(fā)現(xiàn),,AI幻覺具有普遍性,。
今年2月,谷歌發(fā)布的AI聊天機(jī)器人Bard在視頻中,,對(duì)詹姆斯?韋布空間望遠(yuǎn)鏡曾做出不真實(shí)陳述,;3月,美國的兩名律師向當(dāng)?shù)胤ㄔ禾峤涣艘环萦肅hatGPT生成的法律文書,,這份文書格式工整,、論證嚴(yán)密,但其中的案例卻是虛假的……
OpenAI研究人員雖曾在今年6月初發(fā)布報(bào)告稱“找到了解決AI幻覺的辦法”,,但也承認(rèn),,“即使是最先進(jìn)的AI模型也容易生成謊言,它們?cè)诓淮_定的時(shí)刻會(huì)表現(xiàn)出捏造事實(shí)的傾向,?!?/p>
總部位于紐約的人工智能初創(chuàng)公司和機(jī)器學(xué)習(xí)監(jiān)控平臺(tái)Arthur AI也在今年8月發(fā)布研究報(bào)告,比較了OpenAI,、“元宇宙”Meta,、Anthropic以及Cohere公司開發(fā)的大語言模型出現(xiàn)幻覺的概率。研究報(bào)告顯示,,這些大模型都會(huì)產(chǎn)生幻覺,。
目前國內(nèi)大語言模型雖無產(chǎn)生AI幻覺相關(guān)披露,但也可從相關(guān)公開報(bào)道中找到端倪,。
今年9月,,騰訊混元大語言模型正式亮相。騰訊集團(tuán)副總裁蔣杰介紹,,針對(duì)大模型容易“胡言亂語”的問題,騰訊優(yōu)化了預(yù)訓(xùn)練算法及策略,,讓混元大模型出現(xiàn)幻覺的概率比主流開源大模型降低了30%―50%,。
“大模型有可能‘一本正經(jīng)地胡說八道’。如果不和行業(yè)專業(yè)數(shù)據(jù)庫或者一些專業(yè)應(yīng)用插件進(jìn)行對(duì)接,,這可能會(huì)導(dǎo)致它們提供過時(shí)或者不專業(yè)的答案,。”科大訊飛研究院副院長,、金融科技事業(yè)部CTO趙乾在第七屆金融科技與金融安全峰會(huì)上曾表示,,科大訊飛已經(jīng)推出一些技術(shù)方案,,讓大模型揚(yáng)長避短。
AI幻覺源自本身
“現(xiàn)在不同研究工作對(duì)AI幻覺的分類各不相同,?!睆埫窠榻B,總體而言,,AI幻覺可以分為內(nèi)在幻覺和外在幻覺兩類,。
據(jù)悉,內(nèi)在幻覺即是同輸入信息不一致的幻覺內(nèi)容,,包括同用戶輸入的問題或指令不一致,,或是同對(duì)話歷史上下文信息相矛盾,如AI模型會(huì)在同一個(gè)對(duì)話過程中,,針對(duì)用戶同一個(gè)問題的不同提問方式,,給出自相矛盾的回復(fù)。外在幻覺則是同世界知識(shí)不一致或是通過已有信息無法驗(yàn)證的內(nèi)容,,例如AI模型針對(duì)用戶提出的事實(shí)性問題給出錯(cuò)誤回答,,或編造無法驗(yàn)證的內(nèi)容。
近期,,騰訊AI Lab聯(lián)合國內(nèi)外多家學(xué)術(shù)機(jī)構(gòu)發(fā)布了一篇面向大模型幻覺工作的綜述,。該綜述認(rèn)為,AI幻覺集中在大模型缺乏相關(guān)知識(shí),、記憶錯(cuò)誤知識(shí),、大模型無法準(zhǔn)確估計(jì)自身能力邊界等場景。
“從技術(shù)原理上看,,AI幻覺多由于AI對(duì)知識(shí)的記憶不足,、理解能力不足、訓(xùn)練方式固有的弊端及模型本身技術(shù)的局限性導(dǎo)致,?!睆埫裉寡裕珹I幻覺會(huì)造成知識(shí)偏見與誤解,,甚至有時(shí)會(huì)導(dǎo)致安全風(fēng)險(xiǎn),、倫理和道德問題。
AI幻覺尚難消除
盡管AI幻覺短期內(nèi)難以完全消除,,但業(yè)界正試圖通過技術(shù)改進(jìn)和監(jiān)管評(píng)估來緩解其影響,,以保障人工智能技術(shù)的安全可靠應(yīng)用。
“現(xiàn)階段AI幻覺難以完全被消除,,但卻可以試著緩解,。”張民介紹,在預(yù)訓(xùn)練,、微調(diào)強(qiáng)化學(xué)習(xí),、推理生成等階段中運(yùn)用適當(dāng)?shù)募夹g(shù)手段,有望緩解AI幻覺現(xiàn)象,。
據(jù)介紹,,在預(yù)訓(xùn)練方面,需增加知識(shí)密集的數(shù)據(jù),、高質(zhì)量數(shù)據(jù)的選取和過濾,;微調(diào)強(qiáng)化學(xué)習(xí)過程中,選擇模型知識(shí)邊界內(nèi)的訓(xùn)練數(shù)據(jù)極為重要,;推理生成過程中,,可以采用檢索外部知識(shí)的辦法使得模型生成結(jié)果有證據(jù)可循。此外,,改進(jìn)解碼搜索算法也是一種可行的方案,。
騰訊AI Lab聯(lián)合國內(nèi)外多家學(xué)術(shù)機(jī)構(gòu)發(fā)布的綜述亦表明了同樣觀點(diǎn),并認(rèn)為諸如多智能體交互,、指令設(shè)計(jì),、人在回路、分析模型內(nèi)部狀態(tài)等技術(shù)也可成為緩解AI幻覺的方式,。
值得一提的是,,哈爾濱工業(yè)大學(xué)(深圳)自研的立知文本大模型和九天多模態(tài)大模型,對(duì)于上述緩解AI幻覺的方式均有深入探索,,并取得了顯著效果,。
“這對(duì)于開發(fā)一個(gè)真實(shí)可信的AI大模型是十分有必要的?!睆埫窠榻B,,“我們嘗試通過視覺信息增強(qiáng)語言模型的能力,降低語言模型的外部幻覺問題,;通過多個(gè)大模型智能體進(jìn)行獨(dú)立思考和分析,,經(jīng)由多智能體之間的討論、博弈和合作,,增強(qiáng)回復(fù)的客觀性,,減少AI幻覺?!?/p>
張民表示,,破解AI幻覺將提高AI系統(tǒng)的實(shí)用性、可信度和可應(yīng)用性,,這對(duì)人工智能技術(shù)的未來發(fā)展和社會(huì)的發(fā)展都有積極影響。同時(shí),更可靠的AI系統(tǒng)可以更廣泛地應(yīng)用于各個(gè)領(lǐng)域,,這將促進(jìn)技術(shù)進(jìn)步的速度,,帶來更多的創(chuàng)新。未來,,破解AI幻覺需要進(jìn)一步在算法,、數(shù)據(jù)、透明度和監(jiān)管等多個(gè)方面采取措施,,以確保AI系統(tǒng)的決策更加準(zhǔn)確可靠,。
下一篇:一批優(yōu)質(zhì)高產(chǎn)新品種獲準(zhǔn)推廣應(yīng)用
隨便看看:
- [業(yè)內(nèi)]北京打造機(jī)器人產(chǎn)業(yè)集群 將構(gòu)建“1+4”產(chǎn)品體系
- [業(yè)內(nèi)]賽博難民打響反AI第一槍
- [業(yè)內(nèi)]南水北調(diào)中線工程向河南供水突破200億立方米
- [業(yè)內(nèi)]廣東全面實(shí)施“數(shù)字灣區(qū)”建設(shè) 加快灣區(qū)數(shù)能產(chǎn)業(yè)集聚發(fā)展
- [業(yè)內(nèi)]報(bào)告稱亞洲正成為全球科技進(jìn)步動(dòng)力源
- [業(yè)內(nèi)]G6高分辨率新型顯示噴印裝備完成組裝
- [業(yè)內(nèi)]山東淄博:老工業(yè)城市新動(dòng)能涌動(dòng)
- [業(yè)內(nèi)]天舟五號(hào)貨運(yùn)飛船已受控再入大氣層
- [業(yè)內(nèi)]蘇寧易購零售云開啟“五一電器嗨購節(jié)” 套購滿萬減千
- [業(yè)內(nèi)]工信部征集智能檢測裝備創(chuàng)新產(chǎn)品
相關(guān)推薦:
網(wǎng)友評(píng)論:
推薦使用友言,、多說,、暢言(需備案后使用)等社會(huì)化評(píng)論插件
- 快意電梯榮耀加冕:雙百強(qiáng)榜單彰顯非凡實(shí)力!
- 光伏電池技術(shù)從P型到N型,,拉普拉斯(688726.
- 冷王VP Truck高頂系列重磅升級(jí):強(qiáng)勁制冷,,價(jià)
- 高性能 CPU:Arm Cortex-X925 實(shí)
- 項(xiàng)老師App:內(nèi)容極為精細(xì)化設(shè)計(jì)的教育典范
- “未來科技領(lǐng)袖”青少年“科創(chuàng)+”專場論壇倒計(jì)時(shí)1周
- 巨量千川推出兩大勢能,商家乘勢而起實(shí)現(xiàn)生意增長
- TCL實(shí)業(yè)硬核科技產(chǎn)品亮相2024 ChinaJo
- 為行業(yè)規(guī)范化發(fā)展賦能,,天翼云獲頒智算工程平臺(tái)標(biāo)準(zhǔn)參
- 弘揚(yáng)奧運(yùn)精神 綻放國云力量,,天翼云科技賦能體育產(chǎn)業(yè)
- 熱點(diǎn)搶先看|2024南方網(wǎng)通第二十五屆渠道商交流會(huì)
- 《大數(shù)據(jù)平臺(tái)云化改造實(shí)踐指南(2024)》發(fā)布,天
- 覺卿諦語智能科技在全國12355心理健康大會(huì)上展示
- 當(dāng)好“兩個(gè)稀土基地”建設(shè)主力軍,,北方嘉軒永磁電機(jī)大
- 大模型助力工業(yè)智能化發(fā)展
- 工商業(yè)光伏發(fā)電施工指南-太陽庫光伏
- 科技賦能,,避震嬰兒車或成為行業(yè)硬通貨
- 龍旗科技進(jìn)軍AI PC市場,激發(fā)行業(yè)創(chuàng)新活力
- 科技賦能教育:核桃編程亮相“科創(chuàng)中國·北京創(chuàng)新薈”
- 英偉達(dá)搶占高位,,市場急需尋求新機(jī)遇,,這三支AI股值