從“人工翻譯”到“人機共譯”,, 生成式AI時代百度如何為翻譯留下新注解,?
智東西
作者 | 程茜
編輯 | 漠影
ChatGPT風(fēng)靡,,它展現(xiàn)出來的能力讓一些崗位面臨危機感,,內(nèi)容創(chuàng)作工作者首當(dāng)其沖。這之中,,翻譯人員作為典型的文字工作者,,如何在大模型時代快速擁抱技術(shù),變“恐懼”為動力,?AI的颶風(fēng)會顛覆翻譯行業(yè)嗎,?
智東西4月3日報道,今天下午,,在2023中國翻譯協(xié)會年會上,,首屆全國翻譯技術(shù)大賽正式啟動。前沿技術(shù)突飛猛進的當(dāng)下,,翻譯工作者的工作模式發(fā)生了“翻天覆地”的變化,。
“首屆全國翻譯技術(shù)大賽”正式啟動
大賽由中國外文局、全國翻譯專業(yè)學(xué)位研究生教育指導(dǎo)委員會指導(dǎo),,中國翻譯協(xié)會,、中國外文局翻譯院、大連外國語大學(xué)主辦,,百度翻譯作為承辦單位之一,。
作為首個如此高規(guī)格的全國翻譯技術(shù)大賽,與此前的翻譯比賽不同,,本次大賽聚焦譯后編輯能力考查,。除了以選手的翻譯結(jié)果好壞作為評判標準外,本次比賽還會以百度智能文檔翻譯平臺相關(guān)技術(shù)和產(chǎn)品為工具,,增加了對選手使用機器翻譯技術(shù)的評判,。
當(dāng)下誕生的文心一言、ChatGPT等生成式AI產(chǎn)品背后都是依靠深度學(xué)習(xí)技術(shù)和大模型技術(shù)的發(fā)展,,這些技術(shù)和產(chǎn)品正在對各行各業(yè)產(chǎn)生各種各樣的深刻影響,,翻譯行業(yè)同樣如此,前沿技術(shù)正在改變這一行業(yè)的工作范式,, 科技賦能翻譯行業(yè),、賦能國家翻譯能力建設(shè)已是大勢所趨,“人機共譯”創(chuàng)新工作模式亦是中國超500萬譯者需要重點關(guān)注的趨勢,。
一,、AI技術(shù)+翻譯的平衡點,,人機共譯成為趨勢
前有能聊天、能撰稿,、能翻譯,、輔助創(chuàng)作的先進生產(chǎn)力工具ChatGPT、文心一言,,后有微軟,、谷歌將大型語言模型集成至辦公全家桶,內(nèi)容創(chuàng)作工作者的工作方式正在被重塑,。這也讓很多打工人發(fā)出疑問,,“未來,我的工作會不會被AI替代,?”,。
與此同時,機器翻譯技術(shù)的進步一直與翻譯人員是否會被取代如影隨形,,毋庸置疑,,隨著技術(shù)的進步,機器翻譯的效果會越來越趨向于專業(yè)人士翻譯的高質(zhì)量內(nèi)容,,但與專業(yè)的翻譯人員相比,,在短期內(nèi)這種差距不會消失。
在這一背景下,,一個關(guān)鍵問題擺在翻譯行業(yè)面前,,機器翻譯和純?nèi)斯しg的模式應(yīng)該如何共存?回答這個問題,,我們需要從目前這兩種翻譯模式的優(yōu)缺點說起,。
純?nèi)斯しg的優(yōu)勢在于翻譯的流暢度、還原度都有較高保障,,但相比于“以秒為單位速出結(jié)果”的機器翻譯來說,,人工翻譯的時間成本更高,再加上前沿技術(shù)的發(fā)展誕生了越來越多的各行各業(yè)專業(yè)名詞,,翻譯人員的學(xué)習(xí)壓力也進一步加重,。
因此,機器翻譯技術(shù)的極速發(fā)展給人工翻譯帶來了一定緊迫感,。
另一方面,,機器翻譯除耗時短外,還能通過模型自學(xué)習(xí)涵蓋不同行業(yè)的專業(yè)知識,,對于新信息的接收速度更快,。不過,人們對于機器翻譯的不信任感仍然存在,且有大量實際研究證明,,機器翻譯對于語言中的情感理解,、文字組織能力都有一定欠缺,。
綜合來看,,純?nèi)斯しg與機器翻譯可以實現(xiàn)優(yōu)勢互補,人機共譯的新翻譯模式應(yīng)運而生,。
這種翻譯模式的出現(xiàn),,不僅革新了翻譯人員的工作模式,也給翻譯行業(yè)提出了新的注解,,其在機器翻譯與人工翻譯之間找到了一個更好的平衡點,,合理運用前沿技術(shù)的基礎(chǔ)上保證翻譯的質(zhì)量。
由此可見,,諸如機器翻譯等前沿技術(shù)的發(fā)展并不是一定要顛覆整個翻譯行業(yè),,而是轉(zhuǎn)變成輔助人工的生產(chǎn)力工具,作為一種能有效提升人工效率的存在,。
二,、百度智能文檔翻譯平臺化身先進生產(chǎn)力工具
翻譯行業(yè)從業(yè)者工作模式的變革,必然伴隨著工具的進一步革新,。
以此次大賽為例,,百度翻譯為大賽提供翻譯技術(shù)和比賽平臺支持,參賽選手采用百度智能文檔翻譯平臺提供的技術(shù)和服務(wù),,這一平臺是以機器翻譯為核心的新一代智能自學(xué)習(xí)文檔翻譯平臺,,可謂是人機共譯工作范式下的工具集大成者。
首屆全國翻譯技術(shù)大賽官網(wǎng)-百度智能文檔翻譯平臺
人機共譯模式下,,翻譯人員做的工作更像是成為機器翻譯文本的編輯,,因此,人機共譯模式不僅要考察機器翻譯能力,,更為重要的是人與機器的協(xié)作是否流暢,、便捷。
1,、囊括4萬+個翻譯方向,,能化身各行業(yè)“翻譯專家”
百度智能文檔翻譯平臺支持全球200多個語言互譯、超4萬個翻譯方向,,并且擁有學(xué)術(shù),、新聞、生物醫(yī)藥,、金融財經(jīng)等多個專業(yè)領(lǐng)域翻譯模型,,使得翻譯效率提升100% ,在專業(yè)領(lǐng)域該平臺的翻譯準確率超過90%。
當(dāng)在翻譯平臺上傳關(guān)于學(xué)術(shù)期刊和機器人研究的相關(guān)文章時,,百度智能文檔翻譯平臺的翻譯速度并沒有受到文章翻譯類型等影響,。在描述“軟體機器人模擬毛蟲運動方式”時,其文字部分使用短句將英文中的長句分開,,更符合中文的閱讀習(xí)慣,。
上為“機器人”相關(guān)PDF文件,下為“學(xué)術(shù)論文”研究相關(guān)Word文件
2,、支持多類型文檔上傳,,支持實時編輯+格式一比一對應(yīng)
該平臺對于上傳的文檔限制較小,支持Word,、Excel,、PPT、PDF等多種格式文檔,。
進入翻譯工作臺后,,該平臺會為用戶提供整頁預(yù)覽和逐句對照兩種模式,右上角會有編輯譯文與導(dǎo)出按鈕,,方便翻譯人員對其中部分措詞進行修改,、完善。
并且對于PDF版本的學(xué)術(shù)論文,,其譯文界面還會完全對照原文的格式,。
3、6大一級領(lǐng)域+40個二級領(lǐng)域,,權(quán)威高效的專業(yè)術(shù)語
還有一點與其他翻譯工具不同的是,,這一平臺內(nèi)置了百度翻譯術(shù)語庫和全國名詞委術(shù)語庫。在提交文檔界面,,該平臺會為用戶提供“術(shù)語提示”功能,,其中包含工程科學(xué)、基礎(chǔ)科學(xué),、生物醫(yī)藥等6個一級領(lǐng)域及40個二級領(lǐng)域,,基本覆蓋有翻譯需求的不同行業(yè)。
翻譯人員遇到更為前沿的學(xué)科內(nèi)容或不熟悉的技術(shù)領(lǐng)域時,,這一工具可以為翻譯人員提供相關(guān)參考,,省去翻譯人員額外檢索查證的時間。
即使前期沒有選擇相應(yīng)“術(shù)語參考”領(lǐng)域,,智能文檔翻譯平臺也會根據(jù)用戶劃詞的內(nèi)容去定位相應(yīng)行業(yè),。
4、機翻+譯后+自學(xué)習(xí),,翻譯助手“專業(yè)性”漸趨人類
如一些專有名詞通常在論文中會有英語簡寫表述,,但很多情況下這些專有名詞在不同行業(yè)中的意義完全不同,。以GPT這個詞為例,在AI領(lǐng)域其意義是文本生成模型,,而在醫(yī)藥領(lǐng)域GPT是谷丙轉(zhuǎn)氨酶,。
比如,如果翻譯人員有特定研究領(lǐng)域,,且相關(guān)專有名詞有一定的重復(fù)性,,在編輯譯文的過程中,智能文檔翻譯平臺還會根據(jù)用戶修改的譯文進行自學(xué)習(xí),,并在之后的翻譯文件中優(yōu)化翻譯結(jié)果,,使得機器翻譯的結(jié)果與理想譯文不斷趨近,。
綜上所述,,百度智能文檔翻譯平臺將機器翻譯(MT)、譯后編輯(PE),、模型自學(xué)習(xí)納入其翻譯體系,,能夠大幅提升人機共譯模式的工作效率及效果。
百度智能文檔翻譯平臺與人工翻譯,、機器翻譯兩種模式的契合,,使其成為人機共譯時代的“重量級”先進生產(chǎn)力工具。
三,、十余年AI全棧技術(shù)布局,,深度學(xué)習(xí)、大模型提升機翻流暢,、準確度
從更宏觀的角度來看,,機器翻譯概念誕生至今已經(jīng)超過70個年頭,隨著深度學(xué)習(xí)及大模型技術(shù)的發(fā)展,,這一技術(shù)的產(chǎn)業(yè)化格局正在被重塑,。
此次2023中國翻譯協(xié)會年會4月4日的翻譯技術(shù)主題論壇上,百度翻譯還將聯(lián)合中國外文局翻譯院,、中國翻譯協(xié)會翻譯技術(shù)委員會共同發(fā)布《2023機器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍皮書》,。
《2023機器翻譯技術(shù)及產(chǎn)業(yè)應(yīng)用藍皮書》
技術(shù)的發(fā)展正在為翻譯行業(yè)注入新鮮血液,隨著機器翻譯技術(shù)的不斷變革,,主流機器翻譯方法也在不斷迭代,。在深度學(xué)習(xí)技術(shù)發(fā)展的背景下,能模擬人類翻譯過程的神經(jīng)網(wǎng)絡(luò)機器翻譯出現(xiàn),,2015年百度發(fā)布全球首個互聯(lián)網(wǎng)神經(jīng)網(wǎng)絡(luò)機器翻譯系統(tǒng),,使得翻譯效果在語言表示、語義理解和譯文生成等方面都有顯著提升,。
面向未來,,正如藍皮書所說,,以ChatGPT、文心一言(ERNIE Bot)為代表的新一代預(yù)訓(xùn)練模型技術(shù)在語言理解與生成,,特別是低資源,、長篇章以及多模態(tài)的場景應(yīng)用中表現(xiàn)出強大能力和發(fā)展?jié)摿Γc人的互動性和反饋學(xué)習(xí)能力不斷增強,。
因此,,機器翻譯在當(dāng)下已經(jīng)呈現(xiàn)出強大的產(chǎn)業(yè)化生命力。該技術(shù)在企業(yè)智能化升級,、行業(yè)數(shù)字化建設(shè)等場景中的應(yīng)用正在不斷普及,。以中石化全球戰(zhàn)略為例,百度企業(yè)級智能翻譯平臺可以支持其全球化戰(zhàn)略的龐大翻譯需求,。
百度智能文檔翻譯平臺應(yīng)用場景示意
這背后,,離不開百度在深度學(xué)習(xí)與機器翻譯領(lǐng)域的前瞻布局。
追溯至2010年,,彼時深度學(xué)習(xí)仍處于發(fā)展初期,,百度就已經(jīng)開始布局深度學(xué)習(xí),并于3年后建立全世界首個深度學(xué)習(xí)研究院(IDL),。今年2月,,全球市場調(diào)研機構(gòu)IDC發(fā)布的數(shù)據(jù)顯示,2022年下半年,,百度已經(jīng)穩(wěn)居中國深度學(xué)習(xí)平臺市場綜合份額第一,。
在機器翻譯領(lǐng)域,百度十余年來在多語言機器翻譯,、神經(jīng)網(wǎng)絡(luò)機器翻譯,、跨模態(tài)機器翻譯等方面持續(xù)突破。目前,,百度翻譯已形成核心技術(shù)領(lǐng)先,、產(chǎn)品矩陣豐富、產(chǎn)業(yè)應(yīng)用廣泛的發(fā)展生態(tài),。
當(dāng)下,,大模型和生成式AI時代的到來,正在為機器翻譯留下新的注解,。
與此同時,,機器翻譯的技術(shù)變革帶來的應(yīng)用擴展,也為翻譯人員提出了更高的要求,??梢钥闯觯把丶夹g(shù)的突破是不可逆轉(zhuǎn)的發(fā)展趨勢,,作為翻譯工作者如何在當(dāng)下?lián)肀把丶夹g(shù),,找到平衡點,,是置身于行業(yè)中的工作人員與掌握前沿科技的科技大廠都需要關(guān)注的事情。
結(jié)語:機器翻譯技術(shù),、應(yīng)用大飛躍,,為翻譯行業(yè)開辟新賽道
人機共譯已經(jīng)成為當(dāng)下翻譯行業(yè)從業(yè)者的趨勢,隨著機器翻譯在翻譯質(zhì)量,、系統(tǒng)性能,、實用性、規(guī)?;瘧?yīng)用等方面均取得了較大飛躍,,與人工翻譯的契合度越來越高。
與此同時,,技術(shù)的發(fā)展與進階中,,勢必會對各行各業(yè)產(chǎn)生影響,這一背景下,,翻譯工作者更快擁抱前沿技術(shù),,并將其化身為真正的生產(chǎn)力工具才能在前沿技術(shù)發(fā)展的浪潮中站穩(wěn)腳跟,。
隨便看看:
- [數(shù)據(jù)]尾號6666出租車溜車墜河 因數(shù)字巧合 網(wǎng)評:建議無償轉(zhuǎn)讓給
- [數(shù)據(jù)]基于昇騰 AI 的遙感大模型走進金融,,為金融產(chǎn)業(yè)升級提供新動
- [數(shù)據(jù)]英特爾推出i9-14900KS處理器 創(chuàng)紀錄的6.2 GHz
- [數(shù)據(jù)]寶存科技企業(yè)級固態(tài)硬盤滿足小微企業(yè)私有云存儲需求
- [數(shù)據(jù)]一個頗具實踐意義的專利失效了
- [數(shù)據(jù)]英偉達將在即將到來的GTC大會上推出新一代人工智能芯片
- [數(shù)據(jù)]MAINGARE宣布推出ZERO系列游戲電腦 售價1399美
- [數(shù)據(jù)]對標拼多多,?淘寶將上線99特賣頻道 首頁顯眼展示
- [數(shù)據(jù)]新作RPG《Terra Memoria》開放Steam試玩
- [數(shù)據(jù)]特斯拉今年內(nèi)累跌近35% 貶值速度比瑪莎拉蒂還要快
相關(guān)推薦:
網(wǎng)友評論:
推薦使用友言、多說,、暢言(需備案后使用)等社會化評論插件
- 拓維海云天智能考試新品重磅發(fā)布,,引領(lǐng)考試國產(chǎn)化與數(shù)
- 阿爾西加大研發(fā)力度,加速半導(dǎo)體的“國產(chǎn)化”發(fā)展之路
- 元宇宙中如何修復(fù)數(shù)字文物?
- 探索長尾詞工具,,解鎖SEO秘訣,!
- 抖音本地新年營銷玩法攻略,助力本地生意開個好頭
- 企云方全面預(yù)算系統(tǒng):財務(wù)智能引領(lǐng)企業(yè)戰(zhàn)略規(guī)劃
- 【智齒科技】AI Agent實現(xiàn)全程自動應(yīng)答,,生成
- 簡化大模型訓(xùn)推全流程,,天翼云息壤即將重磅升級!
- 全球開源極客嘉年華GOGC2024盛大啟幕,,首日看
- 講真短影交流會:點燃短視頻創(chuàng)新之火