理光開發(fā)出高性能日語大語言模型
導讀:
新華社東京6月4日電(記者錢錚)日本理光公司日前表示,該公司利用和日本理化學研究所共同研發(fā)得到的指令數據訓練理光的日語大語言模型,,提高了模型的指令遵循性能,。
理光公司3日發(fā)布新聞公報說,他們用10329份指令數據對公司研發(fā)的130億參數日語大語言模型進行了指令調優(yōu),。與調優(yōu)前相比,,大語言模型的指令遵循性能得分從1.19分大幅提高至3.02分。
指令調優(yōu)是訓練大語言模型的一個過程,,主要為了縮小模型的下一個標記預測目標與用戶期望的模型遵循人類指令的目標之間差距,。
理光公司說,隨著老齡化和隨之而來的勞動人口減少,,許多企業(yè)寄希望于利用人工智能來提高生產效率,,實現高附加值的勞動方法。而要將人工智能應用于實際業(yè)務,,需要讓大語言模型追加學習包括企業(yè)所處行業(yè),、所經營業(yè)務,、以及企業(yè)固有用語等在內的大量數據。
相比英語國家圍繞大語言模型研發(fā)的競爭,,日語大語言模型的研發(fā)相對滯后,。這主要是因為日語的語法和表達與英語完全不同,以英語為基礎的模型難以充分發(fā)揮功能,,而研發(fā)適合日語的模型首先必須花時間研究日語的特征,。
大語言模型的研發(fā)還需要大量數據,而日語的數據遠少于英語,,品質和多樣性方面也存在問題,,日語數據的收集和完善需要大量時間和成本。大語言模型研發(fā)還需要很高的算力,,而日本超算和云等計算資源原本就不足,,能運用這些計算資源的技術和人才也不足。
隨便看看:
- [業(yè)內]全球新能源汽車進入全面市場化階段
- [業(yè)內]世界氣象組織報告:2011年至2020年是有記錄以來最熱十年
- [業(yè)內]對標華為:iPhone 15 Pro Max首載潛望式長焦#
- [業(yè)內]2022年我國研發(fā)經費投入突破3萬億元
- [業(yè)內]地球“健康指標”令人憂
- [業(yè)內]浙江出臺舉措支持生物醫(yī)藥產業(yè)創(chuàng)新發(fā)展
- [業(yè)內]科研人員揭示高蛋白食物的“減脂密碼”
- [業(yè)內]記者手記:看西部小城璧山如何破局數字產業(yè)化
- [業(yè)內]日本團隊在植物感知溫度機制研究上獲進展
- [業(yè)內]我國發(fā)現全球首個高山隕石坑
相關推薦:
網友評論:
推薦使用友言,、多說,、暢言(需備案后使用)等社會化評論插件
欄目分類
最新文章
熱門文章