發(fā)展人工智能 廣東還要加點“料”
“當下,,人工智能發(fā)展首先需要攻克的是數據量不足的問題,?!比涨芭e行的2023大灣區(qū)科學論壇上,中國工程院院士,、鵬城實驗室主任高文直言,雖然企業(yè)可通過公開渠道相對容易地購買數據,,但“仍不解渴”,。
如果把發(fā)展人工智能比喻成烹飪,我們不僅在算力大模型這個動力端上差點“火候”,,還要加點“料”,,即數據。“人工智能的競爭,,本質上是數據創(chuàng)造權,、數據所有權的競爭?!毕愀劭萍即髮W(廣州)協理副校長熊輝說,。
廣東有著完備的制造業(yè)體系,多年來沉淀了海量的制造業(yè)數據,。同時,,作為數字經濟大省,廣東擁有的數據量也位居全國之首,。如何借助人工智能技術挖點“好料”,,做出數據的“好菜”,讓資源越用越多,、越用越好,,是廣東發(fā)展人工智能產業(yè)的重要課題。
藍海待挖
隨著ChatGPT的火爆,,未來有可能會導致一部分人員的失業(yè),,但同時也會孕育出一批新職業(yè)。目前其中最吸人眼球的,,就是被稱為“AI喂養(yǎng)員”的數據標注員,。
給AI喂數據成了專業(yè)工作。這也從側面反映出,,在AI時代,,數據擁有的重要價值。
5月23日,,國家互聯網信息辦公室發(fā)布的《數字中國發(fā)展報告(2022年)》顯示,,2022年我國數據產量達8.1ZB,同比增長22.7%,,全球占比達10.5%,,位居世界第二。
“海量的數據正在改變現有的商業(yè)模式,?!贝髷祿<摇⒖萍甲骷彝孔优媾e例說,,微信每日步數成為保險公司保費定價參考,,步數多的人保費可能更低?!皵祿蔀槲覀兊耐ㄐ姓Z言,,每一家企業(yè)都會變成數據公司,。”
對于工業(yè)大省廣東來說,,其制造業(yè)體系豐富,,沉淀了海量的制造業(yè)數據。這些貫穿在生產,、設計,、營銷等全鏈條的數據,在人工智能技術的加持下,,正在為制造業(yè)發(fā)展注入更大動能,、打開更大空間。
用AI“提煉”數據,,可以讓數據變成資本,。近日,在廣州數據交易所,,廣州首個公共數據運營產品“企業(yè)經營健康指數”順利完成交易,。通過人工智能手段,用經營數據給企業(yè)畫像,,以數據資產化作為新型融資方式,,將破解中小企業(yè)融資難問題。截至當前,,廣州數據交易所累計交易金額突破10億元,。
數據價值的不斷挖掘,也在反向催生如何獲取更多有用數據的市場需求,。在深圳數據交易所,,可信數據空間技術正式實現國產商業(yè)化落地,實現了“數據為我所用,,但不一定為我所有”,,直擊行業(yè)痛點。
該技術通過人工智能隱私計算等方式,,可實現消費電子產品、新能源鋰電池等生產全過程質量數據的可信共享,,打消企業(yè)數據流通的顧慮,。
“該技術未來還可以進一步擴展到制造業(yè)、物流等泛工業(yè)行業(yè),,服務于企業(yè)研發(fā),、生產、銷售,、供應,、物流等全過程,提升產業(yè)鏈競爭力?!鄙钲跀祿灰姿麻L李紅光說,。
在廣東數字政府研究院副院長傅建平看來,廣東擁有中國制造業(yè)全部31個國民經濟行業(yè)大類,,其中15個大類的規(guī)模更是居全國之首,。挖掘利用好海量的制造業(yè)數據,可以推動傳統(tǒng)制造業(yè)智能化升級,,支撐構建虛擬產業(yè)集群,,催生新產品、新模式,、新業(yè)態(tài),,加快制造業(yè)與服務業(yè)深度融合,推動人工智能產業(yè)加快發(fā)展,。
仍不解渴
豐富的數據,,就如同待開采的金礦,但如何“掘金”仍是一個問題,。
“數據之于AI大模型就像原油之于汽車,,汽車是無法直接使用原油的,原油要經過一系列復雜的煉化過程,?!冰i城實驗室云腦使能研究所所長張偉說。
同樣的,,海量原始數據需要經過“煉化”構建成數據集,,才能真正有效地提供給AI大模型訓練。
“國內數據流通存在供給不足的問題,,尤其是高質量數據不足,,限制了國內AI大模型發(fā)展?!崩罴t光注意到,,國內大模型語音聊天機器人在表達上,中文反饋結果往往不如英文準確,,除了中文更難理解,、搜索難度更大之外,一個關鍵因素是數據支撐不足,。
如何獲取量足,、質優(yōu)的數據,成為人工智能產業(yè)向前發(fā)展繞不開的問題,。
“數據分散在不同的地方,,碎片化比較嚴重,。同時,沒有經過整理的數據,,存在字段缺失,、信息不準等問題,影響了數據價值的發(fā)揮,?!崩罴t光說。
但是,,如果數據類型太過豐富,,也會進一步分散數據價值。興森科技PCB事業(yè)部(廣州)總經理杜子良說,,除了文本等結構化數據,,工廠還經常留存圖像、音頻,、視頻等多樣的非結構化數據,,處理起來更加困難。隨著業(yè)務擴張,,這家企業(yè)在深圳,、江蘇宜興等地新建了多個生產基地,這些生產基地之間也面臨數據資源高效共享,、協同,、流動的挑戰(zhàn)。
“數據挖掘的痛點是‘孤島效應’突出,,難點是數據利用和保護機制不健全,。”琶洲實驗室戰(zhàn)略研究中心林韜杰博士說,。
在實踐過程中,,還有許多企業(yè)仍未建立數據采集能力。樹根互聯聯合創(chuàng)始人,、CEO賀東東舉例說,,比如將機器等“啞設備”用傳感器連接,采集數據后還要傳輸和存儲,、建模分析,,才能將數據變成資產,“但這么做成本高昂”,。
釋放潛能
“數據應該和廣東優(yōu)勢產業(yè)尤其是制造業(yè)深度融合,才能最大限度激活要素潛力,,并助力產業(yè)轉型升級,?!备到ㄆ浇ㄗh,廣東可從盤活數據資源,、挖掘數據價值,、釋放數據潛能三個方向對數據要素進行突破。
所謂“見多才能識廣”,,AI的迭代同樣來自“見多識廣之后的沉淀和創(chuàng)造力”,。數據的治理、算法的進步,,需要大量結構化標注數據,,并對模型進行訓練、調優(yōu),。
“過去很多企業(yè)的數據被白白浪費掉了,,但現在通過傳感器即可采集和挖掘數據,再借助基于機器的人工智能算法,,不斷優(yōu)化生產和營銷,。”賀東東說,,數據已經成為智能決策的依據,,未來也將取代傳統(tǒng)廠房、設備,,成為企業(yè)最有價值的要素,。
如今,廣東正分門別類推動傳統(tǒng)產業(yè)轉型升級,,并為此出臺了專門的轉型指引,,“手把手”指導企業(yè)數字化轉型。
今年4月,,廣東省工信廳印發(fā)的《廣東省紡織服裝行業(yè)數字化轉型指引》和《廣東省家具行業(yè)企業(yè)數字化轉型指引》提出,,推動大數據挖掘應用邁上新臺階。
比如,,在紡織服裝行業(yè),,充分挖掘廣州、深圳,、上海等紡織服裝展會數據資源,,為招展、招商,、服務和制定行業(yè)政策提供支撐,。
在家具行業(yè),加強與家具賣場,、經銷商,、電商平臺深度合作,,用好用足各類平臺數據銀行,分析挖掘消費者群體畫像,,孵化培育熱銷產品,,打造具有特色和影響力的消費新品牌。
賽迪顧問廣州分公司總經理賈紡紡認為,,在此基礎上,,還要大力培育一批同時掌握行業(yè)和技術知識的制造業(yè)數字化轉型領域復合型人才,滿足行業(yè)發(fā)展對高素質人才的迫切需求,,以數字化轉型助力廣東傳統(tǒng)產業(yè)轉型升級,,提高廣東制造業(yè)核心競爭力。
需求和機遇往往伴隨著行業(yè)痛點誕生,,不少企業(yè)已經“嗅”到了商機,,開始借助廣東海量的數據資源,研發(fā)高質量挖掘數據的系統(tǒng)平臺,。
比如,,數據標注企業(yè)云測數據,目前就在華南設有數據交付中心和數據采集基地,。在智能駕駛,、智能制造等場景中,其自主研發(fā)的數據標注平臺,,可幫助企業(yè)快速獲取高質量數據,,教會人工智能如何識別行人、車輛,、交通標識等,。
“針對數據分析難的問題,通過AI大模型自動識別并建模分析,,可幫助企業(yè)快速提煉數據價值,。”就在上周,,云從科技在廣州宣布“從容”大模型亮相,。該公司戰(zhàn)略部總監(jiān)馬磊說,大模型在制造業(yè)領域將大有“用武之地”,。
南方日報記者 郜小平 昌道勵 李赫
隨便看看:
- [國內]國務院國資委原副部長級干部駱玉林接受中央紀委國家監(jiān)委審查調查
- [國內]我國鹽堿地綜合利用取得積極進展
- [國內]閑魚有網店兜售“三寸金蓮”纏足專用襪299元/雙,網友震怒:
- [國內]內蒙古著力建設高質量教育體系
- [國內]北京市事業(yè)單位首次組團定向招聘殘疾人
- [國內]天天新增科創(chuàng)主體!杭州這條“大走廊”何以動力十足
- [國內]鋼鐵行業(yè)“寒冬”持續(xù) 并購重組有助于行業(yè)秩序改善
- [國內]夏收拉開序幕 機械化助力農業(yè)生產降本增效
- [國內]河南安陽市在深圳舉辦2023年粵港澳大灣區(qū)招商引智推介大會
- [國內]甘肅省“十四五”首個新建能源項目建成投運
網友評論:
推薦使用友言,、多說,、暢言(需備案后使用)等社會化評論插件