騰訊多媒體實驗室 AIGC 能力助力數(shù)據萬象開啟智能剪輯大門
AIGC 正從效率、質量,、創(chuàng)意,、多樣性各方面革新內容生產流程,伴隨 firely,、midjourney 等現(xiàn)象級的產品出現(xiàn),,AIGC 將逐步廣泛服務于內容生產的各類場景與內容生產者,隨著 AIGC 在內容生產的需求場景不斷增加,,騰訊多媒體實驗室也在 AIGC 領域持續(xù)發(fā)力,,并通過數(shù)據萬象將能力成功應用到傳媒、社交,、文娛等多個行業(yè),,逐步夯實全場景內容生產力。
足球精彩集錦
數(shù)據萬象泛互與傳媒客戶擁有不小體量的體育視頻數(shù)據處理需求,,尤其是賽事期間,,足球賽事作為最受歡迎的體育賽事內容消費量一直居高不下,球迷對其內容的可觀賞性要求也頗高,,由于時長問題,,未經剪輯的足球比賽不能直接投放到體育新聞、短視頻等場景用于賽事宣傳,。為此,,騰訊多媒體實驗室基于自研的 AIGC 系列技術,通過騰訊云數(shù)據萬象產品為廣大客戶帶來足球比賽的智能剪輯能力,,在沒有人工剪輯參與的情況下自動生成賽事高光內容,。
技術介紹
數(shù)據方面,騰訊多媒體實驗室采集了 1200 多場具有代表性的足球賽事并標注了高精度的數(shù)據集,。數(shù)據集覆蓋各類著名聯(lián)賽和杯賽,累計 600 多個小時,。同時,,騰訊多媒體實驗室設置了 19 個關鍵事類別,針對每一段視頻準確標注出全部關鍵事件的起始點,、結束點和對應類別,。關鍵事件分布如下圖,基本可以反映真實比賽的數(shù)據分布,。
【數(shù)據集關鍵事件分布】
算法方面,,騰訊多媒體實驗室設計了一個基于智能拆條和進球檢測的多模態(tài)方案來完成智能剪輯,。
【多模態(tài)智能剪輯方案】
智能拆條模塊基于視頻的圖像序列和音頻信息,通過子任務抽取多模態(tài)特征,,再由事件檢測模型定位各類關鍵事件,。針對單幀圖像、音頻信息,、圖像序列,,騰訊多媒體實驗室基于事件標簽有監(jiān)督地訓練了三個特征提取器,用于提取圖片,、聲音,、動作等多模態(tài)特征。
事件檢測模型接受由時序卷積編碼再拼接的多模態(tài)融合特征作為輸入,,評估各個時刻屬于事件開始,、結束、過程的概率,,并由此構建候選區(qū)間和對應的時序特征,。候選區(qū)間評估階段利用時序特征評估對應區(qū)間與真實事件區(qū)間的交并比,進而實現(xiàn)事件定位,。最后結合子任務階段獲取的事件標簽以及后處理算法就可以得到準確的事件拆條結果,。
【事件檢測模型】
智能拆條的效果指標 mAP 達到了 82%,其中定位球和回放等事件的對應指標更是達到 90% 以上,。
【運動戰(zhàn)精彩集錦示例】
進球檢測模塊通過判斷比分變化情況來對進球事件作補充,。在上述方案中,進球事件的召回率并不高,,原因是騰訊多媒體實驗室并沒有充分利用視頻里的比分信息,,最直觀的解決辦法是利用比分信息幫助判斷當前的進球情況。在實際應用中,,進球檢測模塊針對視頻幀序列檢測出比分牌位置,,然后適當擴大邊緣后再做文字檢測獲取當前幀比分數(shù)位置,通過多幀聚類得到當前比賽的比分數(shù)位置,,最后利用文字識別技術獲得比分序列,,根據比分單邊遞增規(guī)則確認進球時刻。
【進球檢測模塊】
進球檢測模塊將進球事件的召回率提高到 96%,,提高了集錦的完整性和精彩程度,。
【進球精彩集錦示例】
在足球場景的智能剪輯方案中,騰訊多媒體實驗室還新增了球星識別模塊,,用于剪輯特定球星片段,。該模塊通過使用人臉檢測算法定位視頻中的所有人臉,然后使用人臉識別模型編碼人臉特征,,通過聚類算法得到相似人臉序列,,最后在球星人臉數(shù)據庫中查找與之匹配的球星,。目前騰訊多媒體實驗室的方案可識別 500 多位人氣球星。
現(xiàn)該功能已在數(shù)據萬象多個體育客戶案例中落地,,日均處理量持續(xù)攀升,,大幅提升數(shù)據萬象客戶賽事周邊后期生產速率。
影視精彩集錦
除了體育,,自研的智能剪輯還支持電視劇,、動漫等影視場景,可以根據用戶指定的人物,、動作,、情感、關鍵詞等信息自動生成所需集錦視頻,。
以人物向為例,,用戶只需要提供 2~3 張某個人物的照片,系統(tǒng)便可注冊對應人物,,剪輯時指定需要剪輯的角色(或列表)即可生成人物集錦,。再搭配音樂卡點,上熱門妥妥的,!
【人物向集錦】
線索集錦方面,,用戶可以根據劇情內容指定某個關鍵詞作為線索,系統(tǒng)將自動檢索劇集中與此相關的內容,,并生成關鍵詞集錦,,打造全網最清晰的故事線。
【線索詞集錦】
現(xiàn)該功能已獲得數(shù)據萬象體驗館,、智能工具箱,、控制臺中超高點擊率,吸引眾多用戶關注使用,,此場景能夠根據用戶需求靈活調整集錦所需關鍵動作,、人物等,歡迎各位用戶前往測試,。
未來,,騰訊多媒體實驗室將持續(xù)投入包括智能剪輯在內的 AIGC 核心能力建設,數(shù)據萬象負責人葉嘉梁表示道數(shù)據萬象將借助多媒體實驗室在底層 AI 算法多年的積累和建設,,結合自身對行業(yè)和業(yè)務的理解,,快速上線了能夠幫助客戶業(yè)務實現(xiàn)智能內容生產的能力,豐富的算法也讓業(yè)務具備更好的多樣性和靈活性,。您可以前往數(shù)據萬象進行相關能力體驗,,對存儲在對象存儲 COS 上的數(shù)據進行創(chuàng)作,。數(shù)據萬象將持續(xù)攜手多媒體實驗室為廣大客戶提供視頻自動剪輯,、智能作曲,、音樂評分等更多智能化服務,提升內容生產和創(chuàng)作效率,。
更多演示內容,,可參見公眾號“騰訊多媒體實驗室”。
隨便看看:
- [頭條]應季蔬菜大量上市 多種時令蔬菜價格出現(xiàn)季節(jié)性回落
- [頭條]中國駐英國大使:英方沒有資格、沒有權利對香港特區(qū)警方執(zhí)法行動
- [頭條]河南泌陽:產業(yè)帶就業(yè) 拓寬增收路
- [頭條]北京自然岸線保有率達69.5% 動物“交通”“補給”更便利
- [頭條]華為董事會換屆 孟晚舟4月起當值華為輪值董事長
- [頭條]我國糧食全產業(yè)鏈減損可節(jié)糧上千億斤
- [頭條]網紅城市“圈粉”無數(shù) 將“流量”變“留量”競爭力更足
- [頭條]商務部部長王文濤:把吸引外資放在更加重要的位置
- [頭條]星紀魅族集團與愛施德合作,,三年內開設 1000 + 體驗店
- [頭條]海上風電裝機并網容量穩(wěn)步提升 產業(yè)鏈企業(yè)樂觀看待市場前景
相關推薦:
網友評論:
推薦使用友言,、多說、暢言(需備案后使用)等社會化評論插件