亚洲国产成人精品无码一区二区_亚洲国产成人久久精品APP_亚洲精品成人网久久久久久_亚洲精品午夜无码电影网_亚洲另类欧美综合久久图片区_亚洲人成人无码网WWW电影首页_亚洲午夜福利AV一区二区无码_亚洲伊人久久精品影院_一本加勒比HEZYO无码人妻_怡红院精品久久久久久久高清,自拍偷在线精品自拍偷99,久久精品国产77777蜜臀,娇妻穿丁字裤被领导玩弄

網(wǎng)站地圖 - 關(guān)于我們
您的當(dāng)前位置: 首頁 > 資訊 > 資訊 正文

趣丸科技聯(lián)合港中大(深圳)開源首個(gè)語音大模型,,效果全球領(lǐng)先躋身第一梯隊(duì)

作者:網(wǎng)絡(luò) 時(shí)間:2024-10-25 10:57 點(diǎn)擊:次
導(dǎo)讀:10月24日,,趣丸科技宣布與香港中文大學(xué)(深圳)聯(lián)合研發(fā)的語音大模型“MaskGCT”正式開源,,面向全球用戶開放使用,。區(qū)別于傳統(tǒng)TTS模型,該模型采用掩碼生成模

10月24日,,趣丸科技宣布與香港中文大學(xué)(深圳)聯(lián)合研發(fā)的語音大模型“MaskGCT”正式開源,,面向全球用戶開放使用。區(qū)別于傳統(tǒng)TTS模型,,該模型采用掩碼生成模型與語音表征解耦編碼的創(chuàng)新范式,,在聲音克隆、跨語種合成,、語音控制等任務(wù)中展現(xiàn)出卓越效果,。

趣丸科技聯(lián)合港中大(深圳)開源首個(gè)語音大模型,,效果全球領(lǐng)先躋身第一梯隊(duì)(圖1)

據(jù)介紹,MaskGCT在三個(gè)TTS基準(zhǔn)數(shù)據(jù)集上都達(dá)到了SOTA效果,,超過當(dāng)前最先進(jìn)的同類模型,,某些指標(biāo)甚至超過人類水平。顯著特點(diǎn)如下:

1,、秒級(jí)超逼真的聲音克?。?/strong>提供3秒音頻樣本即可復(fù)刻人類、動(dòng)漫,、“耳邊細(xì)語”等任意音色,,且能完整復(fù)刻語調(diào)、風(fēng)格和情感,。

2,、更精細(xì)可控的語音生成:可靈活調(diào)整生成語音的長(zhǎng)度、語速和情緒,,支持通過編輯文本編輯語音,,并保持韻律、音色等方面的極度一致,。

3,、高質(zhì)量多語種語音數(shù)據(jù)集:訓(xùn)練于香港中文大學(xué)(深圳)和趣丸科技等機(jī)構(gòu)聯(lián)合推出的10萬小時(shí)數(shù)據(jù)集Emilia,是全球最大且最為多樣的高質(zhì)量多語種語音數(shù)據(jù)集之一,,精通中英日韓法德6種語言的跨語種合成,。

趣丸科技聯(lián)合港中大(深圳)開源首個(gè)語音大模型,效果全球領(lǐng)先躋身第一梯隊(duì)(圖2)

據(jù)介紹,,MaskGCT(Masked Generative Codec Transformer)是一個(gè)大規(guī)模的零樣本TTS模型,,采用非自回歸掩碼生成Transformer,無需文本與語音的對(duì)齊監(jiān)督和音素級(jí)持續(xù)時(shí)間預(yù)測(cè),。其技術(shù)突破性在于采用掩碼生成模型與語音表征解耦編碼的創(chuàng)新范式,。實(shí)驗(yàn)表明,MaskGCT在語音質(zhì)量,、相似度和可理解性方面優(yōu)于當(dāng)前最先進(jìn)的TTS模型,,并且在模型規(guī)模和訓(xùn)練數(shù)據(jù)量增加時(shí)表現(xiàn)更佳,同時(shí)能夠控制生成語音的總時(shí)長(zhǎng),。MaskGCT已在香港中文大學(xué)(深圳)與上海人工智能實(shí)驗(yàn)室聯(lián)合開發(fā)的開源系統(tǒng)Amphion發(fā)布,。

該模型研發(fā)團(tuán)隊(duì)在語音領(lǐng)域擁有深厚的研究積累和原創(chuàng)性成果。這主要依托趣丸科技十年深耕音頻技術(shù)領(lǐng)域和億級(jí)高質(zhì)量語音用戶的服務(wù)經(jīng)驗(yàn),,以及香港中文大學(xué)(深圳)國際一流水平的師資隊(duì)伍,。早在今年5月份,趣丸科技就與香港中文大學(xué)(深圳)宣布共建聯(lián)合實(shí)驗(yàn)室,,針對(duì)人工智能音頻大模型相關(guān)的前沿課題進(jìn)行研究,,旨在突破行業(yè)難題,促進(jìn)產(chǎn)學(xué)研深度融合,,打造技術(shù)領(lǐng)先的生成式音頻大模型,,填補(bǔ)業(yè)界空白。

趣丸科技聯(lián)合港中大(深圳)開源首個(gè)語音大模型,,效果全球領(lǐng)先躋身第一梯隊(duì)(圖3)

目前,MaskGCT在短劇出海,、數(shù)字人,、智能助手、有聲讀物,、輔助教育等領(lǐng)域擁有豐富的應(yīng)用場(chǎng)景,。為了加快落地應(yīng)用,在安全合規(guī)下,,趣丸科技打造了多語種速譯智能視聽平臺(tái)“趣丸千音”,。一鍵上傳視頻即可快速翻譯成多語種版本,并實(shí)現(xiàn)字幕修復(fù)與翻譯,、語音翻譯,、唇音同步等功能。該產(chǎn)品進(jìn)一步革新視頻翻譯制作流程,大幅降低過往昂貴的人工翻譯成本和冗長(zhǎng)的制作周期,,成為影視,、游戲、短劇等內(nèi)容出海的理想選擇平臺(tái),。


打賞

取消

感謝您的支持,我會(huì)繼續(xù)努力的!

掃碼支持
掃碼打賞,,你說多少就多少

打開支付寶掃一掃,,即可進(jìn)行掃碼打賞哦

網(wǎng)友評(píng)論:

推薦使用友言,、多說,、暢言(需備案后使用)等社會(huì)化評(píng)論插件

Copyright ? 2021 早報(bào)網(wǎng) 版權(quán)所有

蘇ICP備19042297號(hào)-4
本網(wǎng)站所刊載信息,不代表早報(bào)網(wǎng)觀點(diǎn)。如您發(fā)現(xiàn)內(nèi)容涉嫌侵權(quán)違法立即與我們聯(lián)系客服 106291126@qq.com 對(duì)其相關(guān)內(nèi)容進(jìn)行刪除,。
早報(bào)網(wǎng)登載文章只用于傳遞更多信息之目的,,并不意味著贊同其觀點(diǎn)或證實(shí)其描述。文章內(nèi)容僅供參考,,不構(gòu)成投資建議,。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān),。
《早報(bào)網(wǎng)》官方網(wǎng)站:xzxyjj.com互聯(lián)網(wǎng)違法和不良信息舉報(bào)中心
Top