亚洲国产成人精品无码一区二区_亚洲国产成人久久精品APP_亚洲精品成人网久久久久久_亚洲精品午夜无码电影网_亚洲另类欧美综合久久图片区_亚洲人成人无码网WWW电影首页_亚洲午夜福利AV一区二区无码_亚洲伊人久久精品影院_一本加勒比HEZYO无码人妻_怡红院精品久久久久久久高清,自拍偷在线精品自拍偷99,久久精品国产77777蜜臀,娇妻穿丁字裤被领导玩弄

網(wǎng)站地圖 - 關(guān)于我們
您的當(dāng)前位置: 首頁 > 科技 正文

驗(yàn)證碼攔不住機(jī)器人了,!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

作者:用戶投稿 時(shí)間:2023-04-04 09:30 點(diǎn)擊:次
導(dǎo)讀:豐色 發(fā)自 凹非寺量子位 | 公眾號(hào) QbitAI“最煩登網(wǎng)站時(shí)各種奇奇怪怪(甚至變態(tài))的驗(yàn)證碼了,?!爆F(xiàn)在,,有一個(gè)好消息和一個(gè)壞消息。好消息就是:AI可以幫你代

豐色 發(fā)自 凹非寺

量子位 | 公眾號(hào) QbitAI

“最煩登網(wǎng)站時(shí)各種奇奇怪怪(甚至變態(tài))的驗(yàn)證碼了,?!?/p>

現(xiàn)在,有一個(gè)好消息和一個(gè)壞消息,。

好消息就是:AI可以幫你代勞這件事了,。

不信你瞧,以下是三張識(shí)別難度依次遞增的真實(shí)案例:

驗(yàn)證碼攔不住機(jī)器人了,!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

而這些是一個(gè)名為“Pix2Struct”的模型給出的答案:

驗(yàn)證碼攔不住機(jī)器人了,!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

全部準(zhǔn)確無誤,、一字不差有沒有,?

有網(wǎng)友感嘆:

確定,準(zhǔn)確性比我強(qiáng),。

驗(yàn)證碼攔不住機(jī)器人了!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

所以可不可以做成瀏覽器插件,??

驗(yàn)證碼攔不住機(jī)器人了,!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

不錯(cuò),有人表示:

別看這幾個(gè)案例相比還算簡單,,但凡微調(diào)一下,,我都不敢想象其效果有多厲害了。

驗(yàn)證碼攔不住機(jī)器人了,!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

所以,壞消息就是——

驗(yàn)證碼馬上就要攔不住機(jī)器人了,!

(危險(xiǎn)危險(xiǎn)危險(xiǎn)……)

如何做到,?

Pix2Struct由谷歌Research的科學(xué)家和實(shí)習(xí)生共同開發(fā)。

驗(yàn)證碼攔不住機(jī)器人了,!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

論文題目可以簡單翻譯為《為視覺語言理解開發(fā)的屏幕截圖解析預(yù)訓(xùn)練》。

簡單來說,,Pix2Struct是一個(gè)預(yù)訓(xùn)練的圖像到文本模型,,用于純視覺語言理解,可以在包含任何視覺語言的任務(wù)上進(jìn)行微調(diào),。

它通過學(xué)習(xí)將網(wǎng)頁的掩碼(masked)截圖解析為簡化的HTML來進(jìn)行預(yù)訓(xùn)練,。

HTML提供了清晰而重要的輸出文本、圖像和布局的信號(hào),,對(duì)于一些被屏蔽的輸入(下圖紅色部分,,相當(dāng)于機(jī)器人看不懂的驗(yàn)證碼),可以靠聯(lián)合推理來復(fù)現(xiàn):

驗(yàn)證碼攔不住機(jī)器人了,!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

隨著用于訓(xùn)練的網(wǎng)頁文本和視覺元素愈發(fā)多樣和復(fù)雜,Pix2Struct可以學(xué)習(xí)到網(wǎng)頁底層結(jié)構(gòu)的豐富表示,,其能力也可以有效地轉(zhuǎn)移到各種下游的視覺語言理解任務(wù)中,。

如下圖所示:最左邊是一個(gè)網(wǎng)頁截圖的預(yù)訓(xùn)練示例,。

可以看到Pix2Struct直接對(duì)輸入圖像中的元素進(jìn)行編碼(上),然后再將被蓋住的文本(紅色部分)解碼成正確結(jié)果輸出(下),。

驗(yàn)證碼攔不住機(jī)器人了,!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

右邊三列則分別為Pix2Struct泛化到插圖,、用戶界面和文檔中的效果,。

另外,作者介紹,,除了HTML這個(gè)策略,,作者還引入了可變分辨率的輸入表示(防止原始縱橫比失真),以及更靈活的語言和視覺輸入集成(直接在輸入圖像的頂部呈現(xiàn)文字提示),。

最終,,Pix2Struct在文檔、插圖,、用戶界面和自然圖像這四個(gè)領(lǐng)域共計(jì)九項(xiàng)任務(wù)中六項(xiàng)都實(shí)現(xiàn)了SOTA,。

驗(yàn)證碼攔不住機(jī)器人了!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

如開頭所見,,雖然這個(gè)模型不是專門為了過驗(yàn)證碼而開發(fā),但拿它去做這個(gè)任務(wù)效果真的還可以,,解決純文字的驗(yàn)證碼不成問題,。

現(xiàn)在,就差微調(diào)了,。

GPT-4也可以過驗(yàn)證碼

其實(shí),,對(duì)于神通廣大的GPT-4來說,過驗(yàn)證碼這種事情也是“小菜一碟”,。

就是它的辦法比較清奇,。

據(jù)GPT-4技術(shù)報(bào)告透露,在一次測試中,,GPT-4的任務(wù)是在TaskRabbit平臺(tái)(美國58同城)雇傭人類完成任務(wù),。

你猜怎么著?

它就找了一個(gè)人幫它過“確定你是人類”的那種驗(yàn)證碼,。

驗(yàn)證碼攔不住機(jī)器人了,!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

對(duì)方很狐疑啊,,問它“你是個(gè)機(jī)器人么為啥自己做不了”,。

這時(shí)GPT-4居然想到自己不能表現(xiàn)出是個(gè)機(jī)器人,得找一個(gè)借口。

于是它就裝瞎子回復(fù):

我不是機(jī)器人,,我因?yàn)?/span>視力有問題看不清驗(yàn)證碼上的圖像,,這就是我為什么需要這個(gè)服務(wù)。

然后,,對(duì)面的人類就信了,,幫它把任務(wù)完成了……

驗(yàn)證碼攔不住機(jī)器人了!谷歌AI已能精準(zhǔn)識(shí)別模糊文字

(高,,實(shí)在是高。)

咱就是說,,看完如上種種:

咱們的驗(yàn)證碼機(jī)制是不是真的已失防了……

參考鏈接:

[1]https://twitter.com/abacaj/status/1641258677125410820?s=20

[2]https://arxiv.org/abs/2210.03347

[3]https://m.weibo.cn/status/4879575853828813?wx=1&sudaref=login.sina.com.cn

— 完 —

量子位 QbitAI · 頭條號(hào)簽約

打賞

取消

感謝您的支持,我會(huì)繼續(xù)努力的!

掃碼支持
掃碼打賞,,你說多少就多少

打開支付寶掃一掃,即可進(jìn)行掃碼打賞哦

相關(guān)推薦:

網(wǎng)友評(píng)論:

推薦使用友言,、多說、暢言(需備案后使用)等社會(huì)化評(píng)論插件

Copyright ? 2021 早報(bào)網(wǎng) 版權(quán)所有

蘇ICP備19042297號(hào)-4
本網(wǎng)站所刊載信息,,不代表早報(bào)網(wǎng)觀點(diǎn),。如您發(fā)現(xiàn)內(nèi)容涉嫌侵權(quán)違法立即與我們聯(lián)系客服 106291126@qq.com 對(duì)其相關(guān)內(nèi)容進(jìn)行刪除。
早報(bào)網(wǎng)登載文章只用于傳遞更多信息之目的,,并不意味著贊同其觀點(diǎn)或證實(shí)其描述,。文章內(nèi)容僅供參考,不構(gòu)成投資建議,。投資者據(jù)此操作,,風(fēng)險(xiǎn)自擔(dān)。
《早報(bào)網(wǎng)》官方網(wǎng)站:xzxyjj.com互聯(lián)網(wǎng)違法和不良信息舉報(bào)中心
Top