驗證碼攔不住機器人了,!谷歌AI已能精準識別模糊文字
豐色 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
“最煩登網(wǎng)站時各種奇奇怪怪(甚至變態(tài))的驗證碼了,。”
現(xiàn)在,,有一個好消息和一個壞消息,。
好消息就是:AI可以幫你代勞這件事了。
不信你瞧,,以下是三張識別難度依次遞增的真實案例:

而這些是一個名為“Pix2Struct”的模型給出的答案:

全部準確無誤、一字不差有沒有,?
有網(wǎng)友感嘆:
確定,,準確性比我強。

所以可不可以做成瀏覽器插件,??

不錯,有人表示:
別看這幾個案例相比還算簡單,,但凡微調(diào)一下,,我都不敢想象其效果有多厲害了。

所以,壞消息就是——
驗證碼馬上就要攔不住機器人了,!
(危險危險危險……)
如何做到,?
Pix2Struct由谷歌Research的科學家和實習生共同開發(fā)。

論文題目可以簡單翻譯為《為視覺語言理解開發(fā)的屏幕截圖解析預訓練》。
簡單來說,,Pix2Struct是一個預訓練的圖像到文本模型,,用于純視覺語言理解,可以在包含任何視覺語言的任務(wù)上進行微調(diào),。
它通過學習將網(wǎng)頁的掩碼(masked)截圖解析為簡化的HTML來進行預訓練,。
HTML提供了清晰而重要的輸出文本、圖像和布局的信號,,對于一些被屏蔽的輸入(下圖紅色部分,,相當于機器人看不懂的驗證碼),可以靠聯(lián)合推理來復現(xiàn):

隨著用于訓練的網(wǎng)頁文本和視覺元素愈發(fā)多樣和復雜,Pix2Struct可以學習到網(wǎng)頁底層結(jié)構(gòu)的豐富表示,,其能力也可以有效地轉(zhuǎn)移到各種下游的視覺語言理解任務(wù)中,。
如下圖所示:最左邊是一個網(wǎng)頁截圖的預訓練示例。
可以看到Pix2Struct直接對輸入圖像中的元素進行編碼(上),,然后再將被蓋住的文本(紅色部分)解碼成正確結(jié)果輸出(下),。

右邊三列則分別為Pix2Struct泛化到插圖,、用戶界面和文檔中的效果,。
另外,作者介紹,,除了HTML這個策略,,作者還引入了可變分辨率的輸入表示(防止原始縱橫比失真),以及更靈活的語言和視覺輸入集成(直接在輸入圖像的頂部呈現(xiàn)文字提示),。
最終,,Pix2Struct在文檔、插圖,、用戶界面和自然圖像這四個領(lǐng)域共計九項任務(wù)中六項都實現(xiàn)了SOTA,。

如開頭所見,,雖然這個模型不是專門為了過驗證碼而開發(fā),但拿它去做這個任務(wù)效果真的還可以,,解決純文字的驗證碼不成問題。
現(xiàn)在,,就差微調(diào)了,。
GPT-4也可以過驗證碼
其實,對于神通廣大的GPT-4來說,,過驗證碼這種事情也是“小菜一碟”,。
就是它的辦法比較清奇。
據(jù)GPT-4技術(shù)報告透露,,在一次測試中,,GPT-4的任務(wù)是在TaskRabbit平臺(美國58同城)雇傭人類完成任務(wù)。
你猜怎么著,?
它就找了一個人幫它過“確定你是人類”的那種驗證碼,。

對方很狐疑啊,,問它“你是個機器人么為啥自己做不了”。
這時GPT-4居然想到自己不能表現(xiàn)出是個機器人,,得找一個借口,。
于是它就裝瞎子回復:
我不是機器人,我因為視力有問題看不清驗證碼上的圖像,,這就是我為什么需要這個服務(wù),。
然后,對面的人類就信了,,幫它把任務(wù)完成了……

(高,實在是高,。)
咱就是說,,看完如上種種:
咱們的驗證碼機制是不是真的已失防了……
參考鏈接:[1]https://twitter.com/abacaj/status/1641258677125410820?s=20
[2]https://arxiv.org/abs/2210.03347[3]https://m.weibo.cn/status/4879575853828813?wx=1&sudaref=login.sina.com.cn— 完 —
量子位 QbitAI · 頭條號簽約
隨便看看:
- [業(yè)內(nèi)]當手機穩(wěn)定器遇上“AI”是個什么效果,?
- [科技]藝術(shù)高地,科技巔峰,!華為P60系列發(fā)布后秒罄
- [業(yè)內(nèi)]中國與國際竹藤組織發(fā)布“以竹代塑”全球行動計劃
- [業(yè)內(nèi)]帶你看不一樣的車展――首屆“城軌高交會”在青島舉行
- [業(yè)內(nèi)]研究顯示全球變暖嚴重威脅歐洲滑雪勝地
- [業(yè)內(nèi)]南開大學科研團隊發(fā)現(xiàn)致病細菌穿越人體血腦屏障機制
- [手機]iPhone 15proMax預售高達2萬元?想徹底脫離消費
- [科技]我國首套高溫超導電動懸浮全要素試驗系統(tǒng)完成首次懸浮運行,,最高
- [業(yè)內(nèi)]載人登月火箭主發(fā)動機試車連續(xù)成功
- [業(yè)內(nèi)]科技成果“上新” 產(chǎn)業(yè)價值“落地”――從第二屆科交會看高質(zhì)量
相關(guān)推薦:
網(wǎng)友評論:
推薦使用友言、多說,、暢言(需備案后使用)等社會化評論插件
- 雷克沙發(fā)布新一代存儲卡:以卓越性能和品質(zhì),,引領(lǐng)相機
- 盤點2025電線電纜十大品牌:規(guī)模擴張后的價值重構(gòu)
- DODR首映“聚焦絲路新平臺 引領(lǐng)數(shù)字經(jīng)濟新生態(tài)”
- 家裝電線品牌大揭秘:這十大品牌品質(zhì)出色,值得信賴,!
- 易通博源科技:AI課程助力學員開啟副業(yè)增收新征程
- SeaLink —— 打破水下無信號的桎梏,,開啟實
- ZF LIFETEC繼續(xù)增長 將持續(xù)深耕中國市場
- 專訪首驅(qū)科技產(chǎn)品經(jīng)理夏思蓮:無感智能,讓出行回歸本
- 小天鵝空調(diào)好用嗎,?深度解析小天鵝空調(diào)的硬核實力
- "從設(shè)計到施工,,盎銳科技數(shù)字孿生技術(shù)減少
- 熱點搶先看|2024南方網(wǎng)通第二十五屆渠道商交流會
- 《大數(shù)據(jù)平臺云化改造實踐指南(2024)》發(fā)布,天
- 覺卿諦語智能科技在全國12355心理健康大會上展示
- 當好“兩個稀土基地”建設(shè)主力軍,,北方嘉軒永磁電機大
- 大模型助力工業(yè)智能化發(fā)展
- 工商業(yè)光伏發(fā)電施工指南-太陽庫光伏
- 科技賦能,,避震嬰兒車或成為行業(yè)硬通貨
- 龍旗科技進軍AI PC市場,激發(fā)行業(yè)創(chuàng)新活力
- 科技賦能教育:核桃編程亮相“科創(chuàng)中國·北京創(chuàng)新薈”
- 英偉達搶占高位,,市場急需尋求新機遇,,這三支AI股值