美國(guó)馬里蘭大學(xué)(University of Maryland)的4名研究人員近日發(fā)表一自動(dòng)化系統(tǒng)unCAPTCHA,宣稱可破解由Google打造的語(yǔ)音版reCAPTCHA,且準(zhǔn)確率高達(dá)85.15%,并已藉由GitHub釋出了該系統(tǒng)。
Google的reCAPTCHA為全球最受歡迎的CAPTCHA系統(tǒng)之一,透過(guò)圖像來(lái)驗(yàn)證來(lái)者是人類(lèi)或機(jī)器人,以保護(hù)網(wǎng)路服務(wù)不被龐大的機(jī)器人所侵襲,估計(jì)至少有數(shù)十萬(wàn)個(gè)網(wǎng)站采用reCAPTCHA。至於語(yǔ)音版的reCAPTCHA則是專(zhuān)為視障人士所設(shè)計(jì),它在吵雜的背景環(huán)境中以不同的速度、音調(diào)或口音念出數(shù)字,并要求使用者填入所聽(tīng)見(jiàn)的數(shù)字。
而unCAPTCHA系統(tǒng)即是基於語(yǔ)音轉(zhuǎn)換成文字的技術(shù),先下載語(yǔ)音版的CAPTCHA,把這些語(yǔ)音切割成個(gè)別的數(shù)字音頻,再將各個(gè)數(shù)字音頻上傳到網(wǎng)路上的各種語(yǔ)音轉(zhuǎn)文字服務(wù),然後把這些服務(wù)的回應(yīng)修改成數(shù)字,例如倘若聽(tīng)起來(lái)像是「True」,那麼可以假設(shè)這個(gè)數(shù)字是「Two」,整合這些不同服務(wù)的結(jié)果,并將數(shù)字回傳至答案上。
unCAPTCHA所利用的線上語(yǔ)音轉(zhuǎn)換文子服務(wù)涵蓋了IBM、Google Cloud、Google Speech Recognition、Sphinx, Wit-AI與Bing Speech Recognition。
在研究人員的測(cè)試中,unCAPTCHA辨識(shí)個(gè)別數(shù)字的準(zhǔn)確率高達(dá)92%,而整串CAPTCHA的準(zhǔn)確率也達(dá)到85%以上。