首頁(yè)>>>技術(shù)>>>語(yǔ)音應(yīng)用>>>語(yǔ)音識(shí)別(ASR)  語(yǔ)音識(shí)別產(chǎn)品

消息稱蘋果正研發(fā)iPhone語(yǔ)音識(shí)別技術(shù) 可撰寫郵件

2009/08/31

  北京時(shí)間8月29日,據(jù)國(guó)外媒體報(bào)道,據(jù)一份專利文件顯示,蘋果正在為iPhone和iPod研發(fā)語(yǔ)音識(shí)別技術(shù)。隨著手機(jī)體積越來(lái)越小,語(yǔ)音識(shí)別技術(shù)日益成為數(shù)據(jù)輸入的關(guān)鍵。

  媒體在該專利文件中發(fā)現(xiàn)了一個(gè)利用語(yǔ)音識(shí)別技術(shù)撰寫郵件的結(jié)構(gòu)圖。蘋果的專利文件中包含大量術(shù)語(yǔ),不過(guò)業(yè)內(nèi)人士解讀稱,這種語(yǔ)音識(shí)別技術(shù)不僅可以將用戶語(yǔ)音信號(hào)識(shí)別成為文字,甚至可以處理標(biāo)點(diǎn)符號(hào)等非語(yǔ)音數(shù)據(jù)。同時(shí),根據(jù)蘋果的專利文件,該語(yǔ)音識(shí)別模塊是一個(gè)專門為此配置的獨(dú)立芯片或類似的硬件設(shè)施,類似于視頻采集卡從電腦主服務(wù)器上加載圖象。如果蘋果真能實(shí)現(xiàn)這一技術(shù),那么iPhone必能進(jìn)一步拓展其在智能手機(jī)領(lǐng)域的市場(chǎng)占有率。

  事實(shí)上,此前已有其它公司進(jìn)行過(guò)語(yǔ)音轉(zhuǎn)換為文本的嘗試。最基本的語(yǔ)音識(shí)別技術(shù)就是可以通過(guò)語(yǔ)音拔號(hào)。其中,微軟曾開(kāi)發(fā)過(guò)一款名為Voice Command的工具,例如用戶只需說(shuō)出“拔打約翰的電話”,手機(jī)就會(huì)自動(dòng)在聯(lián)系人列表中搜索約翰的號(hào)碼并拔號(hào)。用戶無(wú)需提出錄入這些語(yǔ)音,可以直接使用。同時(shí),用戶還可以通過(guò)語(yǔ)音詢問(wèn)時(shí)間、電池電量、信號(hào)強(qiáng)度、日程安排等。不過(guò)Voice Command的使用范圍有限,它無(wú)法撰寫郵件,而且如果任務(wù)超過(guò)十余項(xiàng),Voice Command也無(wú)法識(shí)別。

  數(shù)年前,微軟董事長(zhǎng)比爾·蓋茨(Bill Gates)曾演示過(guò)一個(gè)Pocket PC的語(yǔ)音識(shí)別和文字錄入功能,其效果非常好,但在這一轉(zhuǎn)換過(guò)程中,語(yǔ)音數(shù)據(jù)先被轉(zhuǎn)換為數(shù)字,之后通過(guò)一臺(tái)強(qiáng)大的服務(wù)器進(jìn)行無(wú)線傳輸,實(shí)現(xiàn)了語(yǔ)音到文字的轉(zhuǎn)換。目前這種方法并不實(shí)用。

騰訊科技



相關(guān)鏈接:
開(kāi)源的語(yǔ)音識(shí)別軟件Simon 0.2發(fā)布 2009-08-28
訊飛語(yǔ)音助力太平人壽客服中心 2009-08-28
訊飛語(yǔ)音助力CDMA手機(jī)競(jìng)爭(zhēng)終端市場(chǎng) 2009-08-14
科大訊飛嵌入式語(yǔ)音新產(chǎn)品發(fā)布會(huì)9月3日召開(kāi) 2009-08-12
Nuance攜手IBM提供先進(jìn)的語(yǔ)音識(shí)別解決方案 2009-08-05