語(yǔ)音識別或將成為科技企業(yè)的下一步發(fā)力點(diǎn)。消息稱(chēng),谷歌計劃在不遠的將來(lái)對Android做出重大調整,尤其準備在其界面重點(diǎn)突出語(yǔ)音指令功能,并用搜索鍵取代傳統的home鍵。
這一消息來(lái)的并不意外,畢竟語(yǔ)音識別在目前來(lái)講已經(jīng)是科技智能界的高端領(lǐng)域,如果能夠完全操控好這個(gè)應用范圍,無(wú)論對企業(yè)自身還是行業(yè)發(fā)展都不得不說(shuō)是一大領(lǐng)先,就連微軟也在最新的Windows
Phone 8.1操作系統中內置了其最新開(kāi)發(fā)出的語(yǔ)音助理應用Cortana。
可是,如果語(yǔ)音識別真的能夠這么容易操作的話(huà),那么作為把語(yǔ)音識別第一個(gè)真正應用到手機上的蘋(píng)果,其研發(fā)多年的Siri為什么還是沒(méi)有得到普遍應用,反而成為了人們茶余飯后的“調戲對象”?
不得不說(shuō),語(yǔ)音識別真的不是想象中那么簡(jiǎn)單,其全球基礎研發(fā)的水平?jīng)Q定了推廣應用的效果,至少從目前看,語(yǔ)音識別技術(shù)在全球還沒(méi)有革命性的成果出現,如果這一根本問(wèn)題不得到解決,語(yǔ)音識別在各行業(yè)的推廣就很難有規模。
Siri的被調戲出名之路
想當初,IPHONE
4s剛發(fā)布時(shí),Siri可謂是紅遍一時(shí)。一方面,那時(shí)的普通用戶(hù)還沒(méi)有太過(guò)接觸“人工智能”這一技術(shù),還不能理解為什么不用手操作、直接對話(huà)就可以完成指令。另一方面,Siri的傲嬌和洋派(人家講的英語(yǔ))也給了我們高大上的感覺(jué),
使得我們不得不好奇加仰視,就這樣接受了它的空降。
可新鮮期一過(guò),應用弊端逐漸顯現。不能識別中文的Siri開(kāi)始被嫌棄,同時(shí)開(kāi)啟了它的被調戲之路。雖然歷經(jīng)8個(gè)月后,Siri再次推出了中文版本,可問(wèn)題依然沒(méi)有得到改善。偶爾心血來(lái)潮使用一下,反復幾次仍不識別,倒不如直接用手操作的便捷。對于把用戶(hù)體驗當做一切的蘋(píng)果來(lái)說(shuō),顯然沒(méi)有想到,正是用戶(hù)的習慣和環(huán)境把蘋(píng)果嘔心瀝血推出的Siri拒在了門(mén)外,更限制了Siri開(kāi)發(fā)當初的應用意義。
畢竟,相對于英文來(lái)說(shuō),中文的復雜程度不可小覷。除了語(yǔ)言的地域差異外,還有各種介詞的連接和助詞的輔助以及同音多義詞等漢語(yǔ)諸多個(gè)性特征很難讓機器識別,比如同一句話(huà)換個(gè)聲調表達的效果就可以南轅北轍。舉個(gè)當初用來(lái)說(shuō)明此問(wèn)題的最簡(jiǎn)單的例子,中文中‘我’這個(gè)意思可以用:我,俺,寡人,小生,本人,老朽,吾,哀家,本宮,朕,卑人,鄙人,在下等等,而英文從古到今只有一個(gè)‘I’。這樣的一個(gè)不公平性的存在,Siri的被調戲似乎也就合情合理了。
語(yǔ)音識別技術(shù)整體局限
與其說(shuō)Siri沒(méi)辦法對中文語(yǔ)義分析得到正確的結論,倒不如說(shuō)是即使它懂也不可能應用的那么靈活。造成這一現象的原因,就要歸根于全球語(yǔ)音識別的技術(shù)開(kāi)發(fā)體系。
目前全球的新一代的語(yǔ)音識別仍處于測試初期,也有專(zhuān)家曾經(jīng)分析過(guò),阻礙語(yǔ)音識別發(fā)展的幾大問(wèn)題有:語(yǔ)音識別準確度較低;語(yǔ)義、語(yǔ)氣理解技術(shù)無(wú)法跟進(jìn);國家與區域性服務(wù)能力有限;受周邊噪音環(huán)境影響較大;還有一點(diǎn),語(yǔ)音識別通常要在聯(lián)網(wǎng)時(shí)才能應用,這就不能保證它的隨時(shí)和即時(shí)功能。這些技術(shù)弊端如果無(wú)法解決,科技企業(yè)各自開(kāi)發(fā)的語(yǔ)音應用推進(jìn)就無(wú)法順利覆蓋。就好比一臺電腦里的CPU不行,這臺電腦又怎能好用是一個(gè)道理。
在整體開(kāi)發(fā)環(huán)境并不利好的當下,谷歌試圖通過(guò)針對Android平臺重新調理,打造出凸顯語(yǔ)音指令功能的應用,這并不能定義是對是錯,畢竟這是智能領(lǐng)域的熱點(diǎn),也是未來(lái)科技的趨勢,不僅手機,可穿戴設備、電視和汽車(chē)等都是未來(lái)語(yǔ)音識別的潛在客戶(hù)。只不過(guò),應該如何呈現出最佳最有效的結果來(lái)應對用戶(hù)習慣,避免Siri的遭遇,這才是谷歌需要面對的關(guān)鍵,如果繼續效仿的模式,就象許多手機廠(chǎng)家都跟風(fēng)在自己的手機上加入了語(yǔ)音識別,但在用戶(hù)層面,卻沒(méi)有幾個(gè)人在用一樣,最終恐怕就只能繼續炒一下概念,僅此而已了。