AI一大步:語音識別定義人機交互未來之路
? ? ? ? ? ? ? ? ? ?本文由 電器雜志 發表,轉載請注明來源!

亞馬遜Echo 成為爆款,引發巨頭紛紛跟進。根據CIRP預計,Echo 在美國本土銷量已超過 300 萬臺,而今年一季度應超過 100 萬臺。
而同樣在一季度,包括谷歌、三星、海爾、索尼等主要廠商高密度推出支持語音交互的智能管家,智能家居在語音識別和大數據分析等技術進步中迎來一場新的交互革命。
“互聯網女皇”瑪麗米克爾最新發布的2016年的互聯網趨勢報告中, 首次用近1/4的篇幅論述語音識別交互帶來的改變,將語音功能贊譽為“人機交互的新范式”,并稱語音功能“解放了雙手和眼睛,擴展了永遠在線的概念?!?/p>
而MIT主辦的知名科技期刊《麻省理工科技評論》在某些方面與互聯網女皇的觀點不謀而合,期刊近期評選出的“2016年十大突破技術”中,第三項就是語音接口,并表示該技術現已趨于成熟。通過該技術可將語音識別和自然語言理解相結合,為全球互聯網市場創造切實可用的語音接口。
事實上,語音識別和大數據分析帶來的人機交互變革已經滲透到智能硬件的各個領域,包括家居、機器人、車載硬件等等。記者在6月15日思必馳舉辦的“聲享會”沙龍中,切身感受了一把智能語音技術帶來全新人機交互體驗,其中包括三款智能車載硬件??“Vision遠界”智能后視鏡、“云龍”智能后視鏡和車蘿卜HUD,還有時下相當火熱的家庭服務機器人??“小樂”和“小蘿卜”。
根據介紹,現場的三款智能車載硬件中搭載的是AIOS For Car系統,AIOS For Car是思必馳在2015年10月推出的車載對話操作系統,適用于android, linux, QNX等主流操作系統。由于可移植性高、定制性強、對接方便、易于調試、穩定性佳等特點,成為眾多智能車載后裝產品的首選語音解決方案。后續,思必馳也將陸續推出AIOS For Home/Robot,拓寬語音交互技術服務范圍。
記者在體驗過程中發現,除了自然的語音交互對話之外,這些車載產品也集成了微信、高德地圖、喜馬拉雅FM等第三方資源,集社交、娛樂、資訊、資訊等各種場景需求于一身。據悉,這三款產品因為功能穩定、體驗性佳受到了市場的認可,已經全部實現量產。
同樣實現量產的也有造型可愛的兒童機器人??“小蘿卜”,它能說會道、手舞足蹈,包含豐富的兒童早教內容,還能學大人說話,幫助小朋友糾正一些壞習慣,收獲了家長和小朋友的一致好評。而造型呆萌的“小樂”機器人,能夠準確判斷說話人位置方向,實現有效的語音交互,配合面部識別技術和豐富的其他第三方內容資源,成為提供家庭暖心陪伴和兒童教育擔當,成了現場的人氣王。除此之外,嘉利信系列機器人男女童聲應用分明,女生婉轉,男生憨厚,優秀的語音交互配合產品內容,給現場增色不少。
這些機器人均應用思必馳環麥方案智能語音解決方案,是思必馳2015年12月推出的針對機器人和音箱等智能家居產品的解決方案。采用環形6+1遠場麥克風陣列,是亞馬遜echo核心功能的“中國版”技術。該陣列周圍6個麥克風呈環形360°排列,中間置1個麥克風輔助拾音,能夠有效地在家居環境下進行抗噪處理及語音識別,遠場5米交互識別率達92%以上。在拾音角度方面,該陣列可實現環形360°環形拾音,精準度控制在±10°以內,準確捕獲說話人位置,進行敏銳的聲源定位。
在2016北京服務機器人千人大會上,思必馳信息科技有限公司CMO龍夢竹發表了“提高自然語言理解能力,打造知心機器人”的主題演講,她認為缺乏人機交互再智能不過也只是一個機器,而語音技術的發展使得人機交更加自然,語音越親切而會讓機器變得越具情感性,更能達到人們更深層的需要。
目前語音識別的準確率已從 2010 年的 70?快速提高至 2015 年的 90?。有業內人士稱,當語音識別準確率達到 99?的水平,語音交互將取代現有的人機交互方式成為主流。思必馳戰略VP郭浩然指出智能語音是人機交互不可或缺的必然入口,探討市場需求與技術革新始終是思必馳的發展方向。
當機器能夠從語言、圖像等信息正確感知人的心理需要的時候,才算得上人工智能最終的勝利,而在這之前,語音識別、圖像識別每進一步,都足夠給人們帶來莫大的驚喜。
本文由 電器雜志 發表,轉載請注明來源!