AI賦能,發布四款消費類新品!科大訊飛如何“頂天立地”?
? ? ? ? ? ? ? ? ? ?本文由 電器雜志 發表,轉載請注明來源!
對科大訊飛的認知,大多數人還停留在中國最大的智能語音技術提供商的層面。實際上,科大訊飛在多個領域都有廣泛布局,現已推出覆蓋全行業的智能產品及服務,引領在消費者、智慧教育、智慧城市、智能客服、智能汽車、智慧醫療、智能家居等領域的深度應用,占有中文語音技術市場70%以上的市場份額。
隨著AI、IoT以及5G等前沿技術的發展,科大訊飛正推動語音及語言、自然語言理解、機器學習推理及自主學習等核心技術與各行業的結合,用AI技術重新賦能傳統硬件,從而為用戶帶去軟硬結合的極致體驗。
9月1日,科大訊飛在“聲來即王者”的消費類新品發布會上,連續推出訊飛智能錄音筆SR901、SR702、SR101,訊飛首款智能TWS耳機iFLYBUDS四款新品。科大訊飛輪值總裁胡郁在現場解讀了科大訊飛“頂天立地”的含義,“頂天”就是人工智能核心技術要保持全球領先。“立地”,是不僅有技術,還要它真正變成產品,為廣大用戶產生價值。而這四款新品正承載了科大訊“To B+To C”的雙輪驅動戰略,讓AI應用服務大眾的初衷。
聚焦AI轉寫賽道,消費者業務發力
科大訊飛此次發布三款智能錄音筆新品,補全了智能錄音筆全系列,覆蓋了從入門、旗艦再到尊享版全線機型。更重要的是,經過AI的賦能,解決了傳統錄音筆存在的痛點。
訊飛智能錄音筆SR101是面向職場新人和學生推出的入門級新品,標配1.4英寸觸摸屏使得轉寫實時可見,同時搭載1顆定向麥克風+2顆矩陣麥克風的組合,四核處理芯片,8GB存儲空間和1500mAh電池容量,在硬件配置上毫不妥協。SR101售價599元,轉寫終身免費并享有3年5GB云空間服務。
訊飛智能錄音筆SR702為旗艦新品,擁有一體設計的3D陶瓷背板和航空級鋁合金,其采用高密度2600mAh大容量電池,搭載2顆定向麥克和6顆矩陣麥克風,配置3.5英寸高清屏幕,并配備800萬像素數字變焦后置攝像頭。
訊飛智能錄音筆SR901則是尊享版,采用鋼琴黑全陶瓷機身,搭載6.01英寸AMOLED屏幕,64GB存儲空間及4000mAh支持18W快充大容量聚合物鋰電池。還擁有豪華三攝配置和2顆哈曼MEMS定向麥克風+10顆全向麥克風。通過全面升級的轉寫引擎。
值得一提的是,SR702和SR901搭載了行業首發的離線轉寫、OCR圖文識別、視頻字幕等新功能,再次拓寬了轉寫記錄的易用性和使用場景。此外,三款新品均沿襲了訊飛智能錄音筆識別準、錄得遠、錄得清、語種全四大標準。不僅識別準確率達98%,最遠拾音距離更是達到了15米。另外,基于AI算法降噪處理前端語音信號,保證拾音的準確性,并提供高清無損音質的音頻格式。在關鍵的語種方面,三款新品都支持12種方言轉寫、2種少數民族語言轉寫、8種外語轉寫,并經過IT科技、醫療、政法、教育等7大專業領域轉寫優化。
除了三款新品,科大訊飛還發布了首款TWS智能耳機iFLYBUDS。憑借通話實時轉寫、智能撥號識別、通話譯文對照三大核心AI功能,能夠輕松滿足商務人士在自駕、通勤、會議等多場景中,解放雙手、重要信息記錄和從容溝通的需求。iFLYBUDS支持智能語音助手,只要說“小飛小飛”即可快速喚醒語音助手。同時iFLYBUDS的特點還包括:支持輕擊耳機交互,并且支持自定義功能;佩戴檢測,摘下耳機時暫停播放,再次戴上音樂繼續。不僅如此,訊飛智能耳機iFLYBUDS續航可以滿足日常商務溝通。
iFLYBUDS還充分考慮了應用場景,在常規電話和網絡電話會議中,可以實時轉寫,轉寫準確率在98%以上。在通話結束后可以形成智能摘要,自動提煉重點內容,還支持對通話內容進行快速查找、多終端分享(手機端和電腦端)和編輯。在外語電話交流場景中,iFLYBUDS打造了堪稱逆天的通話譯文對照功能。在英語通話時,可將通話內容實時轉譯為漢字,輔助英語溝通,是你耳朵上的助理翻譯官,溝通更加自信、簡單。未來將會支持更多的語種。
保持技術領先,方能頂天立地
在科大訊飛副總裁李傳剛看來,“技術革新與消費升級雙輪驅動,將出現巨大的顛覆式創新機會,并催生新的領導品牌。訊飛智能錄音筆和訊飛智能耳機均是這一理念的實踐。通過頂尖的AI語音技術、優質的硬件和軟件三位一體,打造極致便捷的體驗,幫助用戶有效提升效率,享受高品質智慧生活。
以轉寫引擎技術為例,訊飛智能錄音筆SR901和SR702兩款新品在行業率先搭載了離線轉寫功能。無需4G/WIFI網絡,用戶也能實現語音實時轉文字、轉寫后的文字內容即刻保存,離線轉寫準確率高達95%,無懼斷網環境。同時離線轉寫也防止了高度機密信息的泄露,保障了用戶信息安全和特有轉寫需求的實現。同時,通過SR901和SR702的攝像頭可將圖片上的文字內容提取出來并實時呈現,便于用戶實現重要音頻和圖文信息的混合記錄,用于后期記錄及整理。同時,這兩款新品還支持錄制視頻、實時收音并實時生成字幕,同時后期也可編輯字幕,打造多場景重要信息記錄的全新AI交互體驗。
在訊飛智能錄音筆前端降噪處理上,通過訊飛原創神經網絡與傳統信號處理深度結合的降噪算法(SSA-IME),可以有效降低環境干擾噪聲。除了硬件,訊飛大力投入語音識別后處理技術并運用到訊飛智能錄音筆上,先后上線語氣過濾詞、口語規整、文本語義分段、文本智能摘要等文本理解能力。針對多人交談會議場景,上線了分離與ASR聯合建模的說話人分離方案,說話人分離的準確率達到95%讓用戶能夠快速檢索到目標說話人數據,提升編輯體驗。
在人工智能落地過程中,訊飛消費者業務連續三年保持超過30%的高增速。隨著訊飛智能硬件產品體系不斷完善,C端營收占比在2020年上半年達 37.59%。在AI轉寫賽道上,訊飛打造的智能硬件成為用戶的知識管理工具,并逐步開啟高效記錄新時代。
嚴格要求自身,堅持源頭技術創新
縱觀行業龍頭的崛起都離不開企業的核心競爭力,人工智能企業同樣如此。為了保持技術領先,科大訊飛一直堅持技術創新,強化企業核心競爭力,在研發投入上已經連續6年超營收20%。據科大訊飛近日發布的2020年上半年財報顯示,科大訊飛營收43.49億元,同比增長2.86%;凈利潤2.58億元,同比增長36.28%。財報顯示,科大訊飛將其20%的營收約9.62億元用于研發。
研發,只是保持領先的秘訣之一。從最早的支撐軟件及行業應用到教育大賽道,再到目前司法、消費者等明星賽道業務,訊飛不斷拓展技術的商業應用領域為他帶來了強勁增長。伴隨語音交互應用泛化,AI+行業應用深化,更多新增長點值得期待。而胡郁也在前場表示,為了保持公司在人工智能領域的競爭水準,每年都會參加大量的國際比賽,來驗證技術創新是否處于源頭。以語音轉寫功能應用到的語音識別技術為例,早在2016年9月,在業界影響力最大、參賽隊伍最多、水平最高的國際多通道語音分離和識別大賽CHiME-4中,科大訊飛包攬了全部三個項目的冠軍;2018年再次包攬CHiME-5大賽全部四個項目的冠軍并大幅刷新了各項目的最好成績;2020年的CHiME-6,在被稱為“史上最難的語音識別任務”中,科大訊飛不僅在給定說話人邊界的多通道語音識別兩個參賽任務上奪冠,更一鼓作氣刷新自己在CHiME-5中46.1%的語音識別錯誤率冠軍成績,直降至30.5%。
近期在VoxSRC國際說話人識別比賽限定訓練數據任務中(公開刷榜階段),科大訊飛刷新世界紀錄,等錯誤率(EER)降低到0.81%。同時,科大訊飛在學術界公開測試集合VoxCeleb1上取得0.63%的EER,是截止目前的State Of The Art(最好結果),上述兩個新紀錄表明科大訊飛說話人識別技術站在了世界前列。
曾經中國的科技水平一直處于落后的狀態,但在華為、科大訊飛等科技企業的努力趕超,終于在全球領域有了一席之地。而中國科技水平的快速發展讓處于“霸主”地位的美國感受到了危機,于是它采用各種手段來阻礙中國科技企業的發展。胡郁也在此次發布會上回應了公司被列入美國實體清單,他表示,科大訊飛堅持源頭技術自主創新,擁有的核心技術全部來自科大訊飛的自主研發,擁有自主知識產權。而被列入“實體清單”之后,也并沒有對科大訊飛造成多大的影響。
本文由 電器雜志 發表,轉載請注明來源!