記得Siri首次出現時,人們第一次對于語音交互表現出了從未有過的關注和興趣,即使大家都習慣“咻”的一聲傳遞自己的問候,但文本輸出依舊在很多場景下有著不小的剛需。可敲字又太麻煩,如何巧妙的運用語音識別技術在該領域找到突破,讓信息傳遞者高效的將自己的話語快速精準的輸出成文字語言,似乎成了一個值得關注的問題。
而在車機領域,這邊的變革也在悄然發生,越來越多的中國品牌車企發力語音識別技術,相比傳統的多媒體系統,語音識別技術顯然可以通過更高的性價比獲得更好的用戶體驗,能叨叨就不動手似乎成了一個風向標。而這其中一個重要的技術環節:目前由科大訊飛所引領的人工智能語音識別技術,似乎就成實現這一切的關鍵……
前言1:老年人的困惑
老爸之前一直和我叨叨,說自己的手機屏幕不夠大了,字兒太小!看著費勁,后來我給他換了一個6英寸的手機,但他似乎還是不太滿意,說現在這手機都不太照顧老年人,每次給我發點信息,手寫輸入的反應老是和自己較勁,試試拼音輸入?那你還不如要他命呢……
前言2:快遞小哥的神器/旅行者的手記
語音識別技術不僅方便了老年人,年輕人也因此受益不小!一次偶然的機會,朋友推薦我試試現在的語音輸入法,據說一分鐘能打好幾百字呢!親自試了一下,頗為吃驚,如今的語音識別都這么精準了?后來他和我說:他也是見著送餐小哥這么想玩,他才試試的,結果還真不賴。就是這次偶然的小事兒,真是讓我對如今語音輸入這事兒高看了不少。
再來說說我另一個小伙伴的經歷,她是個旅行愛好者,經常全國四處轉悠,在走訪風土人情的過程中,經常需要邊走邊記,她們管這叫手記,用于回來寫作,雖然手機里都有記事本App,但如何以最快最短的時間記下關鍵內容,這事兒讓她糾結了好幾年!然而隨著云端語音的發展,如今依靠一個App,就可以做到一邊聊著邊自己說,這就算記完了,你說爽不爽?
語音識別正在改善我們的在線溝通方式,雖說手機輸入法已經很完善,但在很多時候,敲字邊、手寫多少會顯得有些不合時宜,而語音識別的出現,顯然更符合國人的“溝通習慣”,最主要的是,它可以更好的滿足大部分人群的場景需求!比如老年人,比如會議,比如旅行或者記錄。
它的效率主要體現在,就算發語音,你是不是也得聽一遍?轉換成漢字的話,一目了然。而且容錯率比較高。何況有些場景下(比如開會中,群聊,工作群,會議群等),聽語音可是個很招煩的事兒。
幾曾何時,車載的“語音命令”功能是多么招罵?
很多人對于語音命令特別唾棄,你卻不知,語音命令從20世紀50年代初就開始存在了,那時最先開始研究它的是IBM,那時它主要被設計用來檢測特定的語言模式并得出聲音和它對應的文字之間的統計相關性,當時那個產品叫做VoiceType。后來IBM將這項技術授權給了一家叫做ScanSoft的公司,時間到了21世紀,隨著企業之間的兼并,viaVoice早已淡出人們的視線,取而代之的是Nuance公司,而它,就是后來蘋果Siri語音識別的核心技術供應商。
“從10萬到50萬”:科大訊飛正攜手中國品牌集體發力?
談起語音識別,先得說車上那塊屏,也就是多媒體系統,大部分對于它的使用率簡直是太低了,體驗差,操作繁復,這是吐糟最多的!哪怕是如今上百萬的車機系統,除了那些堆砌起來的華麗和逼格外,真正有多少人會充分利用那些過度宣傳的“功能們”?極少!連多媒體都這樣,何況那些曾經搭載語音命令的車型了,不天天噴你就不錯了,直到科大訊飛的識別技術被普及,之前的情況似乎真的有所改觀了……
“十來萬塊錢兒”能有什么樣的體驗?---------先來看看中國品牌的表現!
之前我們體驗過吉利博越、帝豪GS、奇瑞瑞虎5、長安CS95在內的眾多中國品牌車型的,基本都在10萬元上下的價位。它們在這些產品上的主銷車型上都采用了科大訊飛的語音識別。
僅從我個人來看,我認為目前中國品牌集體發力語音識別,可能存在這么幾點前提:1、傳統的多媒體系統被人詬病無數,華而不實的硬件堆砌最后多數都落得個費力不討好的下場。2、語音交互在硬件上并不需要太繁復,但卻可以實現更好的體現,正好迎合了“行駛場景”下的剛需。3、和德系領銜的“高大上”科技路線相比,這顯然是性價比足夠高,體驗足夠好的方案。4、科大訊飛作為目前國內語音識別領域的大頭兒,又是本土企業,中國品牌無論在定制、適配還是體驗改善方面,擁有更多的話語權和主動權。
長安語音識別
先說長安,之前我們在CS95車型上曾經體驗過它的語音識別系統,它提供了4G網卡和SOS緊急救援電話等車聯網功能,在語音識別方面,識別率沒問題,對于POI興趣點的識別也不錯,但在反應速度方面它比其他幾位中國品牌對手還是要稍微遜色一些,稍有遺憾。
奇瑞語音識別
奇瑞搭載的Cloudrive智云平臺如今已經發展到2.0版本,3.0版本也將于近日發布,并且它很可能會成為科大訊飛AIUI平臺的首批適配者,非常值得期待。從之前的體驗來看,它的語音識別也是沒得說的,識別率和反應速度都不錯,屬于第一梯隊的水平,并且同樣采取了免費送流量的方式來促進云端語音識別的實用性。
上汽語音識別
上汽的方向則稍有不同,它在系統級操作方面的優勢會更大一些,比如空調和天窗,比如能這識別主副駕語音,這些頗具互聯網氣息的設計思路都出現在了上汽的車型上,部分需要和CANBUS總線通訊才能實現的功能在上汽的車型上都有所展現,而且同樣可以使用語音輕松完成,而在聽歌、導航、電話方面,它的語音識別表現也是同樣出色的。
吉利語音識別
最后談一下吉利的表現,無論是反應速度,識別率,還是POI信息的抓取,都是比較準確的,而且目前還有免費送流量的活動,基本上聽歌、打電話、導航,這幾個核心訴求你都可以動動嘴輕易完成,手機基本不用參與了。要說缺點,那就是系統整體還是被限制在多媒體的范疇之內,沒能實現和空調等車內設備的聯動。
怎么樣?我沒說錯吧,中國品牌目前正以迅猛的速度布局語音識別技術,除了上面展示的幾個品牌外,像是廣汽、江淮等眾多中國品牌和合資品牌,比如雷克薩斯,它也已經在最新的車款上配置了科大訊飛的語音識別系統。眾人拾柴火焰高,第一次由中國本土企業引領一番多媒體變革,講真,心里還是挺激動的。這絕對不是YY,為什么?
大家都知道“BBA”,之前它們都在自己的科技風格上耕耘多年,然而就在語音識別大潮爆發不久,寶馬突然在最新年代款的3系上搭載了NLU自然語音識別系統,這一突然的轉變還是讓很多人眼前一亮的,不僅于此,之后對于這套系統的好評也是源源不斷,下面我們也簡單看下這套系統的表現,讓大家對此也有個概念。“原來豪華車也可以這么玩”
最先投入語音識別懷抱的寶馬---------高端品牌也能換個方向玩?雖說多數高端品牌車型的多媒體系統總被人詬病華而不實,但在這其中的寶馬,口碑則一直是可圈可點,如今它也率先在自己的3系車型上搭配了科大訊飛的語音識別技術,之前我曾深度體驗過,雖然華麗程度比不了7系,但對于3系來講,順滑的語音交互體驗是個不小的驚喜和提升。
寶馬給我印象最深的,還是它的默認喚醒機制,就用自己方向盤上的語音鍵,不僅充分利用了硬件的布局,而且相比中國品牌那一票“你好 XX”要好很多,這說的是用戶體驗。
其次就是它的反應速度和識別率了,非常高,能和中國品牌第一梯隊達成平手,對于比較口語化的句子也能很好的理解,讓我印象最深的就是,我說:“車沒油了”。它不僅找到了附近所有的加油站,而且還在我選擇了某個加油站后,繼續提示我:“您的油量不足以到達目的地”。這點就很牛B了。
編輯有話說:
“中國人沒有發明VISA卡,但我們卻創造了支付寶”我覺得用這句話來形容科大訊飛如今在語音識別領域的成績是比較恰當的。語音識別的突飛猛進,絕不僅是對于溝通方式的一種進步,當它和人工智能技術相結合之后,誰也無法估計它會延伸出多少可能性。
僅從目前得到的信息來看,識別技術能在幫助更多的孩子們獲得更好的教育體驗,實時解析老師在課堂上的重點,根據學生的作業分析他的弱點,從而幫助他找到最有針對性的提升方案。在,醫療領域,它還將協助醫生們更好的識別癌癥,判斷病情,從病人的口述中迅速識別他可能存在的病情,這一切都需要深度的大數據學習和精準的識別技術才能實現。
而在汽車領域,識別技術的下一段應用顯然和智能交通、自動駕駛密不可分,在未來,也許你真的會像《霹靂游俠》里那樣,毫無門檻的和你的愛車溝通你的一切需求,它將幫助你搞定沿途所有的問題,而你只需要享受旅行的過程就可以了。
而汽車對于我們的屬性和定義也可能隨之再次改變,比如,汽車從一個交通工具轉變成為移動的多功能的空間,比如汽車可能成為了會議室、影音室、臥室、社交場所等,從而會帶來更多的細分產品和服務,商業模式也會多樣化;我相信,汽車很可能會從如今的一次性買賣轉變成和用戶終身相連的服務。(文/圖 汽車之家 任博)