聯(lián)系我們
- (黎隊(duì))13975100132
- (樊隊(duì))13974900153
- 地址:長沙市天心區(qū)新聯(lián)路
免費(fèi)咨詢熱線
您現(xiàn)在的位置:主頁 > 新聞動(dòng)態(tài) >
車載智能語音好多人都做錯(cuò)了
發(fā)布人:admin 發(fā)布時(shí)間:2015-12-25 16:49 瀏覽數(shù):
從點(diǎn)擊到觸屏,再到語音,技術(shù)的升級也見證了人機(jī)交互從一個(gè)時(shí)代走向另一個(gè)時(shí)代。隨著人們需求和認(rèn)知得到提升,越來越多的人認(rèn)定,語音是未來智能化的方向,一大批企業(yè)也殺入了這一領(lǐng)域。但在鏖戰(zhàn)之余,一個(gè)問題也浮現(xiàn)出來——我們應(yīng)該做什么樣的語音產(chǎn)品,該如何滿足消費(fèi)者的需求?在5月21日舉行的“蓋世微課堂——智能語音產(chǎn)品在汽車上的應(yīng)用與發(fā)展趨勢”活動(dòng)上,車音網(wǎng)聯(lián)席CEO王力劭與蘇雨農(nóng),就向300余名業(yè)內(nèi)人士分享了車音網(wǎng)對智能語音未來發(fā)展的看法。
有取有舍好用才是王道 提到車載智能語音產(chǎn)品,人們頭腦中的第一印象一定是“高科技”。不過就像大多數(shù)學(xué)者對“技術(shù)決定論”的批判一樣,智能語音的高大上,并不意味著它能獨(dú)立于人的意志而存在。
“語音技術(shù)出身的科學(xué)家及車載產(chǎn)品經(jīng)理,可能會(huì)陷入技術(shù)化的思維”,車音網(wǎng)聯(lián)席CEO王力劭坦言。正如他所說,語音技術(shù)的應(yīng)用會(huì)面對類似感性思維和理性思維的困擾——到底是根據(jù)“我有什么然后做什么”的思維,還是用戶的需求來做產(chǎn)品。在這一點(diǎn)上,車音網(wǎng)的看法很明確,智能語音產(chǎn)品真正要解決的痛點(diǎn)并非技術(shù)本身,而是對需求的把握。用戶所要的,并非技術(shù)多么高級,而是這個(gè)技術(shù)能否按照要求去完成任務(wù)。
在目前的車載語音產(chǎn)品開發(fā)中,語音的“識別率”往往被放在了核心位置上。但在車音網(wǎng)看來,服務(wù)的“達(dá)成率”才是真正的硬指標(biāo)。而車載智能語音產(chǎn)品要真正做到人性化,需要聚焦的一個(gè)重點(diǎn)問題就是應(yīng)用場景。在適合的場景下,語音才能發(fā)揮它最大的效用。車音網(wǎng)聯(lián)席CEO蘇雨農(nóng)談道:“語音并非萬能,作為便捷的工具,語音所能實(shí)現(xiàn)的功能應(yīng)該更聚焦、更有保障。在很多情況下,語音產(chǎn)品并非不能識別用戶的指令,而是沒有必要識別。”例如,在車載環(huán)境下,撥打電話這樣的功能就是合適的應(yīng)用場景,而用語音開關(guān)車窗,用戶體驗(yàn)就遠(yuǎn)遠(yuǎn)不及使用機(jī)械按鈕的方式。在訪談中,蘇雨農(nóng)和王力劭表示,產(chǎn)品的設(shè)計(jì)不能陷入技術(shù)化的思維,要真正考慮用戶對語音的核心需求,必要時(shí)甚至要用上“去語音化”的解決方案。
車載智能語音產(chǎn)品未來的技術(shù)重點(diǎn)是什么?
無論是“去技術(shù)化”的思維,還是“去語音化”的解決方案,都是在產(chǎn)品素質(zhì)過硬的基礎(chǔ)上,對用戶需求滿足的更深層思考。無論如何,智能語音產(chǎn)品都離不開對技術(shù)的修煉。盡管車音網(wǎng)建立于2008年,但其技術(shù)團(tuán)隊(duì)早在近20年前,就開始了語音識別技術(shù)的研發(fā)。對于智能語音技術(shù)的發(fā)展方向,車音網(wǎng)有著自己的心得。
首先,語音識別與硬件密不可分。要想實(shí)現(xiàn)完美的用戶體驗(yàn),簡單地把語音識別引擎和硬件車機(jī)綁在一起是不夠的。麥克風(fēng)陣列排布以及車機(jī)設(shè)計(jì),都會(huì)影響語音識別的效果,而這也是未來語音識別重點(diǎn)探索的方向。為了讓語音識別更加精確,降噪技術(shù)、后臺引擎垂直度以及訓(xùn)練與車載環(huán)境的結(jié)合度,也都是需要注意的。
其次是語音識別的容錯(cuò)性。具體說來,它分為對聲音的容錯(cuò)與對信息的容錯(cuò),F(xiàn)實(shí)生活中,對于突如其來的噪音以及無意識的口誤,語音技術(shù)能否結(jié)合搜索技術(shù)并做到容錯(cuò)是非常關(guān)鍵的。此外,語音技術(shù)還要能夠聽懂各地方言或各種表達(dá)方式。對于用戶而言,往往會(huì)追求多樣性,包括使用過程中偶然狀況的多樣性以及場景的多樣性等,針對上述多樣性,容錯(cuò)技術(shù)也顯得尤為重要。
另外,語音技術(shù)完成識別之后,還需要進(jìn)行自然語言處理(NLP)和搜索,通過對自然語言的處理和理解,加上搜索技術(shù)和正確的返回信息,一個(gè)巨大的數(shù)據(jù)庫或知識庫得以形成,這種數(shù)據(jù)庫或知識庫可以針對語音識別的結(jié)果提供反饋信息。在用戶看來,既然說的話被識別,其返回來的結(jié)果就應(yīng)該正確,而不會(huì)去糾結(jié)識別出錯(cuò)抑或搜索出錯(cuò),因此自然語言處理和搜索這兩項(xiàng)技術(shù)的成熟度,也直接影響了語音識別技術(shù)的反饋結(jié)果。
第四,云系統(tǒng)將會(huì)成為未來的主流趨勢。隨著移動(dòng)網(wǎng)絡(luò)帶寬不斷提升,資費(fèi)逐漸降低,云系統(tǒng)的優(yōu)勢將逐漸體現(xiàn)。依托大服務(wù)器群、大模型、大并發(fā),云系統(tǒng)能提供更好的語音識別能力和語義分析能力。而嵌入式芯片因?yàn)樵O(shè)備局限性,提升能力有限。不過,王力劭也提到,目前云端與本地混用的模式是可行的,例如打電話的場景,本地化的解決方案就能很好的滿足需求。
最后,從設(shè)計(jì)體驗(yàn)角度來看,目前對于技術(shù)出身的設(shè)計(jì)者往往是從自身設(shè)計(jì)角度出發(fā),只關(guān)心語音能做什么,從而導(dǎo)致語音設(shè)計(jì)存在一定的問題。任何語音識別的模型都存在一定的局限性,而且語音技術(shù)本身是一項(xiàng)概率技術(shù),即使該技術(shù)能夠做到精準(zhǔn),外部的不可抗因素也可能會(huì)導(dǎo)致語音識別失效。設(shè)計(jì)者應(yīng)該更多地以用戶的應(yīng)用場景以及應(yīng)用需求為出發(fā)點(diǎn),去開發(fā)及設(shè)計(jì)語音產(chǎn)品。
智能語音應(yīng)如何盈利?
盈利模式是維系一個(gè)產(chǎn)業(yè)發(fā)展的命脈。無論智能語音如何夢幻,沒有盈利模式,它也只能是空中樓閣,如水中月鏡中花,最終化為烏有。
縱觀所有行業(yè),目前盈利模式主要分為傳統(tǒng)模式以及互聯(lián)網(wǎng)模式兩種。兩種模式的根源主要是圍繞從技術(shù)出發(fā)還是從盈利角度或未來價(jià)值實(shí)現(xiàn)角度出發(fā)點(diǎn),具體的模式主要分為產(chǎn)品售賣、服務(wù)租賃、影響力尋租,以及“東邊不亮西邊亮”式,即從其它領(lǐng)域獲得更高的收益值。
在語音識別的應(yīng)用中,如果不能將其影響力傳遞給使用者,那么語音技術(shù)和語音平臺如何去謀求長遠(yuǎn)的利益轉(zhuǎn)化,值得我們思考。解決方法分為兩種:
1,將語音作為一種手段,重點(diǎn)垂直扎根于行業(yè)中。
2,從語音技術(shù)本身去謀求贏利,將免費(fèi)開放平臺轉(zhuǎn)化成最終利益。
車載智能語音的哲學(xué)
可以說,近年來車載智能語音的研發(fā)與應(yīng)用已經(jīng)變成了一股浪潮。企業(yè)的蜂擁而上,讓這一行業(yè)顯得格外繁榮。但在蘇雨農(nóng)和王力劭看來,我們應(yīng)該十分清醒地看待智能語音的發(fā)展,切實(shí)將用戶需求放在首位,摒棄為技術(shù)論的思維,才能為消費(fèi)者奉獻(xiàn)出他們想要的產(chǎn)品。
“總之,我們要善用語音,慎用語音,垂直聚焦,體驗(yàn)為上”。
業(yè)務(wù)咨詢電話:400—040-9518
13974900153樊隊(duì)13142131842袁隊(duì)