智能語音:少談些技術(shù)多說些應(yīng)用
很久不上頭條的臺灣歌星周杰倫,在最近的演唱會現(xiàn)場用聲、光、電技術(shù)虛擬出鄧麗君,兩“人”演繹了一場完滿的跨時空對唱。在這場轟動的虛擬視像演出中,智能語音技術(shù)發(fā)揮了重要作用。當(dāng)前,我國智能語音產(chǎn)業(yè)發(fā)展快速,但仍然是小眾市場。如何從技術(shù)探討快速轉(zhuǎn)化到市場殺手級應(yīng)用,是業(yè)內(nèi)持續(xù)關(guān)注的話題。
語音每5年“火”一次?
語音市場投資迅速涌進(jìn),5年規(guī)律是否重演?這次的高潮比以往來得真實一些,力度更大一些。
據(jù)《中國智能語音產(chǎn)業(yè)發(fā)展白皮書》(以下簡稱“白皮書”)數(shù)據(jù)顯示,2012年中國智能語音產(chǎn)業(yè)規(guī)模近8.6億元,同比增長38.2%,全球智能語音產(chǎn)業(yè)規(guī)模是24.4億美元。預(yù)計到2017年,中國的規(guī)模將增長到101.4億元,占全球的比重將增長到17.1%。
白皮書分析,當(dāng)前語音產(chǎn)業(yè)鏈規(guī)模大幅提升主要得益于三方面因素。一是移動互聯(lián)網(wǎng)的蓬勃發(fā)展為智能語音技術(shù)的推廣和應(yīng)用提供了更為廣闊的發(fā)展空間。二是大數(shù)據(jù)、云計算、互聯(lián)網(wǎng)技術(shù)的發(fā)展為智能語音技術(shù)的提升創(chuàng)造了條件,基于互聯(lián)網(wǎng)海量數(shù)據(jù)的深度神經(jīng)網(wǎng)絡(luò)技術(shù)推動智能語音技術(shù)得到快速發(fā)展。三是智能語音技術(shù)在行業(yè)應(yīng)用方面不斷拓展,在智能家電、汽車電子、可穿戴設(shè)備等領(lǐng)域加速應(yīng)用,以及數(shù)以萬計汽車、數(shù)以億計的醫(yī)療用戶等,都是語音產(chǎn)業(yè)需求市場潛力巨大的原因所在。
語音市場一熱,投資迅速涌進(jìn)。谷歌先后并購GIPS,SayNow,DNNresearch。2013年,英特爾資本注資1億美元投資Expert Labs。2012年,中移動13.6億元戰(zhàn)略投資科大訊飛。同年,光年無限、云知聲、小i機器人等語音企業(yè)相繼獲得天使投資或第一輪風(fēng)險投資。特別是云知聲,成立僅1年時間,就先后獲得兩次投資,最近一次獲得的融資金額高達(dá)1億元。國內(nèi)的互聯(lián)網(wǎng)企業(yè)——百度,則在2013年5月戰(zhàn)略投資捷通華聲。
可以說,語音市場的熱度持續(xù)攀升,似乎正處于需求爆發(fā)、應(yīng)用爆發(fā)、市場爆發(fā)的臨界點。但是在從業(yè)20幾年的老語音人、中科院聲學(xué)所所長助理顏永紅看來,從上世紀(jì)90年代開始,語音技術(shù)每5年就會“火”一次,每一次都是新的產(chǎn)業(yè)特征、技術(shù)特征涌現(xiàn)出來,資本開始進(jìn)入,過幾年又會退出。只不過這一次的高潮比以往來得要真實一些,力度大一些?!拔覀冞€是需要一個比較清醒的頭腦”,他認(rèn)為。
不過,漢能投資集團董事長陳宏要看得更樂觀一些。針對顏永紅認(rèn)為的5年規(guī)律,他不以為然:“語音已經(jīng)成為主流大公司必須解決的問題。過去很多年熱一陣、死一陣的年代已經(jīng)過去了。今天,特別是隨著移動互聯(lián)網(wǎng)的出現(xiàn),這次的爆發(fā)是不可能停下來的?!?/P>
唯技術(shù)論色彩依然很重
當(dāng)前中國語音產(chǎn)業(yè)界對語音技術(shù)、產(chǎn)品談?wù)摰幂^多,偏重于就技術(shù)而論技術(shù)。傳統(tǒng)技術(shù)企業(yè)依托科研院所居市場主導(dǎo)地位。
雖然語音市場非常有熱度,但是看一下市場的營收和企業(yè)的經(jīng)營狀況就能發(fā)現(xiàn),從熱度轉(zhuǎn)換為實實在在的市場力量還有些距離。業(yè)界談?wù)摳嗟氖侨绾翁嵘夹g(shù)、突破技術(shù)難度,而不是順應(yīng)哪些消費者需要,推出更多粘性強、服務(wù)能力強的應(yīng)用和產(chǎn)品。
財報顯示,國內(nèi)語音企業(yè)老大科大訊飛2012年營收7.8億元,其中語音及相關(guān)業(yè)務(wù)收入占比不足70%。而國外的Nuance公司,其業(yè)務(wù)主要聚焦在語音領(lǐng)域,比重達(dá)到87%,最大的一塊語音業(yè)務(wù)收入來自醫(yī)療行業(yè),其次才是手機、移動互聯(lián)網(wǎng)領(lǐng)域。
另外,傳統(tǒng)技術(shù)企業(yè)依托科研院所居市場主導(dǎo)地位。以中科院聲學(xué)所、中科院自動化所、中國科技大學(xué)、清華大學(xué)、北京大學(xué)、社科院語言所為代表的科研院所,有自己的中文智能語音技術(shù)體系,一方面他們成立自己的語音公司,例如中科信利、中科模識、得意音通等一批中國語音市場的中堅企業(yè),另一方面,與百度、淘寶、傳統(tǒng)家電企業(yè)等建立合作關(guān)系。
由科研院所衍生出來的語音企業(yè),難免帶有唯技術(shù)論的色彩。前不久,在中國語音產(chǎn)業(yè)聯(lián)盟年會上,聯(lián)盟牽頭企業(yè)科大訊飛的演講報告中大篇幅介紹的是其公司取得的技術(shù)成果,依然主要扮演著技術(shù)服務(wù)提供商的角色,遵循傳統(tǒng)的B2B服務(wù)模式。其和中移動合作的靈犀助手,眼下基本沒有市場收入。
“實際上對從業(yè)人員來講,到底什么東西真正讓用戶能夠愿意出錢來用這個服務(wù),即便在今天依舊是一個極大的挑戰(zhàn)?!鳖佊兰t表示。
白皮書認(rèn)為,智能語音已經(jīng)成為新的信息流入口,智能語音技術(shù)正處于全面應(yīng)用初期。創(chuàng)維集團董事、副總裁孫瑞坤表示,當(dāng)前中國語音產(chǎn)業(yè)界對語音技術(shù)、語音產(chǎn)品談?wù)摰幂^多,偏重于就技術(shù)而論技術(shù)。在中國,語音產(chǎn)品和服務(wù)是隨著移動互聯(lián)網(wǎng)的發(fā)展而熱起來的,而移動互聯(lián)網(wǎng)非常注重消費者、用戶的體驗。今后的語音技術(shù)和產(chǎn)品,應(yīng)該從技術(shù)導(dǎo)向向消費者導(dǎo)向轉(zhuǎn)移,企業(yè)應(yīng)該推出更多消費者愿意用、發(fā)自內(nèi)心喜歡用的語音產(chǎn)品和服務(wù)。
缺少引領(lǐng)性應(yīng)用
如果誰能設(shè)計出滿足大眾娛樂需求的應(yīng)用來,那么未來將有很大希望。
和應(yīng)用的深度結(jié)合能催生更有生命力的企業(yè)。云知聲是成立僅1年的新銳語音企業(yè),推出了自己的語音產(chǎn)品和語音平臺,和搜狗、樂視等1000多家企業(yè)合作。云知聲的CTO康恒透露,云知聲的發(fā)展是跟移動互聯(lián)網(wǎng)高速發(fā)展相結(jié)合,在移動互聯(lián)網(wǎng)大潮中孕育出來的。云知聲的發(fā)展在市場策略、產(chǎn)品設(shè)計、技術(shù)發(fā)展過程中一直跟移動互聯(lián)網(wǎng)的應(yīng)用和產(chǎn)業(yè)的需求相結(jié)合。
作為投資人,陳宏認(rèn)為這個行業(yè)遇到的最大問題是賺錢的問題。能賺錢的,還是傳統(tǒng)的B2B模式,迎合家電、汽車、運營商等傳統(tǒng)合作廠商的移動化需求?;馃岬囊苿踊ヂ?lián)網(wǎng),語音企業(yè)沒法從消費者市場直接掙錢,而最大的應(yīng)用又產(chǎn)生于O2O市場。例如語音助手處理買票等服務(wù),這些對于語音公司來講并不是很難的服務(wù),但是因為有著三座大山的壓力,嘗試和創(chuàng)新難點較大。
科大訊飛的副總裁胡郁也承認(rèn),語音方面還沒有引領(lǐng)性的、殺手級的應(yīng)用。
入口很重要,消費市場很重要,那么如何尋找有市場的語音應(yīng)用?合眾資本管理合伙人陳立輝指出,娛樂業(yè)在中國有很大市場,語音技術(shù)在娛樂業(yè)應(yīng)用不需要太高的技術(shù)。例如唱吧,技術(shù)水平并不是很高,也可以很快聚集眾多人氣,將來有可能延伸出一個成功的生意。再比如YY語音也是瞄準(zhǔn)游戲輔助。如果誰能設(shè)計出滿足大眾娛樂需求的應(yīng)用來,那么未來將有很大希望。
白皮書認(rèn)為,在未來發(fā)展趨勢上,各種智能軟件和終端設(shè)備將按照語音交互的方式在軟硬件層面重新設(shè)計并引導(dǎo)用戶交互模式和使用習(xí)慣的變革,可穿戴設(shè)備將是未來智能語音應(yīng)用的一個重要領(lǐng)域。