或許您還沒有聽說過,2017年已經(jīng)被稱為“語(yǔ)音介面年”了。從年初美國(guó)拉斯維加斯國(guó)際消費(fèi)電子展(CES)的“語(yǔ)音啟動(dòng)”成為最受矚目的焦點(diǎn)開始,話題持續(xù)延燒到年中在上海舉行的世界行動(dòng)通訊大會(huì)(MWC)。這一稱號(hào)并進(jìn)一步受到多家網(wǎng)際網(wǎng)路和技術(shù)巨擘的加持,他們不斷加入競(jìng)賽行列并推出以智能揚(yáng)聲器為基礎(chǔ)的個(gè)人語(yǔ)音助理。

美國(guó)的智能揚(yáng)聲器

自從2014年亞馬遜(Amazon)智能揚(yáng)聲器Echo推出以來,這個(gè)市場(chǎng)一直呈指數(shù)級(jí)成長(zhǎng)。根據(jù)audioxpress.com,在美國(guó),智能揚(yáng)聲器占家庭音訊硬體類別的30%。預(yù)計(jì)未來幾年將持續(xù)成長(zhǎng),到2020年將可達(dá)到1億美元的規(guī)模,其中75%的美國(guó)家庭將擁有智能揚(yáng)聲器。

Google Home揚(yáng)聲器自去年發(fā)布后,成功地占據(jù)了一定的市場(chǎng)份額,但仍遠(yuǎn)落后于Echo。根據(jù)eMarketer US對(duì)2017年的預(yù)測(cè),Amazon Echo揚(yáng)聲器將擁有70.6%的市占率,Google Home約達(dá)到23.8%,而剩下的市場(chǎng)將分布于聯(lián)想(Lenovo)、Harman Kardon和LG等市占率更小的參與業(yè)者。20170912-AI-1圖1:技術(shù)領(lǐng)域的各大巨擘現(xiàn)正競(jìng)相爭(zhēng)奪您咖啡桌上的一小塊圓形空間 (來源:Reuters/Harman Kardon)

不過,在Apple發(fā)布其高價(jià)位的高階揚(yáng)聲器——HomePod后,這個(gè)情況即將發(fā)生重大變化。微軟(Microsoft)也將加入這場(chǎng)競(jìng)賽,但它并非打造自家的揚(yáng)聲器,而是即將推出一款名為Invoke的Harman Kardon裝置,由Cortana提供支援。今年初,進(jìn)軍該市場(chǎng)的另一重點(diǎn)是Lenovo的Smart Assistant揚(yáng)聲器,它將會(huì)是Amazon Alexa的新主人。使用者現(xiàn)在可以選擇任何一款由Alexa智能語(yǔ)音服務(wù)提供支援、但不一定由Amazon制造的裝置產(chǎn)品。Lenovo揚(yáng)聲器的音響系統(tǒng)也將由Harman Kardon支援。

中文智能揚(yáng)聲器為全球1/5人口敞開大門

同時(shí),在中國(guó),阿里巴巴(Alibaba)宣布推出Tmall Genie X1,正式進(jìn)軍智能家庭揚(yáng)聲器市場(chǎng)。

Tmall Genie X1It預(yù)計(jì)不久即將上市,價(jià)格大約75美元,比美國(guó)各種裝置更便宜得多。不過,中國(guó)市場(chǎng)本身已經(jīng)開始競(jìng)爭(zhēng)了。阿里巴巴的競(jìng)爭(zhēng)對(duì)手之一—線上零售業(yè)的后起之秀——京東商城(JD)與iFlytek合作,在去年發(fā)表玲瓏叮咚系列智能揚(yáng)聲器。

中國(guó)搜尋引擎巨擘——百度(Baidu)則與硬體公司AiNemo合作,在智能揚(yáng)聲器領(lǐng)域搭建略有不同的選擇。這款稱為L(zhǎng)ittle Fish的裝置是由百度的語(yǔ)音啟動(dòng)作業(yè)系統(tǒng)(OS)——DuerOS提供支援。它與迄今討論的其他產(chǎn)品不同之處在于配備了熒幕和相機(jī)。智能機(jī)器人可以追蹤使用者的臉部,并使用臉部辨識(shí)功能驗(yàn)證線上購(gòu)物。它還可以顯示資訊和影像,以回應(yīng)使用者的查詢。20170912-AI-2圖2:百度推出配備熒幕和相機(jī)的智能揚(yáng)聲器,可以在房間周圍對(duì)您進(jìn)行追蹤 (來源:Baidu)

這與Amazon Echo產(chǎn)品系列的最新產(chǎn)品Echo Show有點(diǎn)類似。但相對(duì)于Little Fish,Echo Show并不能移動(dòng),所以無法在房間周圍進(jìn)行追蹤。您甚至也無法手動(dòng)更改熒幕的角度,所以它的限制非常多,但這是美國(guó)第一款配備熒幕的智能揚(yáng)聲器。因此,當(dāng)我們看到越來越多模仿原始Amazon Echo的產(chǎn)品出現(xiàn)時(shí),Amazon本身正開始轉(zhuǎn)向新功能。

技能組合是語(yǔ)音助理的差異化關(guān)鍵嗎?

這個(gè)市場(chǎng)的競(jìng)賽還處于早期階段,而產(chǎn)品彼此間的相似程度令人驚訝。除了些微的設(shè)計(jì)不同,裝置的外觀幾乎沒有任何差異,只有在內(nèi)部出現(xiàn)一些更有趣的區(qū)別。麥克風(fēng)的數(shù)量存在相當(dāng)大的變化,從Google Home中只用了兩支麥克風(fēng)(執(zhí)行遠(yuǎn)場(chǎng)語(yǔ)音提取的最小要求),到Lenovo Assistant支援高達(dá)8支麥克風(fēng)。揚(yáng)聲器的數(shù)量和品質(zhì)也不盡相同,在Lenovo和Apple即將推出的產(chǎn)品中,嘗試透過多聲道高音擴(kuò)音器、室內(nèi)校正和音訊波束成形等技術(shù),從而將音訊提升到大幅超越Amazon和Google現(xiàn)有產(chǎn)品的水準(zhǔn)。

揚(yáng)聲器背后的智能控制差異更為明顯。人工智能(AI)平臺(tái)在技能組合和可執(zhí)行的任務(wù)方面并不完全相同。Alexa已經(jīng)取得了15,000多種技能,遠(yuǎn)勝于任何競(jìng)爭(zhēng)對(duì)手的產(chǎn)品。根據(jù)Voicebot的說法,Google Home排名第二,僅支援378種技能。就技能組合而言,未來可能會(huì)是一大賣點(diǎn)以及差異化的因素。

另一個(gè)重要方面是基礎(chǔ)AI平臺(tái)的“智能程度”。能夠?qū)υ?、理解語(yǔ)言的情境以及回答后續(xù)問題就是很好的例子。衡量這一點(diǎn)比計(jì)算技能更困難,但Google Assistant在這方面可能就超越Alexa了。一般來說,像Google和百度等搜尋巨擘可以取得大量的資料,在深度學(xué)習(xí)方面更有優(yōu)勢(shì),這將有助于其日后的發(fā)展。

目前,AI平臺(tái)和實(shí)體揚(yáng)聲器已經(jīng)整合了,很快地就會(huì)發(fā)生變革。由于Amazon和Google已經(jīng)向第三方裝置開放其服務(wù)了,因此,揚(yáng)聲器硬體本身的設(shè)計(jì)對(duì)任何人都是開放的。只需借由足以實(shí)現(xiàn)遠(yuǎn)場(chǎng)語(yǔ)音拾音功能的解決方案,任何裝置都可以透過API連接到所選擇的個(gè)人助理,并提供智能語(yǔ)音服務(wù)。這為芯片和裝置制造商開啟了大量的機(jī)會(huì)來建構(gòu)智能揚(yáng)聲器硬體,以把握任何市場(chǎng)機(jī)遇。至于Apple,同樣地,該公司仍將Siri保留在自家硬體中。

打造具成本效益的低功耗SoC方案

綜合上述的所有要點(diǎn),我認(rèn)為這標(biāo)志著第二波智能揚(yáng)聲器的沖擊。在第二波周期,裝置制造商使用相同的幾種個(gè)人助理平臺(tái),致力于降低成本并實(shí)現(xiàn)大量市場(chǎng)。為此,他們必須在功能特性和使用者體驗(yàn)之間找到最佳平衡,同時(shí)保持具競(jìng)爭(zhēng)力的價(jià)格。此外,市場(chǎng)領(lǐng)導(dǎo)廠商將嘗試提升平臺(tái)的技能和智能程度,并推出新的特性功能(如熒幕和相機(jī)),以取得不同程度成功。就像十年前的智能型手機(jī)平臺(tái)戰(zhàn)爭(zhēng)一樣,盡管導(dǎo)致許多變化,最終將融合于消費(fèi)者的達(dá)爾文“適者生存”選擇。

語(yǔ)音介面市場(chǎng)正蓬勃發(fā)展中,預(yù)計(jì)還有更多的公司加入。觀察Lenovo揚(yáng)聲器和Invoke也將特別有趣,因?yàn)檫@象征著語(yǔ)音助理本身及其消費(fèi)應(yīng)用產(chǎn)品之間“分道揚(yáng)鑣”的開始。