今年我國(guó)興起人工智能浪潮,很多人工智能公司都創(chuàng)下巨額的融資記錄,例如曠視、商湯、依圖、中科視拓等是公司。然而很多人不知道的是,這幾家公司都與微軟亞洲研究院有著深厚的淵源。中科視拓的董事長(zhǎng)兼CTO山世光、曠視科技首席科學(xué)家孫劍是前微軟亞洲研究院院長(zhǎng)沈向洋的團(tuán)隊(duì)成員、博士生;依圖科技的創(chuàng)始人兼CEO朱瓏是前微軟亞洲研究院副院長(zhǎng)張宏江的學(xué)生;商湯科技創(chuàng)始人湯曉鷗曾是微軟亞洲研究院視覺(jué)計(jì)算組資深研究員。電子制作模塊
機(jī)器也有情商?微軟對(duì)話式人工智能
可以看到,很多從微軟亞洲研究院走出去的人才都涌向人臉識(shí)別領(lǐng)域,而現(xiàn)在微軟研究院似乎并沒(méi)有沿著這個(gè)方向走,他們最為人熟知的是對(duì)話式人工智能。在微軟看來(lái),計(jì)算機(jī)在對(duì)話能力和情感理解能力方面仍然遠(yuǎn)遠(yuǎn)落后于人類,因此在2014年開始就研發(fā)微軟小冰,是一款基于情感計(jì)算框架、以情商為主要方向的對(duì)話式人工智能。那么,目前微軟的對(duì)話式人工智能到底進(jìn)展到哪一步了呢?微軟中國(guó)區(qū)首席技術(shù)顧問(wèn)管震近日在一個(gè)人工智能論壇上做出精彩分享,表示機(jī)器開始學(xué)習(xí)人的情緒,來(lái)滿足各種需求。微軟小冰在全球范圍內(nèi),與數(shù)億人類進(jìn)行了旨在建立情感連接的對(duì)話,總計(jì)對(duì)話量已超過(guò)300億輪。
此外,基于人工智能的深度學(xué)習(xí)和大量數(shù)據(jù),微軟小冰還能勝任主持人,甚至是創(chuàng)作文學(xué)作品。目前小冰已經(jīng)創(chuàng)作出200首詩(shī),部分作品發(fā)表在詩(shī)集《陽(yáng)光失了玻璃窗》中。這也是人類史上第一部完全由人工智能創(chuàng)作的詩(shī)集。
微軟在對(duì)話式人工智能這方向深入研究,已經(jīng)走了很遠(yuǎn)的距離。但是對(duì)于創(chuàng)業(yè)型的機(jī)器人公司而言,千萬(wàn)不要一上來(lái)就想研發(fā)另一個(gè)微軟小冰。管震表示,小冰是面向消費(fèi)者的對(duì)話式人工智能,微軟花費(fèi)了大量的人力財(cái)力,并與很多企業(yè)合作,灌輸了大量的數(shù)據(jù)之后才有了目前的成績(jī)。創(chuàng)業(yè)型機(jī)器人公司應(yīng)該將有限的人力財(cái)力投入到特定情景的服務(wù)型機(jī)器人當(dāng)中,訓(xùn)練對(duì)應(yīng)情景的知識(shí)地圖。例如在醫(yī)院負(fù)責(zé)掛號(hào)導(dǎo)流的服務(wù)型機(jī)器人,其服務(wù)對(duì)象是病人,只需具備理解病人的病癥并導(dǎo)流到指定科室的能力,查詢天氣、娛樂(lè)、生活百科式的問(wèn)答是不必要的。
服務(wù)型對(duì)話機(jī)器人可以快速響應(yīng)用戶,提供24小時(shí)服務(wù);標(biāo)準(zhǔn)化的話術(shù)減少了前臺(tái)的服務(wù)培訓(xùn)時(shí)間。那么如何從零開啟創(chuàng)建一個(gè)對(duì)話機(jī)器人呢?管震表示,對(duì)話機(jī)器人大致分為用戶交互入口、用戶意圖理解、調(diào)用響應(yīng)服務(wù)三個(gè)步驟。
其中用戶意圖理解涉及到到自然語(yǔ)言的理解,例如在復(fù)雜的上下文語(yǔ)境下,要連貫起來(lái)理解用戶表達(dá)的意思。據(jù)說(shuō)微軟小冰最多能聯(lián)系23句上下文的意思,但是水平還需大大提高。微軟可提供Congnitive Services(LUIS)技術(shù)幫助開發(fā)者實(shí)現(xiàn)自然語(yǔ)言的理解。
管震指出,微軟只是提供一個(gè)標(biāo)準(zhǔn)的對(duì)話式機(jī)器人框架,開發(fā)者需要訓(xùn)練特定情景的知識(shí)地圖。盡管微軟語(yǔ)言識(shí)別的錯(cuò)誤率已經(jīng)非常低了,2016年微軟宣布英語(yǔ)的語(yǔ)音識(shí)別轉(zhuǎn)錄詞錯(cuò)率僅 5.9%,達(dá)到了專業(yè)速錄員水平超越了人類。但是在特定的情景下,如面向3-6歲兒童的陪伴型機(jī)器人,兒童的表述能力不強(qiáng),語(yǔ)音識(shí)別錯(cuò)誤率必然會(huì)升高。因此,開發(fā)者不能照搬微軟的標(biāo)準(zhǔn)化平臺(tái),而是要訓(xùn)練兒童對(duì)話場(chǎng)景下的知識(shí)地圖和認(rèn)知能力。
驍龍845移動(dòng)平臺(tái),主導(dǎo)終端側(cè)人工智能
智能語(yǔ)音的應(yīng)用也越來(lái)越多,過(guò)往移動(dòng)設(shè)備的AI由于大數(shù)據(jù)的需要較多依賴云端,例如微軟的對(duì)話式人工智能更多的是基于云端的大數(shù)據(jù)、大運(yùn)算能力。但目前有一個(gè)趨勢(shì)是云端的運(yùn)算能力開始往端上遷移,以進(jìn)一步提升效率,同時(shí)可靠性和用戶隱私數(shù)據(jù)也得到更高保障。
高通是踐行終端側(cè)人工智能的先行者之一,近日推出最新的驍龍845移動(dòng)平臺(tái),終端側(cè)智能是高通反復(fù)強(qiáng)調(diào)的認(rèn)知。高通在與華為的麒麟970芯片不同,驍龍845并沒(méi)有內(nèi)置單獨(dú)的NPU(神經(jīng)單元),而是綜合部署,將AI處理功能分散在845平臺(tái)的異構(gòu)架構(gòu)中。高通也在這方面強(qiáng)調(diào),通過(guò)模塊內(nèi)之間的調(diào)用,可以達(dá)到更有針對(duì)性的AI操作。
高通產(chǎn)品市場(chǎng)總監(jiān)Dennis Liu在“人工智能解決方案”的主題演講中表示,終端側(cè)的人工智能得以發(fā)展取決于三個(gè)關(guān)鍵的技術(shù)。一是高效硬件(處理器的運(yùn)算能力);二是算法改進(jìn)(在終端運(yùn)算的資源有限的前提下,想要保證精度必須使算法更簡(jiǎn)潔);三個(gè)軟件工具(嵌入式設(shè)備接口很多,如何在復(fù)雜的編程環(huán)境下快速部署算法,軟件工具是關(guān)鍵)。
Dennis Liu透露,OPPO R11、VIVO 20、小米6、一加5等手機(jī)都用到了高通的人工智能功能。 驍龍神經(jīng)處理引擎通過(guò)軟件來(lái)加速終端側(cè)執(zhí)行的深度學(xué)習(xí)網(wǎng)絡(luò),支持智能手機(jī)實(shí)現(xiàn)流暢的解鎖和面部識(shí)別體驗(yàn),并支持在照片上增添人像模式或?qū)崿F(xiàn)實(shí)時(shí)背景虛化。
據(jù)了解,驍龍神經(jīng)處理引擎(SNPE)SDK除了已支持Google TensorFlow和Facebook Caffe / Caffe2框架之外,現(xiàn)在還支持Tensorflow Lite和新的ONNX,幫助開發(fā)者輕松使用他們所選擇的框架,包括Caffe2、CNTK和MxNet。驍龍845還支持Google Android NN API。
除了高通最擅長(zhǎng)的智能手機(jī)領(lǐng)域,驍龍845在VR/AR等產(chǎn)品也頗有建樹。驍龍845是首款支持室內(nèi)空間定位(room-scale)六自由度(6DoF)和即時(shí)定位與地圖構(gòu)建(SLAM)的移動(dòng)平臺(tái)。簡(jiǎn)單來(lái)說(shuō),在使用驍龍845處理器玩虛擬顯示產(chǎn)品時(shí)通過(guò)攝像頭可以檢測(cè)到周邊的環(huán)境,包括對(duì)手實(shí)時(shí)跟蹤,并識(shí)別前方障礙物提醒用戶,提升VR沉浸式用戶體驗(yàn)。
你了解你的膚質(zhì)嗎?基于圖像的膚質(zhì)檢測(cè)技術(shù)
皮膚是人的第二張臉,越來(lái)越多的人對(duì)自己的膚質(zhì)情況密切關(guān)注。但目前的人工識(shí)別技術(shù)大多應(yīng)用在安防、手機(jī)解鎖、支付上面,主要任務(wù)是將人臉識(shí)別出來(lái),沒(méi)有將人臉上的膚質(zhì)進(jìn)行進(jìn)一步的分析。和而泰的數(shù)據(jù)與人工智能實(shí)驗(yàn)室就在研究基于圖像的膚質(zhì)檢測(cè)技術(shù),是人臉識(shí)別技術(shù)相對(duì)是垂直的研究方向。和而泰副總裁王宏表示,目前可以提供豐富、精細(xì)的檢測(cè)維度,包括臉型、眉型、膚色、黑頭/毛孔、皺紋等等。
和而泰已經(jīng)在京東眾籌上發(fā)布了一款智能膚質(zhì)檢測(cè)儀,不過(guò)王宏表示,目前智能硬件的市場(chǎng)接受度比較低,因此主要通過(guò)手機(jī)攝像頭這個(gè)超級(jí)傳感器去開拓市場(chǎng)。
通過(guò)手機(jī)拍攝的人臉圖片,手機(jī)APP可快速精準(zhǔn)的檢測(cè)出眼周、臉部、手部等區(qū)域的皮膚水分、油分等肌膚參數(shù),并且針對(duì)數(shù)據(jù)進(jìn)行智能分析,提供針對(duì)每個(gè)人膚質(zhì)不一樣的定制化改善方案,包括護(hù)膚建議、飲食建議、保養(yǎng)建議等。
膚質(zhì)檢測(cè)減技術(shù)的檢測(cè)流程包括圖像采集-圖像預(yù)處理-圖像模型(傳統(tǒng)模型、深度模型)-識(shí)別結(jié)果。王宏表示,膚質(zhì)檢測(cè)技術(shù)目前還處于研究階段,并分享了兩個(gè)技術(shù)難點(diǎn)。
一是在圖像采集階段,如何得到一張高質(zhì)量的圖片,亮度和距離都要合適。為了保證圖像的亮度,以及人臉可識(shí)別區(qū)域的面積,需要在圖像采集時(shí)在前端做亮度和距離的檢測(cè),判斷拍照姿勢(shì)、角度、距離正不正確,指導(dǎo)用戶拍照得到高質(zhì)量的照片。此外在圖像預(yù)處理階段也要調(diào)節(jié)圖像的亮度,從而捕捉到臉部更多的細(xì)節(jié)。
二是數(shù)據(jù)標(biāo)注階段,分為定義數(shù)據(jù)類別、數(shù)據(jù)標(biāo)注、數(shù)據(jù)檢測(cè)三個(gè)步驟。對(duì)于非專業(yè)人員可以輕易辨識(shí)的數(shù)據(jù),采取抽樣交叉標(biāo)注的方式;對(duì)于毛孔、黑頭等皮膚問(wèn)題的數(shù)據(jù),需要與專業(yè)人員(醫(yī)生)合作,花費(fèi)大量的時(shí)間去標(biāo)注數(shù)據(jù)。此外,人臉膚質(zhì)情況屬于個(gè)人隱私,如何得到大量的膚質(zhì)數(shù)據(jù)也是個(gè)難題。
其實(shí),在深圳地鐵站的面膜智能售賣機(jī)上,已經(jīng)有免費(fèi)膚質(zhì)檢測(cè)的功能。機(jī)器會(huì)檢測(cè)并顯示出用戶的膚質(zhì)情況,并建議用戶買哪一款面膜。這種商業(yè)模式其實(shí)相當(dāng)不錯(cuò),但問(wèn)題在于膚質(zhì)檢測(cè)的結(jié)果并不準(zhǔn)確,多次檢測(cè)的結(jié)果甚至大相徑庭。當(dāng)檢測(cè)結(jié)果不精準(zhǔn)沒(méi)有權(quán)威性的時(shí)候,自然不會(huì)有太多消費(fèi)者買單。希望能更多像和而泰這樣的企業(yè)研究膚質(zhì)檢測(cè)技術(shù),協(xié)同傳感器、AI芯片、算法公司、方案商、終端企業(yè)等產(chǎn)業(yè)鏈上下游共同推進(jìn)該技術(shù)的發(fā)展。