11月29日,英特爾中國(guó)研究院舉辦開放日活動(dòng),將其對(duì)于人工智能與機(jī)器人的最新Demo向與會(huì)者介紹。英特爾中國(guó)研究院院長(zhǎng)宋繼強(qiáng)率領(lǐng)團(tuán)隊(duì)分享了英特爾中國(guó)研究院對(duì)于人工智能、機(jī)器人、5G、虛擬現(xiàn)實(shí)等一系列前瞻科技領(lǐng)域的最新研究成果。
在人臉分析和情感識(shí)別方面,英特爾中國(guó)研究院稱很早便擁有最先進(jìn)的算法,并且在EmotiW比賽(自然環(huán)境下的情感識(shí)別比賽)中獲得冠軍,該算法的速度是第二名團(tuán)隊(duì)的200倍,可以應(yīng)用于無人駕駛的場(chǎng)景當(dāng)中。
讓人印象更深刻的是英特爾宣稱的HERO(英雄)平臺(tái),自主系統(tǒng)是與人工智能一直是英特爾的研究發(fā)向,HERO平臺(tái)因此應(yīng)用而生。英特爾中國(guó)研究院的目標(biāo)是推出一套基于CPU+FPGA異構(gòu)計(jì)算的自主智能機(jī)器人開發(fā)平臺(tái),幫助研究人員基于此平臺(tái)進(jìn)行開發(fā)。
之所以引入異構(gòu)平臺(tái),是因?yàn)闄C(jī)器人研究需要同時(shí)引入時(shí)間和空間計(jì)算模型。CPU作為時(shí)間計(jì)算模型的完美代表,指令按時(shí)間順序一條一條執(zhí)行,可以實(shí)現(xiàn)靈活多變的控制;加速器則更像一種空間計(jì)算模型,利用空間的并行從而一次性完成大量數(shù)據(jù)處理,使復(fù)雜的計(jì)算得到加速處理。基于這一目標(biāo),HERO智能機(jī)器人開放平臺(tái)(Heterogeneous Extensible Robot Open Platform)應(yīng)運(yùn)而生。它是英特爾中國(guó)研究院專為智能機(jī)器人(包括服務(wù)機(jī)器人、醫(yī)療機(jī)器人、自動(dòng)駕駛汽車等)打造的一套低功耗、高性能、體積小的異構(gòu)系統(tǒng)平臺(tái)方案。
在此方案中,CPU作為控制中心,與FPGA和其它專用加速器芯片(如Movidius的VPU)搭配,能夠提供高效的性能。整套HERO硬件系統(tǒng)采用了英特爾酷睿系列CPU,搭載英特爾Arria 10 GX系列1150型FPGA作為異構(gòu)加速器,能夠?qū)崟r(shí)處理大量數(shù)據(jù)并運(yùn)行多種智能算法。
顯然,這是當(dāng)前所有找到的最優(yōu)幾個(gè)解決方案之一。對(duì)于人工智能和機(jī)器人,每家大公司都有自己理解,也深刻了解其對(duì)于未來的重要性?,F(xiàn)在的麻煩之處在于,各家大公司,像英特爾、微軟和谷歌等等,很多都是基于其過往的輝煌成就和商業(yè)邏輯以及強(qiáng)勢(shì)所在,用人工智能與機(jī)器人的新瓶子去裝自家的舊酒。比如英特爾的HERO平臺(tái),如果流行開來,好處之一必然是將酷睿系列CPU將繼續(xù)輝煌,大行其道。
微軟小冰則是另外一個(gè)例子。小冰是微軟中國(guó)研究院的明星產(chǎn)品,是具有對(duì)話能力的機(jī)器人。小冰目前已經(jīng)進(jìn)化到第五代。按照有“小冰之父”之稱的研究員李笛稱,最新的第五代小冰有三個(gè)技術(shù)突破,第一是算法,第二是云計(jì)算,第三部分也是最關(guān)鍵部分,是與真實(shí)人類交互中得到的第一手?jǐn)?shù)據(jù)。微軟稱,小冰目前擁有了1億用戶,積累了超過300億的直接人機(jī)對(duì)話。這個(gè)數(shù)據(jù)量居有所有同類產(chǎn)品第一。
第五代小冰有一個(gè)技術(shù)突破,是小冰開始試著擁有高級(jí)感官,嘗試突破虛擬世界,包括可以主動(dòng)給人類打電話,叫住身邊走過的人。還有實(shí)時(shí)流媒體視覺,可以評(píng)論圖片,模擬人類感知功能。最近,微軟在上海某處放置了小冰,可以感知人的位置和移動(dòng),甚至可以理解人與人之間關(guān)系,可以主動(dòng)對(duì)身邊感知到的人說話。會(huì)唱歌、寫詩(shī),還會(huì)主持電視節(jié)目。
從語(yǔ)音切入,帶起情感和智能框架,微軟小冰走的是一條先軟后硬的路,非常具有特色,做好了,可以成為機(jī)器人的靈魂和系統(tǒng)。
不過,換一個(gè)思路來看,小冰多多少少顯示出一些當(dāng)年Windows操作系統(tǒng)橫掃多數(shù)PC的雄心。如果機(jī)器人成為未來某一個(gè)時(shí)代最新的計(jì)算平臺(tái),微軟保持著一種宏愿,小冰可以為通用的語(yǔ)音操作打前哨。這一思路讓小冰在微軟內(nèi)部頗受重視,因?yàn)檫@是微軟能聽得懂的商業(yè)邏輯。
谷歌同樣如此,發(fā)力TensorFlow,研發(fā)人工智能方面基層的人工智能學(xué)習(xí)系統(tǒng),很容易讓人想起其安卓系統(tǒng)的成功。
但是,觀察科技史上發(fā)展軌跡,一代全新的普及性技術(shù),以及由其衍生的大眾流行的產(chǎn)品,往往很少由大公司內(nèi)部孵化、孕育而出。或許有其內(nèi)在邏輯和道理——以過往的成功邏輯來硬性理解新領(lǐng)域,往往鎩羽而歸。
就像當(dāng)初英特爾錯(cuò)失移動(dòng)處理器芯片的商業(yè)機(jī)會(huì),讓高通最終脫穎而出。
就機(jī)器人本身而言,英特爾中國(guó)的機(jī)器人實(shí)在簡(jiǎn)陋。就騰訊科技現(xiàn)場(chǎng)觀察所見,基于HERO平臺(tái)的簡(jiǎn)陋機(jī)器人,沒有活動(dòng)自如的腿,只能靠?jī)芍饕惠o的輪子支撐滾動(dòng)。喚醒時(shí),在吵雜的環(huán)境下有時(shí)聽不見指令。有效接受命令后,機(jī)器人可以幫人去拿回一個(gè)瓶裝飲料。實(shí)現(xiàn)方式是行動(dòng)的滾輪機(jī)器人根據(jù)內(nèi)置的位置信息,找到另外一支機(jī)械臂,通過WIFI信號(hào)發(fā)去要拿飲料的指令,等待,然后由機(jī)械臂通過視覺識(shí)別功能,在一個(gè)柜子里準(zhǔn)確找到所需飲料,然后運(yùn)用三根指頭的手夾取飲料,最后放到滾輪機(jī)器人的盤子里。
一邊觀看時(shí)實(shí)在要為這些機(jī)器人的表演捏把汗,生怕未完成任務(wù)搞得賓主都很尷尬。