2015年,正是人工智能在中國剛剛熱起來的時(shí)候。在這一年,百度智能駕駛的創(chuàng)始人余凱選擇離開百度,找了一群業(yè)界大牛,包括百度IDL主任架構(gòu)師黃暢、Facebook Fair創(chuàng)始人楊銘、前諾基亞副總裁方懿、前華為芯片架構(gòu)師周峰共同創(chuàng)辦了地平線機(jī)器人,要做中國產(chǎn)的人工智能芯片。這個(gè)團(tuán)隊(duì)做出了很多世界級(jí)的研究成果,包括在2014年,作出世界第一款人臉檢測芯片,被80%的數(shù)碼相機(jī)的廠商,包括索尼、蘋果等在采用。科學(xué)實(shí)驗(yàn)?zāi)K
人工智能已經(jīng)成為未來5~10年最具顛覆性的產(chǎn)業(yè)機(jī)會(huì),從PC互聯(lián)網(wǎng)到移動(dòng)互聯(lián)網(wǎng),先后成長起來了CSCO、雅虎、谷歌、Facebook、蘋果這樣的科技巨頭。而人工智能時(shí)代,又有新的玩家可能會(huì)走上業(yè)界巔峰。2015年,正是人工智能在中國剛剛熱起來的時(shí)候。在這一年,百度智能駕駛的創(chuàng)始人余凱選擇離開百度,找了一群業(yè)界大牛,包括百度IDL主任架構(gòu)師黃暢、Facebook Fair創(chuàng)始人楊銘、前諾基亞副總裁方懿、前華為芯片架構(gòu)師周峰共同創(chuàng)辦了地平線機(jī)器人,要做中國產(chǎn)的人工智能芯片。這個(gè)團(tuán)隊(duì)做出了很多世界級(jí)的研究成果,包括在2014年,作出世界第一款人臉檢測芯片,被80%的數(shù)碼相機(jī)的廠商,包括索尼、蘋果等在采用。地平線機(jī)器人技術(shù)創(chuàng)始人余凱
余凱表示,地平線的團(tuán)隊(duì)很多來自互聯(lián)網(wǎng)軟件行業(yè),以前是做深度學(xué)習(xí)和機(jī)器學(xué)習(xí),但是軟件到一定階段硬件成為了瓶頸,于是自己來做硬件。
成立兩年之后,余凱在今年年初的發(fā)布會(huì)上說出了地平線的目標(biāo):地平線將主攻ADAS和自動(dòng)駕駛解決方案,同時(shí)要建設(shè)業(yè)界最大的駕駛數(shù)據(jù)庫,預(yù)計(jì)到201年數(shù)據(jù)變現(xiàn)業(yè)務(wù)將會(huì)變成千萬美金級(jí)別的生意。
在日前舉行的青城山中國IC生態(tài)高峰論壇上,余凱闡述了他眼中的人工智能產(chǎn)業(yè)以及芯片的未來趨勢。
人工智能芯片的工作原理?
科技行業(yè)的人都熟悉摩爾定律,但是我們今天要講的是新摩爾定律。由于人工智能的應(yīng)用、場景的驅(qū)動(dòng)導(dǎo)致在軟件架構(gòu)方面會(huì)產(chǎn)生重構(gòu),使得應(yīng)用到人工智能的處理器被重新定義。更強(qiáng)大的工藝和更先進(jìn)的性能在人工智能芯片領(lǐng)域不再奏效,人工智能芯片需要許多特殊的計(jì)算模式,比如卷積計(jì)算、低規(guī)計(jì)算。相比傳統(tǒng)的數(shù)據(jù)中心,人工智能芯片最大的不同是模仿人腦。人的大腦的處理速度是很慢的,但是為什么可以一心二用,可以進(jìn)行復(fù)雜的問題思考,可以針對(duì)不同的特殊問題做特殊處理呢?舉一個(gè)例子:大腦對(duì)漢字的識(shí)別順序是不敏感的,上圖的字讀到最后才知道這個(gè)順序是亂的,為什么會(huì)這樣?大腦對(duì)一些特殊的問題,做了特殊的加速。在空間上是并行處理,所以對(duì)這個(gè)順序是不敏感的。由于人工智能芯片針對(duì)特定問題進(jìn)行專門的算法及設(shè)計(jì),使得芯片處理效率獲得兩到三個(gè)數(shù)量級(jí)的提升,這恰恰是最近幾年芯片業(yè)的一個(gè)趨勢。從2011年開始,Google采用CPU來做人工智能算法,到2012年百度用GPU,2014年百度和微軟用FPGA做深度神經(jīng)網(wǎng)絡(luò)的加速同時(shí)部署了上萬臺(tái)的服務(wù)器。2015年2016年地平線創(chuàng)立要做BPU,2016年谷歌說要做第一代TPU。從這里看到的趨勢就是人工智能應(yīng)用的牽引下,使得整個(gè)處理器不斷的重構(gòu)。從時(shí)間維度來看,我們看到PC到移動(dòng)終端到IOT,對(duì)PC和移動(dòng)的要求越來越高。所以處理器的趨勢是從中心到邊緣,以前很多人工智能的計(jì)算是在數(shù)據(jù)中心,以后大量的計(jì)算在邊緣計(jì)算。所以未來業(yè)界的發(fā)展趨勢是可以在移動(dòng)終端進(jìn)行本地的人工智能計(jì)算。而這些計(jì)算需要低延時(shí)、低功耗、低成本、數(shù)據(jù)安全性,相比傳統(tǒng)的處理器要求更高。第三個(gè)趨勢是邊緣的競賽是更高、更快、更強(qiáng)。比如特斯拉的車每輛車8~12個(gè)camera,探測距離和對(duì)像素解析越來越高,所以會(huì)不斷從720P到1080P到4K視頻,對(duì)于處理性能要求越來越高。
為何要使用專門的人工智能芯片?
“自動(dòng)駕駛是一個(gè)比下圍棋更復(fù)雜的過程,下圍棋是只有兩個(gè)人在博弈,而自動(dòng)駕駛是你跟道路環(huán)境博弈,這里面的決策導(dǎo)致的計(jì)算復(fù)雜度,是超出我們的想象,”余凱表示。這張圖是目前人工智能芯片的競爭格局。英偉達(dá)是最先收益的公司,在2年內(nèi)市值從100億美金變成了900億美金。相對(duì)而言英特爾的CPU對(duì)于人工智能應(yīng)用的處理效率太低。而專用的芯片如谷歌的TPU以及地平線的BPU都具有很大的優(yōu)勢。可以看到Nvidia的處理能力是最高的,但是效率其實(shí)并不怎么樣。現(xiàn)在整個(gè)業(yè)界都在往效率方面提高。這個(gè)領(lǐng)域我們的處理器包括google的TPU都做到了。地平線的BPU邏輯是跟谷歌的TPU思路很像。與很多硬件公司不一樣,地平線特別注重軟件系統(tǒng),地平線就構(gòu)造了面向自動(dòng)駕駛建設(shè)的軟件平臺(tái)Hugo,這是一個(gè)基于深度學(xué)習(xí)的系統(tǒng)。提供從感知一直到動(dòng)態(tài)的決策,從端到端的深度學(xué)習(xí),到后面面向增強(qiáng)學(xué)習(xí)的決策。
中國本土的人工智能芯片:盤古
這是地平線跟INTEL在今年CES上展示的基于處理器架構(gòu)的FPGA平臺(tái),用8瓦功耗做到在復(fù)雜環(huán)境下超時(shí)幀的處理。目前沒有一款其它的處理器能支持實(shí)時(shí)的計(jì)算。與IP提供商芯原一起合作,地平線推出的盤古處理器應(yīng)用非常廣泛。包括處理的Mobile eye的軟件,跟Nivdia的芯片相比,盤古處理器可以針對(duì)中國的復(fù)雜路況進(jìn)行處理。相比英偉達(dá)的處理器可以做到30個(gè)人臉的實(shí)時(shí)的抓拍,地平線可以做到250個(gè)人臉,而功耗是其十分之一。這是地平線的第二代芯片,要做到像素級(jí)的識(shí)別。對(duì)遮擋和形變,各種不規(guī)則的形狀和物體,都有非常準(zhǔn)確的識(shí)別。據(jù)介紹,盤古第三代的處理器不光是像素級(jí)的,而是動(dòng)態(tài)、3維的場景。這個(gè)對(duì)于自動(dòng)駕駛的路徑規(guī)劃是至關(guān)重要的。包括在高速公路上,包括可行駛區(qū)域,包括車道線和車輛,包括在晚上的場景精確識(shí)別汽車,包括各種不規(guī)則的形狀的物體,都有非常準(zhǔn)確的識(shí)別性。而這種超級(jí)復(fù)雜的情況里,大概用16毫秒就可以進(jìn)行處理。