高通在機器學(xué)習(xí)領(lǐng)域的探索可以追溯到2007年,自那時起,高通就開始了面向計算機視覺和運動控制應(yīng)用的機器學(xué)習(xí)脈沖神經(jīng)方法研究,隨后,其研究范圍從仿生方法拓展到了人工神經(jīng)網(wǎng)絡(luò),也就是深度學(xué)習(xí)領(lǐng)域。而就在上個月,高通還參與投資了一家位于美國的人工智能公司Brain Corp。20170829-AI-2

人工智能正向終端遷移

終端側(cè)人工智能是高通最近在多個場合反復(fù)提及的詞匯。根據(jù)Jeff Gehlhaar的表述,移動終端正成為全球最普遍的人工智能平臺。數(shù)據(jù)顯示,未來5年全球智能手機的累計出貨量將超過85億部,這也是移動終端將成為全球最普遍人工智能平臺的原因。Qualcomm一直以來在移動領(lǐng)域擁有領(lǐng)導(dǎo)地位,這為他們提供了利用已有的規(guī)模和機會,去促進手機和毗鄰領(lǐng)域發(fā)展的機會。20170829-AI-3移動領(lǐng)域的規(guī)模化,成為了Qualcomm將人工智能帶給大眾的基石。加之不可阻擋的物聯(lián)網(wǎng)趨勢和即將到來的5G時代,使得高通認為智能互聯(lián)所需要的計算能力正通過云端分布到設(shè)備端。因此,高通提出的AI愿景將更專注于幫助智能手機、汽車和機器人等廣泛而普及的海量終端實現(xiàn)人工智能,以確保在有無網(wǎng)絡(luò)或Wi-Fi連接的情況下都能夠完成處理。其優(yōu)勢包括即時響應(yīng)、可靠性提升、隱私保護增強,以及高效利用網(wǎng)絡(luò)帶寬。20170829-AI-4“我們于十年前就開始了基礎(chǔ)研究,目前我們的現(xiàn)有產(chǎn)品支持了許多人工智能用例:從計算機視覺和自然語言處理,到各種終端,如智能手機和汽車上的惡意軟件偵測。同時,我們正在研究更廣泛的課題,例如面向無線連接、電源管理和攝影的人工智能。”Jeff Gehlhaar說未來Qualcomm 將持續(xù)推進人工智能研究,把先進的機器學(xué)習(xí)技術(shù)帶到業(yè)界最前沿,具體工作將包括:  針對半監(jiān)督和無監(jiān)督訓(xùn)練,如生成式對抗網(wǎng)絡(luò)(GANs)、分布式學(xué)習(xí)和隱私保護,提升神經(jīng)網(wǎng)絡(luò)技術(shù);  面向終端側(cè)應(yīng)用的網(wǎng)絡(luò)優(yōu)化,包括壓縮、層間優(yōu)化、稀疏優(yōu)化,以及更好地利用內(nèi)存和空間/時間復(fù)雜度的其他技術(shù);  以及專門的硬件架構(gòu),旨在加速機器學(xué)習(xí)運算,從而在嵌入式終端上帶來更佳性能和更低功耗。

但他同時也指出,對于終端側(cè)人工智能而言,人工智能需要的大量密集計算與終端所能承受的功耗和熱效率,是業(yè)界無法回避的巨大挑戰(zhàn)。而高效的硬件、算法改進和軟件工具將是高通應(yīng)對挑戰(zhàn)的三把利器。“對Qualcomm來說,我們的算法優(yōu)化和提升主要包括壓縮、層間優(yōu)化和稀疏優(yōu)化等;軟件方面,Qualcomm一方面提供自己的軟件工具以支持在終端側(cè)進行的人工智能,同時也和生態(tài)系統(tǒng)里的合作伙伴合作,支持TensorFlow、Caffe、Caffe2以及一些未來即將發(fā)布的框架。”20170829-AI-5

人工智能硬件的未來會是怎樣?

為了向更多行業(yè)(包括移動、汽車、醫(yī)療健康、安全與圖像)的開發(fā)者提供他們所需的工具,以實現(xiàn)終端側(cè)的、由神經(jīng)網(wǎng)絡(luò)驅(qū)動的用戶體驗,2016年,高通正式發(fā)布了Qualcomm驍龍神經(jīng)處理引擎(Neural Processing Engine, NPE) SDK,開發(fā)者可充分利用該SDK實現(xiàn)諸如情景探測、面部識別、自然語言理解、物體追蹤與規(guī)避、手勢和文本識別等深度學(xué)習(xí)用戶體驗。

該SDK基于分布式架構(gòu),目前可支持驍龍600和800系列平臺,以及TensorFlow、Caffe、Caffe2和一些即將發(fā)布的框架,可以讓深度神經(jīng)網(wǎng)絡(luò)引擎運行在驍龍異構(gòu)平臺的CPU、GPU、DSP等各個單元上。未來,再利用5G無線通信技術(shù),就可以實現(xiàn)終端側(cè)與云之間的人工智能配合和連接。20170829-AI-6首款整合驍龍神經(jīng)處理引擎SDK的公司之一是Facebook,目前正在使用它來加速其移動應(yīng)用程序中的增強型現(xiàn)實過濾器。數(shù)據(jù)顯示,通過使用神經(jīng)處理引擎,F(xiàn)acebook的過濾器速度比通用CPU實現(xiàn)方案要快5倍,在拍攝照片和直播視頻時,可實現(xiàn)更流暢、無縫且逼真的AR特性應(yīng)用。

智能駕駛是Jeff Gehlhaar列舉的另一個典型的終端側(cè)AI應(yīng)用場景。在CES 2017上,Qualcomm展示了采用驍龍820Am處理器的Qualcomm Drive Data平臺。這是一個數(shù)據(jù)收集和分析平臺,可以通過車上的傳感器(前置攝像頭、后視攝像頭、雷達等)收集汽車的大量信息,用于實現(xiàn)車輛管理與地圖生成等功能。

該汽車技術(shù)平臺的重要組成部分便是基于終端的機器學(xué)習(xí)(on-device machine learning)。Qualcomm Drive Data平臺采用了驍龍820Am汽車處理器,支持汽車隨時隨地、精確地判斷城市街道的水平精確度(lane-level accuracy),以此來實現(xiàn)精準(zhǔn)的定位。其次,通過集成X12 LTE調(diào)制解調(diào)器,它還可以連接至云端。除此之外,它還支持基于云端處理的地圖和數(shù)據(jù)應(yīng)用。以上這些都是Qualcomm通過Qualcomm Drive Data平臺所展示的技術(shù)。

通常來說,汽車中的很多應(yīng)用都會收集大量數(shù)據(jù),然后在云端進行機器學(xué)習(xí)處理,比如判斷交通路況、交通信號燈、車道偵測等。事實上,我們可以篩選掉某些不相關(guān)的數(shù)據(jù),僅僅把交通路況和環(huán)境視頻等需要的數(shù)據(jù)上傳至云端。因為驍龍820Am處理器的性能十分強大,它集成了定位、機器學(xué)習(xí)、連接等多項出色特性,有很多數(shù)據(jù)就可以在終端上進行處理。

此外,對于用戶關(guān)心的“安全和用戶隱私保護”,Jeff Gehlhaar表示,“高通與谷歌合作,研究了幾種技術(shù),我們相信這些技術(shù)將引領(lǐng)發(fā)展方向,而這些想法彼此間也都有一定的聯(lián)系。其中一個想法是,讓多臺終端一起作為整體協(xié)同學(xué)習(xí),這樣就沒有一臺終端能獲取所有的數(shù)據(jù)。第二個想法叫做隱私保護深度學(xué)習(xí)(privacy preserving deep learning),可以保證數(shù)據(jù)只提供給訓(xùn)練模型,從而保護數(shù)據(jù)隱私,同時也保護數(shù)據(jù)所有人的個人信息。用戶可以在不被泄露個人信息的情況下放心地分享數(shù)據(jù)。”