過去四年中,計算領域發生了令人驚嘆的發展。以ARM為例,在已經出貨的1000億顆基于ARM的芯片中,有500億顆是由ARM的合作伙伴在2013年到2017年間完成出貨的。“這個數字充分反映了整個行業目前對于更多計算的需求。”ARM副總裁暨計算產品事業部總經理Nandan Nayampally說,ARM的成功緣于良好的生態系統和自身架構的高拓展性,能夠覆蓋從傳感器到服務器的廣泛應用,他們將其稱之為全面計算(Total Computing)。

20170405-ARM-1Nandan Nayampally預計其合作伙伴將在2021年完成下一個1000億顆基于ARM的芯片出貨,在很大程度上這將歸功于人工智能在人們日常生活中的廣泛應用。“未來,人工智能將無處不在,數據處理能力不能完全依賴于云端,設備本身也要具有人工智能的計算能力,功耗還要更低。”為此,ARM在big.LITTLE技術基礎之上,推出了全新的DynamIQ技術。

與其將DynamIQ稱之為一種技術,倒不如將其稱之為“微架構”。ARM對DynamIQ給出的官方定義是:作為未來ARM Cortex-A系列處理器的基礎,DynamIQ代表了多核處理設計行業的轉折點,其靈活多樣性將重新定義更多類別設備的多核體驗,覆蓋從端到云的安全、通用平臺。該技術未來將被廣泛應用于汽車、家庭以及各種互聯設備中,這些設備所產生的以澤字節(ZB,一澤字節大約等于1萬億GB)為計算單位的數據,會在云端或者設備端被用于機器學習,以實現更先進的人工智能,從而帶來更自然、更直觀的用戶體驗。

2005年,ARM在業界推出了革新式的產品—多核ARM11,第一次實現了在單一群集中支持四個內核用于嵌入式系統;6年后,big.LITTLE技術問世,為主要計算設備的多

核特性帶來了革新。但它的弊端在于不能夠對單一計算集群上的大小核進行配置,例如就無法實現1+3或者1+7的SoC設計配置,這對異構計算和具有人工智能的設備來說是非常不利的。而最新的DynamIQ微架構則突破了這一瓶頸,被視作big.LITTLE技術的一次重要演進。

ARM給出的相關數據顯示,第一代采用DynamIQ技術的Cortex-A系列處理器在優化應用后,將可實現比基于Cortex-A73的設備高50倍的人工智能性能,并最多可提升10倍CPU與SoC上指定硬件加速器之間的反應速度。究其原因,是因為在新架構中,每個核都可以有各自不同的性能特性,SoC設計者可以通過對每一個處理器進行獨立的頻率控制,高效地在不同任務間切換最合適的處理器。同時,全新設計的內存子系統也幫助實現了更快的數據讀取和全新的節能特性。

考慮到DynamIQ微架構允許在單個群集中最多部署8個內核,Nayampally更看好其在企業級應用中的潛力。他解釋說,由于硬件尺寸和軟件線程的限制,移動應用方面應該不再需要超過8個核以上的計算能力了,單一群集已經足夠。但企業級應用對于內存容量、I/O吞吐量和帶寬是有高要求的,而DynamIQ正好解決了這一問題。接下來,SoC設計人員完全可以利用Corelink和Cache Coherent Interconnect等技術形成3-8個集群的多核設計,充分釋放其強大的計算能力,從而為機器學習和人工智能應用帶來更快的響應速度。

那么,DynamIQ技術能不能夠幫助ARM在服務器芯片市場做得更好?“這是個好問題,但我們可能還得再等等。”Nayampally回應稱,目前的云端服務器通常采用多芯片架構,因此通用型處理器加專用AI加速器模塊的組合,可能會是更佳的選擇,DynamIQ的優勢會更多體現在青睞片上系統設計的智能手機等設備中。當然,他也特別強調了安全,比如DynamIQ微架構除了能為ADAS解決方案帶來更快的響應速度外,也能同時增強安全性,確保合作伙伴能夠設計ASIL-D合規系統,即使在故障情況下仍可以快速恢復并能夠安全運行。

在回答媒體“一些專用的人工智能芯片(SoC/ASIC)是否會對DynamIQ帶來挑戰?”這一問題時,Nayampally稱,人工智能技術目前還在快速的演進發展中,包含了各種各樣的多元化算法,場景應用也很多元化。DynamIQ更強調兩方面的價值:一是能夠實現通用處理器在AI性能方面的提升,二是能夠實現通用處理器和專用加速模塊之間快速的響應和連接。所以,整個片上系統本身針對AI的性能就能夠得到提升,這對那些體積受限的小設備而言是非常重要的。言外之意,ARM新架構與專用AI加速器模塊的組合,有可能是未來SoC設計比較好的選擇之一。

DynamIQ技術將在今年晚些時候正式推出,2018年將率先被用于智能手機、汽車以及其它嵌入式系統中。