美國加州大學戴維斯分校(University of California-Davis)電機系學生設計出一款號稱1000核心的處理器,其中包含6.21億個晶體管,支持每秒1.78兆次指令的運算效能與終極傳輸速率。

這款1000核心的處理器名為“KiloCore”,據稱是今最節能的多核心處理器。它在日前于夏威夷檀香山舉辦的“2016 年超大型積體技術暨電路研討會”(Symposia on VLSI Technology & Circuits)上首度現身。

帶領該芯片架構設計團隊的該校電子與計算機工程系教授Bevan Baas表示:“據我們所知,它是世界上第一個1000核心的處理器芯片,具備最高速率的頻率。”

根據Baas研究團隊進行的分析指出,雖然業界持續開發出其他多核心處理器芯片,但沒有一款超過300核心。這些高核心數的處理器芯片中多半都是為了研究用途而開發的,很少真正能商用化上市。但KiloCore芯片已實際進行制造與執行了——它采用了IBM 32-nm PD-SOI CMOS技術制造。

KilCore的基本架構是“多重指令/多重數據”(MIMD),每一個七階管線核心都是通用單元,包含72個指令集以及單一指令/周期。研究團隊表示,有別于GPU級芯片不同,KilCore沒有一種指令集基于特定算法。

KilCore在1.1V下支持高達每秒1.78兆次指令的運算效能、1.78GHz的頻率速度:在0.84V與1GHz時的功耗約13.1W,而在0.56V與115MHz時則可達到5.8 pJ/Op的峰值功率效率。

每個核心均能獨立供電,而且可以在無須執行任務時斷電以降低漏電。相較于快取的架構,每一個處理器都能在不同的位置分層中儲存指令與數據,包括本地內存、一或多個鄰近處理器、芯片上獨立內存模塊或外部內存等。

每個處理器都經由高通量電路交換網絡、分組交換網絡(芯片形式)進行通信。研究團隊表示,采用像‘蟲洞’(wormhole)的路徑,使其從芯片上的協同處 理器提供運算的能量開銷較低。也就是說,從相鄰或附近核心而來的信息,將可透過‘電路’網絡路由;而從更遠的處理器矩陣而來的信息,則透過封包網絡進行傳送。

每個核心都有南北東西向的通信緩沖信道,以及用于主處理器通信的第五信道;在1.1V時的每路由器最大傳輸速率為45.5 Gbps,在1.1V時則可達9.1 Gbps的每端口傳輸速率。

在0.9V供電電壓下,3.36mW的最大傳輸率為27.1Gbps;而在0.67電壓時,429 µW的最大傳輸速率為8.1 Gbps。

KiloCore的1000核心處理器、1000封包路由器以及12個獨立的內存,都經由本地振蕩器進行頻率控制,但無需使用PLL或改變頻率,可在1-5個頻率周期內暫停以及在不到1頻率周期內重新啟動,以降低功枆。該芯片尺寸約8mm2,搭載32排32顆處理器核心(共992顆核心),而剩下的8顆核心以及內存則置于最后一排。

采用多核心數組的一項挑戰就是任務排程,以及保持所有的核心持續運轉。研究團隊打造出一款編程模型與編譯程序,透過多步驟過程進行編程來分配所有的處理器任務。然而,為了利用現有的封裝技術,研究人員在測試時僅用了中央的160顆核心,未來還必須進一步測試完整的芯片性能。

高一些核心數組工作的一個主要挑戰是安排任務,并保持所有內核忙碌。該團隊已經創建了一個編程模型和編譯程序;他們說,編程是通過多步驟的過程,分配方案的處理器。然而,利用現有的包裝,只有中央160內核在測試中被供電的,全芯片的性能數據被假定為推斷。

每個處理器核心可以獨立作業,相較于GPU等處理器所使用的謂“單指令多數據”(SIMD)途徑,基本上可說是一種較更活的途徑;其想構在于將應用劃分成多個小單元,每一個應用單元都能在不同的處理器上平行處理,從而以較低能耗實現高吞吐量。Baas并補充說,KiloCore是最節能的多核心芯片。

例如,1000核心處理器每秒可執行1150億條指令,而功耗僅0.7W,低至足以用一顆AA電池就能供電。相較于目前的筆記本電腦處理器,KiloCore芯片的效能更高100倍,且更具能效。

研究人員已經為該芯片開發出各種應用,包括無線編碼/譯碼、處理、加密,以及其他有關大量平行資料運算的應用,例如科學數據應用以及數據中心記錄處理。