過(guò)去四年中,計(jì)算領(lǐng)域發(fā)生了令人驚嘆的發(fā)展。以ARM為例,在已經(jīng)出貨的1000億顆基于ARM的芯片中,有500億顆是由ARM的合作伙伴在2013年到2017年間完成出貨的。“這個(gè)數(shù)字充分反映了整個(gè)行業(yè)目前對(duì)于更多計(jì)算的需求。”ARM副總裁暨計(jì)算產(chǎn)品事業(yè)部總經(jīng)理Nandan Nayampally說(shuō),ARM的成功緣于良好的生態(tài)系統(tǒng)和自身架構(gòu)的高拓展性,能夠覆蓋從傳感器到服務(wù)器的廣泛應(yīng)用,他們將其稱之為全面計(jì)算(Total Computing)。

20170405-ARM-1Nandan Nayampally預(yù)計(jì)其合作伙伴將在2021年完成下一個(gè)1000億顆基于ARM的芯片出貨,在很大程度上這將歸功于人工智能在人們?nèi)粘I钪械膹V泛應(yīng)用。“未來(lái),人工智能將無(wú)處不在,數(shù)據(jù)處理能力不能完全依賴于云端,設(shè)備本身也要具有人工智能的計(jì)算能力,功耗還要更低。”為此,ARM在big.LITTLE技術(shù)基礎(chǔ)之上,推出了全新的DynamIQ技術(shù)。

與其將DynamIQ稱之為一種技術(shù),倒不如將其稱之為“微架構(gòu)”。ARM對(duì)DynamIQ給出的官方定義是:作為未來(lái)ARM Cortex-A系列處理器的基礎(chǔ),DynamIQ代表了多核處理設(shè)計(jì)行業(yè)的轉(zhuǎn)折點(diǎn),其靈活多樣性將重新定義更多類別設(shè)備的多核體驗(yàn),覆蓋從端到云的安全、通用平臺(tái)。該技術(shù)未來(lái)將被廣泛應(yīng)用于汽車、家庭以及各種互聯(lián)設(shè)備中,這些設(shè)備所產(chǎn)生的以澤字節(jié)(ZB,一澤字節(jié)大約等于1萬(wàn)億GB)為計(jì)算單位的數(shù)據(jù),會(huì)在云端或者設(shè)備端被用于機(jī)器學(xué)習(xí),以實(shí)現(xiàn)更先進(jìn)的人工智能,從而帶來(lái)更自然、更直觀的用戶體驗(yàn)。

2005年,ARM在業(yè)界推出了革新式的產(chǎn)品—多核ARM11,第一次實(shí)現(xiàn)了在單一群集中支持四個(gè)內(nèi)核用于嵌入式系統(tǒng);6年后,big.LITTLE技術(shù)問(wèn)世,為主要計(jì)算設(shè)備的多

核特性帶來(lái)了革新。但它的弊端在于不能夠?qū)我挥?jì)算集群上的大小核進(jìn)行配置,例如就無(wú)法實(shí)現(xiàn)1+3或者1+7的SoC設(shè)計(jì)配置,這對(duì)異構(gòu)計(jì)算和具有人工智能的設(shè)備來(lái)說(shuō)是非常不利的。而最新的DynamIQ微架構(gòu)則突破了這一瓶頸,被視作big.LITTLE技術(shù)的一次重要演進(jìn)。

ARM給出的相關(guān)數(shù)據(jù)顯示,第一代采用DynamIQ技術(shù)的Cortex-A系列處理器在優(yōu)化應(yīng)用后,將可實(shí)現(xiàn)比基于Cortex-A73的設(shè)備高50倍的人工智能性能,并最多可提升10倍CPU與SoC上指定硬件加速器之間的反應(yīng)速度。究其原因,是因?yàn)樵谛录軜?gòu)中,每個(gè)核都可以有各自不同的性能特性,SoC設(shè)計(jì)者可以通過(guò)對(duì)每一個(gè)處理器進(jìn)行獨(dú)立的頻率控制,高效地在不同任務(wù)間切換最合適的處理器。同時(shí),全新設(shè)計(jì)的內(nèi)存子系統(tǒng)也幫助實(shí)現(xiàn)了更快的數(shù)據(jù)讀取和全新的節(jié)能特性。

考慮到DynamIQ微架構(gòu)允許在單個(gè)群集中最多部署8個(gè)內(nèi)核,Nayampally更看好其在企業(yè)級(jí)應(yīng)用中的潛力。他解釋說(shuō),由于硬件尺寸和軟件線程的限制,移動(dòng)應(yīng)用方面應(yīng)該不再需要超過(guò)8個(gè)核以上的計(jì)算能力了,單一群集已經(jīng)足夠。但企業(yè)級(jí)應(yīng)用對(duì)于內(nèi)存容量、I/O吞吐量和帶寬是有高要求的,而DynamIQ正好解決了這一問(wèn)題。接下來(lái),SoC設(shè)計(jì)人員完全可以利用Corelink和Cache Coherent Interconnect等技術(shù)形成3-8個(gè)集群的多核設(shè)計(jì),充分釋放其強(qiáng)大的計(jì)算能力,從而為機(jī)器學(xué)習(xí)和人工智能應(yīng)用帶來(lái)更快的響應(yīng)速度。

那么,DynamIQ技術(shù)能不能夠幫助ARM在服務(wù)器芯片市場(chǎng)做得更好?“這是個(gè)好問(wèn)題,但我們可能還得再等等。”Nayampally回應(yīng)稱,目前的云端服務(wù)器通常采用多芯片架構(gòu),因此通用型處理器加專用AI加速器模塊的組合,可能會(huì)是更佳的選擇,DynamIQ的優(yōu)勢(shì)會(huì)更多體現(xiàn)在青睞片上系統(tǒng)設(shè)計(jì)的智能手機(jī)等設(shè)備中。當(dāng)然,他也特別強(qiáng)調(diào)了安全,比如DynamIQ微架構(gòu)除了能為ADAS解決方案帶來(lái)更快的響應(yīng)速度外,也能同時(shí)增強(qiáng)安全性,確保合作伙伴能夠設(shè)計(jì)ASIL-D合規(guī)系統(tǒng),即使在故障情況下仍可以快速恢復(fù)并能夠安全運(yùn)行。

在回答媒體“一些專用的人工智能芯片(SoC/ASIC)是否會(huì)對(duì)DynamIQ帶來(lái)挑戰(zhàn)?”這一問(wèn)題時(shí),Nayampally稱,人工智能技術(shù)目前還在快速的演進(jìn)發(fā)展中,包含了各種各樣的多元化算法,場(chǎng)景應(yīng)用也很多元化。DynamIQ更強(qiáng)調(diào)兩方面的價(jià)值:一是能夠?qū)崿F(xiàn)通用處理器在AI性能方面的提升,二是能夠?qū)崿F(xiàn)通用處理器和專用加速模塊之間快速的響應(yīng)和連接。所以,整個(gè)片上系統(tǒng)本身針對(duì)AI的性能就能夠得到提升,這對(duì)那些體積受限的小設(shè)備而言是非常重要的。言外之意,ARM新架構(gòu)與專用AI加速器模塊的組合,有可能是未來(lái)SoC設(shè)計(jì)比較好的選擇之一。

DynamIQ技術(shù)將在今年晚些時(shí)候正式推出,2018年將率先被用于智能手機(jī)、汽車以及其它嵌入式系統(tǒng)中。