在最新出爐的《全球500強(qiáng)》(TOP500)超級(jí)計(jì)算機(jī)排行榜中,美國(guó)重新贏回超級(jí)計(jì)算機(jī)運(yùn)算性能的龍頭地位,但能夠維持多久還有待觀察。而中國(guó)不僅在高性能系統(tǒng)數(shù)量方面持續(xù)領(lǐng)先,同時(shí)也在競(jìng)爭(zhēng)最先推出每秒百萬(wàn)兆浮點(diǎn)運(yùn)算(exaflop;1018)計(jì)算機(jī)的排名。

最新的TOP500排名讓美國(guó)暫居上風(fēng),但也顯示中國(guó)在計(jì)算機(jī)技術(shù)方面持續(xù)精進(jìn)。此外,這項(xiàng)最新排行榜發(fā)布時(shí)間,剛好就在中美兩國(guó)間的貿(mào)易戰(zhàn)升溫之際——引發(fā)兩國(guó)貿(mào)戰(zhàn)的部份原因就在于雙方對(duì)半導(dǎo)體政策的沖突。

從最新的TOP500排行榜還可看出,加速器繼續(xù)驅(qū)動(dòng)著全世界最強(qiáng)大的計(jì)算機(jī)系統(tǒng),特別是英偉達(dá)(Nvidia)的圖像處理器(GPU)。除了Nvdia,英特爾(Intel)以及總部位于日本的加速器制造商Pezy Computing也在此排行榜中嶄露頭角。

在歷經(jīng)沒有任何一臺(tái)系統(tǒng)擠進(jìn)前四強(qiáng)的一年后,美國(guó)的超級(jí)計(jì)算機(jī)在這次的TOP500排行榜上分別名列第一和第三。美國(guó)橡樹嶺國(guó)家實(shí)驗(yàn)室(Oak Ridge National Laboratory;ORNL)的“頂點(diǎn)”(Summit)超級(jí)計(jì)算機(jī)系統(tǒng)在Linpack基準(zhǔn)檢驗(yàn)上測(cè)得122.3 petaflops的運(yùn)算效能,大幅領(lǐng)先之前中國(guó)“神威.太湖之光”(Sunway TaihuLight)的93 PFlops。

美國(guó)勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室(Lawrence Livermore National Laboratory;LLNL)的Sierra系統(tǒng),則以71.6 PFlops排名第三。Summit和Sierra都采用IBM Power 9處理器和Nvidia Tesla V100加速器,透過(guò)Mellanox Infiniband EDR互連4,300多個(gè)節(jié)點(diǎn)。

從Linpack的整體基準(zhǔn)檢驗(yàn)性能來(lái)看,美國(guó)的超級(jí)計(jì)算機(jī)以38.2%的整體表現(xiàn),超越中國(guó)的29.1%,重登排行首位。就在6個(gè)月前,雙方的排名位置還剛好相反。

如果采用新的高性能共軛梯度(HPCG)基準(zhǔn)檢驗(yàn),測(cè)試結(jié)果還更加明確。Summit和Sierra系統(tǒng)分別以2.926 PFlops和1.79 PFlops領(lǐng)先在HPCG基準(zhǔn)檢驗(yàn)的排名。

相形之下,中國(guó)的太湖之光排名第六,成績(jī)?yōu)?.481 PFlops。中國(guó)第二大系統(tǒng)天河2號(hào)(Tianhe-2)則以0.038 PFlops排名第49。其他的中國(guó)系統(tǒng)使用該基準(zhǔn)檢驗(yàn)的排名均在100名之后。

Linpack長(zhǎng)期以來(lái)一直被視為是相對(duì)粗糙的原始理論性能測(cè)量標(biāo)準(zhǔn)。相形之下,美國(guó)田納西大學(xué)教授Jack Dongarra說(shuō),HPCG使用的程序代碼則測(cè)量7種運(yùn)算指標(biāo),“更能強(qiáng)調(diào)數(shù)據(jù)的動(dòng)態(tài),特別是在許多實(shí)際應(yīng)用中。”

cj

中國(guó)在全球最強(qiáng)大的超級(jí)計(jì)算機(jī)占有率不斷增加(來(lái)源:Top500.org)

盡管這次暫時(shí)在性能方面小輸,但中國(guó)目前在TOP500中擁有206臺(tái)系統(tǒng),較6個(gè)月前的202臺(tái)系統(tǒng)更多,持續(xù)在TOP500超級(jí)計(jì)算機(jī)數(shù)量方面領(lǐng)先。而美國(guó)這次創(chuàng)歷史新低僅有124臺(tái)超級(jí)計(jì)算機(jī),較2017年11月時(shí)的145臺(tái)大幅減少。

此外,聯(lián)想(Lenovo)目前擁有最多臺(tái)計(jì)算機(jī)系統(tǒng)(119),這是中國(guó)供應(yīng)商首次在這個(gè)項(xiàng)成績(jī)上脫穎而出?;叟c科技(Hewlett Packard Enterprise;HPE)原本以122臺(tái)系統(tǒng)領(lǐng)先,目前則只有79臺(tái)。其后排名分別是浪潮集團(tuán)(Inspur)、Cray和中科曙光(Sugon),分別擁有68、56和55套系統(tǒng)。

排名第六的IBM僅列出19臺(tái)系統(tǒng),但由于Summit和Sierra超級(jí)計(jì)算機(jī)的采用,使其擁有在Linpack整體性能排名中占19.9%。Cray和聯(lián)想則分別以16.5%和12%位居其后。

中國(guó)競(jìng)逐Exaflop目標(biāo)

Dongarra表示,雖然中國(guó)在這次最新的TOP500排行榜表現(xiàn)不如預(yù)期,但自2016年以來(lái)一直在加速下一階段的技術(shù)進(jìn)展。預(yù)計(jì)中國(guó)將推出第一套在Linpack基準(zhǔn)檢驗(yàn)取得exaflop級(jí)運(yùn)算效能的系統(tǒng),甚至可能比美國(guó)更提前一年。

目前,在中國(guó)的三支團(tuán)隊(duì)正競(jìng)相打造約512個(gè)節(jié)點(diǎn)的相對(duì)較小原型系統(tǒng),每個(gè)節(jié)點(diǎn)使用不同的架構(gòu)。根據(jù)其開發(fā)結(jié)果可能決定哪一支團(tuán)隊(duì)將獲得資金,打造最終的exaflop超級(jí)計(jì)算機(jī),預(yù)計(jì)最早可能在2020年。

Dongarra表示,這三項(xiàng)計(jì)劃由中國(guó)服務(wù)器供貨商中科曙光以及天河、神威超級(jí)計(jì)算機(jī)背后的團(tuán)隊(duì)為主導(dǎo)。多家大學(xué)院校、研究機(jī)構(gòu)和國(guó)家超級(jí)計(jì)算機(jī)中心均參與了這項(xiàng)合作計(jì)劃。

中科曙光系統(tǒng)用于連接在6D環(huán)形網(wǎng)絡(luò)上的10,000多個(gè)節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)使用與AMD共同開發(fā)的x86處理器。預(yù)計(jì)天河團(tuán)隊(duì)將采用同樣用于天河2A中的本土Matrix 2000版本,可能再增加基于Arm的處理器或加速器。神威原型則大致上沿用太湖之光的多核心途徑。

一年前,美國(guó)政府撥款了2.58億美元,計(jì)劃在2021年之前推出百萬(wàn)兆級(jí)(exascale)的系統(tǒng)。Dongarra表示,中國(guó)和美國(guó)共同的目標(biāo)都在于提供一個(gè)支持30GFlop/W效能和超過(guò)500Gbits的exaflop系統(tǒng)。

在全世界最強(qiáng)大的系統(tǒng)中有越來(lái)越多都使用了加速器——在目前TOP500系統(tǒng)中就有110臺(tái)系統(tǒng)采用加速器,比6個(gè)月前統(tǒng)計(jì)的101臺(tái)增加了。Nvidia GPU是迄今最普遍獲得采用的協(xié)同處理器,出現(xiàn)在其中的96臺(tái)系統(tǒng)中,其中包括前10大系統(tǒng)中就有5臺(tái)采用。

TOP500中有7臺(tái)系統(tǒng)使用了英特爾的Xeon Phi協(xié)同處理器,日本的4臺(tái)系統(tǒng)則使用相對(duì)較新的Pezy加速器。

有趣的是,在另一項(xiàng)測(cè)量節(jié)能效率最高的“全球前500強(qiáng)超級(jí)計(jì)算機(jī)”(Green 500)排行榜中,前三大系統(tǒng)都采用了Pezy加速器,而前十大的其余系統(tǒng)則使用Nvidia GPU作為加速器。

jsj

在最新的TOP500超級(jí)計(jì)算機(jī)排名中,Nvidia持續(xù)擴(kuò)張其加速器芯片供應(yīng)商的領(lǐng)先地位

Dongarra說(shuō):“Pezy系統(tǒng)采用液體冷卻方式——也就是說(shuō),整個(gè)系統(tǒng)浸沒在液體中[通常是3M的Fluorinert版本],這比透過(guò)板載空氣或水更具有節(jié)能效率。”

Top 500中的大多數(shù)系統(tǒng)都使用英特爾Xeon CPU作為主處理器。此外,目前有將近一半(247套系統(tǒng))都使用了10-Gbit/s以太網(wǎng)絡(luò)作為其互連,在6個(gè)月前這一數(shù)字為228。

TOP500中采用相對(duì)更昂貴的Infiniband作為互連的系統(tǒng),則從6個(gè)月前的163臺(tái)減少到目前約139臺(tái)。英特爾專有的Omni-Path互連在最新排行榜中則有38臺(tái)系統(tǒng),較6個(gè)月前的35臺(tái)略高。