先進工藝制造:臺積電10納米

自不必說,臺積電號稱全亞洲最會賺錢的制造企業(yè),也是目前摩爾定律扛旗者,蘋果A1X芯片獨家供應商,全球最先進晶圓代工業(yè)者。

2016年8月,華為首款16納米芯片麒麟950正式量產上市,震驚整個國內電子制造產業(yè)。這意味著,中國IC設計公司首次實現(xiàn)最先進工藝進行量產,躋身為一線廠商。

隨后,華為手機再度加速先進工藝制造進程。在德國柏林IFA2017大展上,華為發(fā)布的麒麟970選擇了臺積電全新的10nm工藝。在工藝節(jié)點上,麒麟970已經和國際一流廠商處于同一起跑線上,高通的驍龍830和聯(lián)發(fā)科X30處理器采用的也是10nm的制作工藝。

1

因為新制程的關系,麒麟970相比上一代960將會有20%的功耗降低,同時在封裝尺寸上還將縮小40%。麒麟970再次刷新了麒麟系列芯片中晶體管數(shù)量的記錄——55億個晶體管,遠超上一代麒麟960的40億個。相比之下,驍龍835只有30億,蘋果iphone7系列使用的A10處理器也不過33億個。

CPU、GPU性能發(fā)展降速,重點是降功耗

但實際上,這次麒麟970的CPU和GPU部分是“不思進取”的。麒麟970 的CPU采用4Cortex-A73+4Cortex-A53的公版大小核設計,其中A73大核主頻為2.4GHz(麒麟 960 是 2.36GHz),A53小核主頻為1.8GHz(麒麟 960 是 1.84GHz)??梢钥吹?,麒麟970和960的CPU核心配置基本一致,沒有明顯提升。在功耗方面將有20%的降低,但是主要得益于采用了10nm的工藝。

在GPU方面,970采用了全新的Mali G72MP12,這也是手機首次用上12核GPU。但是就其組成Mali G72圖形處理器單元來說,相對于上一代麒麟960的G71圖形處理器單元來說,并沒有大幅度的性能提升。在拍照方面,麒麟970采用了兩個ISP,在拍照這一應用場景中取得了很大進展:更快的反應速度、更快的對焦速度、運動拍攝幀率更大、暗光場景下的拍攝能力更強。

2

實際性能上,余承東表示,相比起麒麟 960,麒麟 970 的性能有 20% 的提升,并且能效比提升了 50%。照理說,由于麒麟 970 的 GPU 核心架構比麒麟 960 更先進,核心數(shù)還多了 50%,并且工藝更先進,GPU 性能提升的幅度應該遠不止 20%。之所以出現(xiàn)這種情況,很可能是華為將麒麟 970 的 GPU 主頻壓得比較低,從而更好地降低功耗(于是就有了提升幅度高達 50% 的能效比)。不出意外,麒麟 960 上出現(xiàn)的 GPU‘滿血跑’時功耗感人的情況,麒麟 970 上不會再出現(xiàn)。

首次集成NPU,打造最強手機AI芯片

麒麟970冷漠了CPU和GPU,其實是另有新歡。麒麟 970 的開發(fā)團隊在繼承過去數(shù)代成果的基礎上,首次集成 NPU(Neural Network Processing Unit)專用硬件處理單元,創(chuàng)新設計了 HiAI 移動計算架構,其 AI 性能密度大幅優(yōu)于 CPU 和 GPU。

3

用了HiAI移動計算架構之后,麒麟970的AI性能密度大幅優(yōu)于CPU和GPU。同樣是四個Cortex-A73核心,在處理同樣的AI應用任務時,新的異構計算架構擁有大約50倍能效和25倍性能優(yōu)勢,這意味著麒麟970芯片可以用更少的能耗更快地完成AI計算任務。例如在圖像識別速度上,內部測試顯示,這種性能允許麒麟970每分鐘處理2005張圖像,而在沒有NPU的情況下每分鐘只能處理97張圖像。

5

據(jù)此前報道,這顆NPU并非華為獨立打造,技術方面主要由國內AI芯片創(chuàng)業(yè)公司寒武紀負責。后者去年已經發(fā)布了第一款深度學習專用處理器“寒武紀1A”,同時還為其配套了專用的指令集系統(tǒng)。就在兩個星期之前,寒武紀還完成了A輪融資,總金額達到1億美元,融資方包括國投創(chuàng)業(yè)、阿里巴巴、聯(lián)想等一批知名巨頭和VC。

6

所以NPU是專門為了人工智能而生,根據(jù)官方現(xiàn)場PPT,這顆NPU的性能將達到1.92T FP16(半精度浮點運算)。相比之下,經常拿來作為神經網(wǎng)絡研究的NVIDIA GTX1080,F(xiàn)P32的處理能力為8.87T。由此換算,GTX1080的FP16能力大約為17.74T。換句話說,NPU的性能約等于1/9個GTX1080。

2

其實,麒麟 970 整合NPU構想早在五年前就已經開始醞釀。在過去的幾年里,產業(yè)界已經逐漸看到 CPU 的應用瓶頸,而 GPU 雖然也開始參與計算工作,但其主要的顯示工作隨著分辨率的提高而負擔不斷加重,所以要讓這個已經分身乏術的架構繼續(xù)增加負荷,對整體性能以及功耗表現(xiàn)也是會產生負面影響。

事實上,當初的主流移動芯片架構也已經不會只內建此兩種架構,而多半會增加額外的 DSP 單元或者是 ISP 架構,不僅分擔主系統(tǒng)的沉重計算負擔,也因為讓不同類型的計算工作可以擺到更適合的計算架構上,整體功耗也有了明顯的改善。

可以說,AI 正是基于同樣的概念:讓適合的架構來做適合的工作,效率才會得到提高。

準5G基帶,再次領先高通和三星

華為目前是全球最大通信設備商,華為海思最為自豪的是其基帶研發(fā)技術,早在2014年其研發(fā)的麒麟920先于高通支持LTE Cat6技術,隨后在2015年先于高通發(fā)布支持LTE Cat12的基帶,不過此后其就開始落后于高通和三星,要知道高通、三星紛紛發(fā)布支持1Gbps下行(LTE Cat16)、1.2Gbps下行(LTE Cat18)的手機芯片。

本次華為麒麟970取得對高通和三星的技術領先優(yōu)勢是一個讓人驚喜的進步,實現(xiàn)了跨越式的發(fā)展。970支持LTE Cat18,最高下載速度達到1.2Gbps(4x4 MIMO,3CC CA,256QAM),要知道驍龍835號稱千兆LTE的最高下載速度為1Gbps。難怪其消費者BG CEO余承東表示麒麟970是全球首款支持Pre5G的手機芯片。

9

此外,麒麟 970 終于支持了在同時使用兩張 SIM 卡時,主副卡同時用 4G(上一代麒麟 960 的副卡只能支持 3G)。此外,麒麟 970 還特別針對高鐵時的使用做了優(yōu)化,信號更穩(wěn)定,減少掉線。