越來(lái)越重要的GPU
在傳統(tǒng)GPU市場(chǎng)中,永遠(yuǎn)都存在著對(duì)更佳視覺用戶體驗(yàn)的追求,包括更高的顯示分辨率、更新率和更佳的像素效果,所以很多設(shè)備都要求采用更佳的GPU。而在部分新興領(lǐng)域,GPU IP的應(yīng)用同樣不可避免,比如VR/AR的成功就依賴于高質(zhì)量圖形性能,而且必須具備顯示功能。在這樣的領(lǐng)域中,沒有GPU是不行的,所以GPU應(yīng)用延伸至這些行業(yè)也不足為奇。
但在Imagination業(yè)務(wù)開發(fā)高級(jí)工程經(jīng)理Rys Sommefeldt看來(lái),更加有趣的話題是GPU在IoT和可穿戴設(shè)備等領(lǐng)域中的應(yīng)用。這些應(yīng)用雖然也可能具有顯示性能,但其分辨率需求低,CPU就足以實(shí)現(xiàn)相應(yīng)的性能。有些設(shè)備甚至可能都沒有顯示功能,比如海量的IoT產(chǎn)品和服務(wù)器應(yīng)用等。
GPU的利用往往取決于以下兩個(gè)關(guān)鍵因素:功耗以及CPU無(wú)法滿足的計(jì)算性能需求。Rys Sommefeldt認(rèn)為,對(duì)于具備顯示功能的可穿戴設(shè)備(例如智能手表),使用GPU可在滿足性能需求的同時(shí)降低設(shè)備功耗,從而改善可穿戴設(shè)備中最重要的因素—電池壽命;而對(duì)于沒有顯示功能的應(yīng)用來(lái)說(shuō),使用GPU基本意味著設(shè)備有相應(yīng)的計(jì)算需求,而這些需求與GPU架構(gòu)和它的運(yùn)行方式高度契合。在這些應(yīng)用場(chǎng)景中,對(duì)像素的追求并不是使用GPU的主要目的。
“圖形密集的游戲、動(dòng)畫和應(yīng)用已經(jīng)成為消費(fèi)者移動(dòng)體驗(yàn)中的重要部分,視覺互動(dòng)是他們與所依賴的移動(dòng)終端之間的主要聯(lián)系界面,而圖形正是該界面的核心。”Qualcomm產(chǎn)品市場(chǎng)總監(jiān)王宇飛說(shuō),這正是為什么一體化設(shè)計(jì)的驍龍?zhí)幚砥髦邪珹dreno GPU的原因,因?yàn)樗芗铀購(gòu)?fù)雜幾何結(jié)構(gòu)的渲染,從而在低功耗下提供相片級(jí)逼真的圖形和豐富的用戶體驗(yàn)。Qualcomm 產(chǎn)品市場(chǎng)總監(jiān)王宇飛
集成于驍龍820處理器中的Adreno 530是Qualcomm迄今為止所設(shè)計(jì)的性能最佳的GPU,可用于智能手機(jī)、無(wú)人機(jī)、機(jī)器人等眾多領(lǐng)域。例如,Qualcomm驍龍TM650 IP攝像頭參考設(shè)計(jì)是一款完整的4K聯(lián)網(wǎng)攝像頭,支持64位異構(gòu)計(jì)算,支持包括從以太網(wǎng)到X8 4G LTE的全面廣泛的連接,還支持先進(jìn)的視頻分析,包括運(yùn)動(dòng)與面部檢測(cè)、面部識(shí)別、物體追蹤和Zeroth目標(biāo)分類。
在另一個(gè)案例中,得益于驍龍800系列集成的Adreno視覺處理、Hexagon數(shù)字信號(hào)處理、Spectra計(jì)算機(jī)視覺和全新的慣性傳感器內(nèi)核,Qualcomm在一款由驍龍820處理器支持的頭戴式顯示器(HMD)上首次展示了六自由度(6DOF)運(yùn)動(dòng)追蹤。
ARM多媒體處理部門GPU產(chǎn)品經(jīng)理Espen Oybo對(duì)此給出的觀點(diǎn)是,此前,在設(shè)備中配置GPU并不認(rèn)為是必需或是高性價(jià)比的,因?yàn)镃PU本身可以處理一些簡(jiǎn)單的圖形任務(wù),而減少芯片體積和降低功耗顯得更加重要。然而,隨著GPU技術(shù)的不斷進(jìn)步,人們發(fā)現(xiàn)GPU不僅能提供更佳的用戶體驗(yàn),也能釋放CPU的處理能力,使其更專注于關(guān)鍵任務(wù),并顯著的減少了芯片體積、功耗和帶寬消耗。
Mali超低功耗GPU是ARM產(chǎn)品家族中的重要成員,能夠幫助設(shè)備在有限功耗條件下,完美的實(shí)現(xiàn)性能和功耗平衡,從而在可穿戴和物聯(lián)網(wǎng)市場(chǎng)獲得出色的圖形體驗(yàn)。而全新推出的Mali-G71高性能GPU則采用新一代Bifrost架構(gòu),適用于AR/VR等需要高性能的領(lǐng)域。
除了圖形處理,GPU要不要嘗試一下通用計(jì)算?
Rys Sommefeldt在接受采訪時(shí)稱,承擔(dān)更多計(jì)算任務(wù)將是GPU發(fā)展的必然趨勢(shì)。相比于主要應(yīng)用于通用目標(biāo)計(jì)算上的傳統(tǒng)渲染場(chǎng)景,AR/VR帶來(lái)了更多整體渲染和視覺處理系統(tǒng)的需求。盡管它仍舊是圖形相關(guān)的通用目標(biāo)計(jì)算,但已經(jīng)不屬于傳統(tǒng)光柵化。因此,具備在單一渲染框架中混合GPU和計(jì)算負(fù)荷的GPU微架構(gòu),來(lái)滿足不同水平的需求,這一點(diǎn)非常重要。
應(yīng)用在PowerVR Wizard GPU中的光線追蹤技術(shù)是Imagination的“殺手锏”之一,尤其適合于AR/VR等非傳統(tǒng)應(yīng)用場(chǎng)景的使用。它可以將渲染完成的圖像根據(jù)人眼效果進(jìn)行調(diào)整,并將之扭曲提供恰當(dāng)?shù)妮敵?,以適應(yīng)特定的視覺系統(tǒng)—無(wú)論是鏡頭還是人眼。相比于在單獨(dú)GPU上運(yùn)行同樣的負(fù)載,該技術(shù)具備在硬件光線追蹤器上運(yùn)行扭曲平臺(tái),并與GPU一道形成獨(dú)特的優(yōu)勢(shì)。ARM多媒體處理部門GPU產(chǎn)品經(jīng)理Espen Oybo
每個(gè)產(chǎn)品對(duì)GPU的要求都不盡相同,一些只需顯示簡(jiǎn)單的用戶界面,而另一些產(chǎn)品則需要支持高端3D游戲的運(yùn)行。有鑒于此,ARM Mali系列GPU滿足了低功耗可穿戴設(shè)備、高端智能手機(jī)和要求高性能且獨(dú)立的虛擬現(xiàn)實(shí)頭盔這三大類產(chǎn)品的不同需求,并通過(guò)在核心數(shù)量和配置選項(xiàng)方面的可擴(kuò)展性,賦予合作伙伴在設(shè)計(jì)特定產(chǎn)品時(shí)實(shí)現(xiàn)功耗和效率的平衡。
“AR/VR的復(fù)雜性確實(shí)對(duì)移動(dòng)SoC組件提出了很高的要求,我們希望通過(guò)Brifrost GPU架構(gòu)來(lái)滿足這些要求。”Espen Oybo說(shuō)盡管目前數(shù)量有限,但ARM已經(jīng)看到一些采用通用圖形處理器(GPGPU)來(lái)進(jìn)行任務(wù)處理的案例,這是因?yàn)樵诂F(xiàn)有API和硬件條件下實(shí)現(xiàn)GPU和CPU之間的數(shù)據(jù)共享較為困難,很難淋漓盡致的發(fā)揮GPU的作用。但隨著OpenCL 2.0的出現(xiàn),在高性能Bifrost架構(gòu)中增加全系統(tǒng)一致性,將便于GPU和CPU通過(guò)高效的共享內(nèi)存實(shí)現(xiàn)彼此“溝通”,讓GPU和CPU在各種規(guī)模計(jì)算任務(wù)中的合作更加高效,避免了CPU緩存清理的間接費(fèi)用。
性能與功耗,兩者必須得兼
上述這些細(xì)分領(lǐng)域有些屬于快速變化的高存量市場(chǎng),有些屬于擁有很大創(chuàng)新空間的新興市場(chǎng),但它們都依賴于高性能GPU在最低功耗下的性能表現(xiàn)。換句話說(shuō),如何在帶給用戶最佳性能體驗(yàn)的同時(shí)更兼顧低功耗特性,正成為各家公司實(shí)力比拼的焦點(diǎn)。
根據(jù)多年來(lái)提供GPU授權(quán)設(shè)計(jì)的經(jīng)驗(yàn),Rys Sommefeldt說(shuō)自己認(rèn)識(shí)到很多時(shí)候市場(chǎng)所需要的與實(shí)際創(chuàng)造出來(lái)的產(chǎn)品并不一致。“每個(gè)人都希望看到一定的改變,即使只是很小的變化,但我們又無(wú)法準(zhǔn)確預(yù)測(cè)客戶所期望的目標(biāo)性能水平、功耗和領(lǐng)域,這就是這個(gè)行業(yè)的本質(zhì)。所以,可擴(kuò)展的、模塊化的可調(diào)節(jié)GPU設(shè)計(jì)是必須的。”
對(duì)于GPU來(lái)說(shuō),最關(guān)鍵的可擴(kuò)展因素永遠(yuǎn)是性能,例如浮點(diǎn)數(shù)量和GPU可處理的像素?cái)?shù)量。因此,通過(guò)在設(shè)計(jì)中提供多種水平的性能,用戶就有機(jī)會(huì)以最少的精力和時(shí)間來(lái)應(yīng)對(duì)市場(chǎng)中新的配置需求,并使自己得以跳出原本的領(lǐng)域和產(chǎn)品計(jì)劃。
Imagination最新推出的塊狀延遲渲染微架構(gòu)是專為在渲染過(guò)程中降低工作量而設(shè)計(jì)的。該架構(gòu)不對(duì)隱藏的像素內(nèi)容進(jìn)行著色內(nèi)容處理,意味著無(wú)需耗費(fèi)電源來(lái)運(yùn)行ALU和獲取寄存器組,從而帶來(lái)了功耗方面的大幅降低;也無(wú)需提供紋理模型和寫出用于中繼緩沖或最終圖形的像素,極大地節(jié)省了存儲(chǔ)需求。Imagination業(yè)務(wù)開發(fā)高級(jí)工程經(jīng)理Rys Sommefeldt
“就算是不靠電池供電工作的終端,也需要出于散熱和工業(yè)設(shè)計(jì)的考慮去盡量減小功耗。” 王宇飛表示,Adreno GPU的關(guān)注點(diǎn)一直是要提供每一份能量(每毫瓦)的絕對(duì)最佳性能,這也是所有移動(dòng)市場(chǎng)細(xì)分領(lǐng)域的根本推動(dòng)力。最新的Adreno 5xx GPU既支持Khronos最新圖形API Vulkan,能在CPU低消耗狀況下實(shí)現(xiàn)高級(jí)圖形內(nèi)容,也支持最新計(jì)算API OpenCL 2.0 FP的所有特性,以應(yīng)對(duì)各種GPGPU應(yīng)用。
幫助合作伙伴在功耗和效能間取得適宜其產(chǎn)品的最佳平衡,對(duì)于ARM而言是至關(guān)重要的。最初設(shè)計(jì)時(shí),Mali-400是首款配置Mali-200 GPU的多核GPU,市場(chǎng)的反饋很快證明了這個(gè)策略是正確的。在隨后的設(shè)計(jì)中,基于高端Midgard架構(gòu)的GPU,諸如Mali-T880,可以從單核拓展至16核,而全新的Mali-G71基于Bifrost架構(gòu),更能夠支持32核。
當(dāng)今最高端的智能手機(jī)已經(jīng)實(shí)現(xiàn)了12個(gè)內(nèi)核的配置,用以支持AR/VR等新興應(yīng)用,它們的嚴(yán)苛要求正在不斷推動(dòng)電源功耗突破極限。所以Espen Oybo認(rèn)為,額外的可用核是非常有必要的,它不僅能輕松的支持高端應(yīng)用,同時(shí)也為其應(yīng)對(duì)日益增加的內(nèi)容復(fù)雜性預(yù)留了空間。除了數(shù)量外,內(nèi)核在配置方面還有很多靈活空間,如何在這一過(guò)程中實(shí)現(xiàn)功率、性能和效能的平衡,從而能夠提供另一個(gè)層面的可定制選項(xiàng),幫助用戶根據(jù)自己的市場(chǎng)需求進(jìn)行自由調(diào)整,也是非常關(guān)鍵的要素。
設(shè)計(jì)增值,才能活下去
GPU IP屬于設(shè)計(jì)復(fù)雜,離開生態(tài)系統(tǒng)就無(wú)法生存的IP類型,所有受訪者也均對(duì)此表示認(rèn)可。王宇飛說(shuō),Qualcomm的主要目標(biāo)之一就是為移動(dòng)開發(fā)者提供盡可能多的價(jià)值。通過(guò)與生態(tài)系統(tǒng)中的合作伙伴密切合作,以保證中間件引擎是高效的,且針對(duì)Adreno實(shí)現(xiàn)優(yōu)化。高通還為開發(fā)者們開發(fā)資源,縮短他們?cè)贏dreno GPU上的開發(fā)時(shí)間:既有像驍龍Profiler這樣特性豐富的工具,在開發(fā)周期的所有方面提供幫助;也有SDK來(lái)幫助開發(fā)者獲得先進(jìn)的技術(shù),驍龍VR SDK就是一個(gè)例子,能讓開發(fā)者們利用它開發(fā)HMD和面向?qū)S肏MD的內(nèi)容。
近年來(lái),Imagination在為客戶提供硬件、軟件和市場(chǎng)方面的產(chǎn)品支持上也取得了巨大的成就。包括提供專門的硬件設(shè)計(jì)團(tuán)隊(duì)與客戶、晶圓代工長(zhǎng)溝通合作,以確保實(shí)現(xiàn)最佳的片上性能;戰(zhàn)略軟件團(tuán)隊(duì)與客戶和開發(fā)者共同創(chuàng)建可為PowerVR提供明確策略優(yōu)勢(shì)的軟件產(chǎn)品;細(xì)分市場(chǎng)營(yíng)銷專家充分理解客戶的目標(biāo)應(yīng)用細(xì)節(jié),展示PowerVR在相應(yīng)領(lǐng)域的巨大價(jià)值等。
ARM是一家依托龐大生態(tài)系統(tǒng)生存的公司,這一特點(diǎn)無(wú)論對(duì)于GPU還是CPU來(lái)說(shuō)都至關(guān)重要。一方面,ARM與EDA合作伙伴和代工廠緊密協(xié)作,幫助芯片伙伴便捷的實(shí)施GPU。另一方面,通過(guò)軟件生態(tài)系統(tǒng)為程序員提供最好的Mali體驗(yàn)。“正因我們擁有如此龐大的生態(tài)系統(tǒng)(包括實(shí)施和軟件),ARM的合作伙伴們能在眾多生態(tài)系統(tǒng)所提供的不同選擇中自由選取,從而實(shí)現(xiàn)他們產(chǎn)品的差異化。”Espen Oybo說(shuō)。