電子發(fā)燒友網(wǎng)報道(文/章鷹)“我們看到,今年隨著DeepSeek輕量化大模型的快速發(fā)展,端側(cè)AI正在進入爆發(fā)期,從智能終端設(shè)備到車載系統(tǒng),對邊緣側(cè)算力提出新的需求?!?在4月27日的媒體溝通會上,Imagination 公司中國區(qū)董事長兼亞太總裁白農(nóng)對記者表示。
但是,當下端側(cè)AI設(shè)備發(fā)展的兩大挑戰(zhàn):一是功耗和低成本預(yù)期,邊緣設(shè)備對成本和功耗極其敏感;二是端側(cè)AI設(shè)備多樣化,快速變化的技術(shù)、新模型不斷涌現(xiàn),不同設(shè)備要求的算力呈現(xiàn)差異化分布。
基于全球市場端側(cè)AI浪潮的興起和客戶的迫切需求,5月8日,Imagination Technologies推出 Imagination E-Series GPU IP,重新定義了邊緣人工智能和圖形系統(tǒng)設(shè)計。這款E系列GPU IP,有哪些強勁的性能和特性來滿足不同行業(yè)客戶的需求?為了推進邊緣AI設(shè)備和芯片方案落地,Imagination公司提供給開發(fā)者哪些軟硬件工具和平臺參考?Imagination 公司中國區(qū)董事長兼亞太總裁白農(nóng)、Imagination 中國區(qū)技術(shù)總監(jiān)艾克分享精彩的觀點和技術(shù)趨勢分析。
圖:Imagination 公司中國區(qū)董事長兼亞太總裁 白農(nóng)
E系列GPU IP兩大優(yōu)勢:架構(gòu)創(chuàng)新和可擴展性
“1992年Imagination開始開發(fā)GPU,憑借30多年經(jīng)驗,我們把自身在并行計算和處理功耗方面的經(jīng)驗用于端側(cè)圖形處理和AI計算,將會給行業(yè)帶來巨大進步。” Imagination 中國區(qū)技術(shù)總監(jiān)艾克先生分析說,“我們要專注解決端側(cè)AI的低功耗、成本和極致的利用率等核心訴求,用一些革新來滿足AI邊緣側(cè)的客戶需求。
圖:Imagination 中國區(qū)技術(shù)總監(jiān)艾克
5月8日,Imagination Technologies推出 Imagination E-Series GPU IP,E 系列憑借其高效的并行處理架構(gòu),在提供卓越圖形性能的同時,針對人工智能工作負載,其 INT8/FP8 算力可在2TOPS到 200 TOPS 之間擴展。
Imagination E Seriers GPU IP有兩大優(yōu)勢:一是采用Burst Processors(爆發(fā)式處理器),這種極富創(chuàng)新的架構(gòu)設(shè)計使邊緣應(yīng)用中平均功耗效率提升35%。
“IMG E系列IP相對于D系列,平均有35%功耗效率提升,實現(xiàn)每瓦更高的性能,這對于端側(cè)AI的低功耗是非常有價值的,對于消費類設(shè)備,特別是對功耗敏感的設(shè)備,E系列的IP可以帶來電池壽命的增加,待機的時間就會更長?!?艾克說。
計算核心的架構(gòu)革新是效能提升的源頭,艾克介紹,現(xiàn)在的計算包括圖形計算、通用并行計算、專門針對AI的處理。Burst Processors能夠提升不同計算類型的能效,它通過降低整個處理流水線的延遲,減少了每個ALU單元的流水線深度,可以將更多數(shù)據(jù)在本地進行重復(fù)使用。此外,E系列GPU在架構(gòu)上有一項重要的設(shè)計,就是在每個計算單元中都有將近0.5Mb的寄存器空間,優(yōu)化了GPU的緩存,芯片上可以保留處理的數(shù)據(jù),這種架構(gòu)可以在沒有增加芯片面積的情況下,增加AI相關(guān)的高效處理管線,即可以支持不同AI數(shù)據(jù)類型,對能效進行持續(xù)改進。
35% 的能效提升是純粹依靠硬件架構(gòu)的改進來實現(xiàn)的,具體包括了整體調(diào)度、數(shù)據(jù)的存取以及數(shù)據(jù)類型,還有新的imagination加入的處理流水線。值得關(guān)注的是,我們沒有通過工藝制程來實現(xiàn)提升,而是純粹是硬件架構(gòu)的革新帶來了能效提升。
二是Neural Cores(神經(jīng)核):最高可擴展至 200 TOPS(INT8/FP8),顯著提升 AI與計算性能。
電子發(fā)燒友的調(diào)研顯示,邊緣側(cè)設(shè)備的類型多樣,從智能屏、AR眼鏡、智慧屏、智能手機、AI PC、智駕汽車,這些設(shè)備端算力的需求呈現(xiàn)差異化分布。以端側(cè)AI音頻芯片支持可穿戴設(shè)備為例,僅需要0.1TOPS到3TOPS算力,到AI PC就需要40TOPS 到60TOPS算力,L2級別智駕汽車的算力需求就上升到100TOPS到200TOPS。
“E系列采用Neural Cores,以4核配置為例,當它跑到 1.6 G頻率同時4核一起工作的的情況下,它所表現(xiàn)出來的這種圖形和AI性能首先它會有一個每秒400Gpixel(64G*1.6*4)的像素填充滿足Graphic所需要的繪制,最高可以支持200TOPS算力(INT8/FP8),顯著提升了AI性能和計算能力。” 艾克指出。
它為未來的邊緣應(yīng)用提供了一種通用且可編程的解決方案,涵蓋圖形渲染、桌面應(yīng)用、智能手機上的自然語言處理、工業(yè)計算機視覺以及自動駕駛等領(lǐng)域。
邊緣AI開啟多元化時代,中國成為全球重點市場
有了Imagination提供的高效能E系列GPU IP,芯片設(shè)計公司就更容易基于這個系列設(shè)計出差異化的GPU應(yīng)用在不同的領(lǐng)域。
以汽車領(lǐng)域為例,E系列GPU可以在三個方面滿足汽車芯片設(shè)計客戶的需求。首先,Imagination通過E系列IP的可擴展性支持汽車行業(yè);入門級的汽車僅需要40TOPS的算力來處理車載信息娛樂系統(tǒng),而ADAS的功能從車道識別、保持,擴充到路面障礙物檢測,需要更高算力,Imagination的E系列IP性能可擴展至200 TOPS INT8,神經(jīng)核支持多種主流 AI 數(shù)值格式,滿足不同精度、性能與功耗需求。
二、靈活性。市場上銷售一款車型5年,未來10到15年可能需要為車主提供OTA升級,升級了算法之后,硬件如何提供相應(yīng)的支持就十分關(guān)鍵。
GPU作為可編程處理器,通過面向未來的架構(gòu)設(shè)計,使設(shè)備能夠持續(xù)應(yīng)對 AI、計算和圖形工作負載的演進。E-Series神經(jīng)核通過在 GPU 內(nèi)部深度集成 AI 加速能力,與更廣泛的 GPU 及異構(gòu)計算軟件生態(tài)實現(xiàn)無縫協(xié)同。而專用處理器NPU就無法做到這點。
三、Imagination 的 GPU 產(chǎn)品遵循汽車功能安全標準設(shè)計。E 系列 GPU 面向汽車客戶,提供了一系列關(guān)鍵功能,具備行業(yè)領(lǐng)先的功能安全特性,確保 GPU 硬件安全性達到業(yè)界最高水平。在日益普及的艙駕融合應(yīng)用中,Imagination 的 GPU 不僅能夠保障駕駛輔助系統(tǒng)的穩(wěn)定運行,同時也能帶來絲滑流暢的圖形顯示體驗,實現(xiàn)安全與性能的完美平衡。
對于開發(fā)者而言,E-Series神經(jīng)核與GPU及異構(gòu)計算軟件協(xié)同,其算力可通過OpenCL 等主流 API直接調(diào)用,開發(fā)者借助oneAPI、Apache TVM 或 LiteRT等開放標準工具,能輕松將工作負載遷移至神經(jīng)核。Imagination的計算庫與高度優(yōu)化的圖形編譯器,進一步釋放了GPU的全部潛能。
Imagination 創(chuàng)新與工程負責人 Tim Mamtora 表示:“E-Series 將 GPU 放在圖形與邊緣 AI 系統(tǒng)的核心位置。對需要同時運行圖形與計算任務(wù)的系統(tǒng)設(shè)計者而言,E-Series GPU 提供了一種高度靈活的解決方案,既無需依賴額外的向量處理器或固定功能 AI 加速器,又能在降低整體系統(tǒng)設(shè)計成本的同時,實現(xiàn)面向未來的可擴展性。”
“我們推出的新一代GPU IP 產(chǎn)品能夠為客戶提供兼顧圖形渲染和 AI 計算的統(tǒng)一解決方案,為芯片設(shè)計帶來更大的自由度和競爭力。中國一直是我們?nèi)蜃钪匾膽?zhàn)略市場之一,過去幾年中,無論外部環(huán)境如何變化,我們始終堅持對中國客戶的長期承諾。未來,我們將持續(xù)加大對中國市場的投入,不僅加大本土技術(shù)支持團隊的建設(shè),還將升華與本土生態(tài)伙伴的合作,幫助客戶抓住新一輪 AI 浪潮帶來的市場機遇?!?Imagination 中國董事長兼亞太區(qū)域總裁白農(nóng)總結(jié)說。
據(jù)悉,首款 E-Series GPU IP 將于 2025 年秋季正式上市,目前已完成授權(quán)。汽車、消費電子、桌面及移動版本亦在同步開發(fā)中。
來源:電子發(fā)燒友網(wǎng)