近日,此芯科技與百度聯合發布基于此芯P1處理器和百度ERNIE4.5的Edge AI端到端解決方案,實現國產高性能SoC與大模型的深度協同。該方案以此芯自研P1處理器(6nm制程/12核Armv9 CPU/30TOPS算力NPU/45TOPS綜合算力)為異構計算基座,深度融合百度ERNIE4.5技術生態,成功構建從芯片層到模型層以及應用層的全棧閉環,為邊緣端側AI的落地樹立全新標桿。
ERNIE 4.5開源即落地,端側性能卓越領先
在ERNIE 4.5開源首日,此芯科技率先完成多個模型端側適配,實測性能實現兩大突破:
· 百億級模型流暢運行:
ERNIE-4.5-21B-A3B(210億參數)在此芯P1處理器上推理速度近20tokens/s,可支撐復雜語義理解與多輪對話場景;實時生成100字文本僅需5秒。
· 超輕量化模型極致效能:
ERNIE-4.5-0.3B(3億參數) 推理速度飆升至122tokens/s,為移動/IoT設備提供“無感級”AI交互體驗。
此外,依托NPU的異構加速,PaddleOCR經量化后,可以有效識別多語種文本,在端側AI的部署實現數據零外傳、響應超低延遲,可以為金融、醫療、政務等高敏場景提供安全智能基座。
加碼ERNIE 4.5應用引擎,重構終端AI體驗
基于此芯P1處理器與ERNIE 4.5,雙方構建端側AI全棧解決方案:
圖:Chatbot
此芯科技和百度文心、飛槳的“硬件+模型”協同優化,融合了異構計算架構、量化壓縮技術、端云協同推理,實現動態分配計算任務,提高復雜場景的響應速度。
此芯產品介紹
此芯P1處理器是此芯科技推出的首款SoC芯片,異構集成Armv9.2指令集的12核心CPU、10核心Immortalis G720 GPU和30TOPS(INT8)算力NPU。此芯P1處理器制程工藝為6nm,綜合算力45TOPS(INT8),支持最大64GB共享內存,提供高帶寬IO,可滿足端側AI方案的高性能和擴展性要求。此芯科技聚焦于高性能桌面PC產品、智能座艙、具身智能、邊緣計算等通用智能解決方案
未來已來,共筑端云協同智能體
此芯科技與百度將持續深化合作,包括ERNIE 4.5更多模型在此芯P1處理器上的輕量化適配、聯合舉辦開發者大賽,共建大模型端側開源社區,賦能廣大開發者,并推動AI產業的普惠化進程。
此芯產品采購渠道:
https://radxa.com/products/orion/o6/#buy
ERNIE 4.5下載地址:
https://github.com/PaddlePaddle/ERNIE
直播預告
來源:飛槳PaddlePaddle