AI手機PC大爆發(fā),Arm從軟硬件到生態(tài)發(fā)力,打造行業(yè)AI百寶箱
智東西
作者 | 云鵬
編輯 | 漠影
隨著(zhù)“Gen-AI”時(shí)代的到來(lái),AI手機、AI PC等關(guān)鍵核心移動(dòng)設備都在快速與生成式AI結合,越來(lái)越多的AI新功能涌現,深刻影響著(zhù)我們每個(gè)人的生活和工作。
需求變得多樣化,場(chǎng)景也更加復雜,生成式AI帶來(lái)新的算力挑戰和存儲挑戰,加速著(zhù)背后一系列硬件、軟件、算法、生態(tài)等方面的技術(shù)迭代。
作為一切移動(dòng)計算“根基”提供者的Arm,也在積極開(kāi)拓新的解決方案,給行業(yè)帶來(lái)新的解題思路。
近年來(lái),Arm已不止于提供IP,從架構、硬件、軟件到生態(tài),Arm轉型為一家計算平臺公司,為產(chǎn)業(yè)提供完整的計算解決方案。
針對云數據中心和汽車(chē)應用,Arm相繼推出對應的計算子系統(CSS),而就在上周,Arm為終端設備市場(chǎng)發(fā)布了首款終端計算子系統(CSS),結合了最新Armv9架構的特性,其中CPU和GPU在A(yíng)I方面都有大幅性能提升。此外,Arm還為開(kāi)發(fā)人員量身定制了開(kāi)發(fā)工具Kleidi。
今年Arm從全面計算解決方案(TCS)升級到了終端CSS,兩者的主要不同之處在于,Arm首次提供了CPU和GPU物理實(shí)現,這可以讓構建和部署基于A(yíng)rm架構的解決方案變得更加簡(jiǎn)單。顯然,這樣的改變正是為了讓生態(tài)伙伴可以快速把握AI新機遇,加速產(chǎn)品上市進(jìn)程。
可以說(shuō),這無(wú)疑是Arm面向AI時(shí)代的一次關(guān)鍵發(fā)力,Arm這一系列重磅技術(shù)和新品都瞄準了端側AI。
此次智東西對話(huà)Arm 終端事業(yè)部產(chǎn)品管理副總裁James McNiven,對背后的關(guān)鍵突破進(jìn)行了深入挖掘,對Arm在生成式AI時(shí)代的布局和深入思考進(jìn)行了探討。
我們可以清晰地看到,Arm正在通過(guò)橫跨架構、硬件、軟件、生態(tài)的完整解決方案,讓合作伙伴的產(chǎn)品快速與AI結合并推向市場(chǎng),實(shí)現落地,為行業(yè)打造一個(gè)“AI百寶箱”。
一、移動(dòng)生成式AI浪潮涌起,Arm深入底層,從架構到軟硬件全家桶賦能
在今天的智能終端產(chǎn)業(yè)中,AI手機和AI PC無(wú)疑已經(jīng)成為了產(chǎn)業(yè)關(guān)注的焦點(diǎn)賽道,生成式AI在這兩個(gè)領(lǐng)域的融合也最為快速。終端設備能夠處理的任務(wù)越來(lái)越復雜,并且生成式AI在感知、理解、交互等方面都帶來(lái)了全新的技術(shù)挑戰,涌現出更多的計算需求。
行業(yè)需要重新思考:什么才是適合生成式AI時(shí)代的計算平臺?
如今一切移動(dòng)端生成式AI的運行幾乎都離不開(kāi)Arm的CPU和GPU,據了解,有70%的第三方安卓ML工作負載都是在CPU上運行的,因此CPU仍然是AI時(shí)代計算的核心。
在這樣的背景下,Arm作為底層關(guān)鍵技術(shù)提供者,無(wú)疑已成為這場(chǎng)AI變革的關(guān)鍵變量。
1、AI能力大幅提升背后,Arm的“DNA”與生成式AI相契合
為什么如此關(guān)鍵?AI時(shí)代帶來(lái)了諸多挑戰,其中最明顯的就是,高性能和高能效的重要性被放到了空前高度,而能效恰恰是Arm的DNA。
新的終端CSS基于最新的Armv9構建,計算和圖形性能提升幅度超過(guò)30%,同時(shí)其AI推理速度提高了59%,這些提升對于處理要求更加嚴苛的安卓實(shí)際用例以及AI、ML和計算視覺(jué)工作負載都十分重要。
采用3nm工藝的新Arm Cortex-X925主頻飆至3.8GHz,配合微架構的改進(jìn),與2023年旗艦智能手機采用的4nm SoC相比,其單線(xiàn)程性能提高了36%。
在A(yíng)I性能方面,Cortex-X925的token 首次響應時(shí)間提高了41%,這可以提升如大語(yǔ)言模型等端側生成式AI的響應能力。
McNiven透露,為了提升AI算力,Arm采用了迄今為止最寬的解碼和矢量的微架構設計,實(shí)現了50% TOPS數的增長(cháng)。
GPU方面,新Arm Immortalis-G925 GPU在各類(lèi)頭部手游應用中實(shí)現了37%的性能提升,在多個(gè)AI和ML網(wǎng)絡(luò )上實(shí)現了34%的性能提升。
值得一提的是,Arm終端CSS還具備基于3nm工藝生產(chǎn)就緒的 CPU 和 GPU 物理實(shí)現。
據了解,物理實(shí)現中包括晶體管的設計和線(xiàn)路,可以顯著(zhù)幫助Arm的合作伙伴節省芯片開(kāi)發(fā)的時(shí)間,同時(shí)優(yōu)化芯片的性能和能效。
2、給開(kāi)發(fā)者打造一把解鎖更強性能的“鑰匙”
除了架構和硬件設計,在工具和軟件庫方面,Arm還首次發(fā)布了Arm Kleidi,其中包括面向AI工作負載的KleidiAI和面向計算機視覺(jué)應用的KleidiCV。
Arm做Kleidi最核心的目的,就是要確保開(kāi)發(fā)者能夠快速獲得開(kāi)發(fā)生成式AI應用所需的性能、工具和軟件庫。
簡(jiǎn)單理解,KleidiAI是一套面向AI框架開(kāi)發(fā)者的計算內核,像PyTorch、Tensorflow、MediaPipe這樣的熱門(mén)AI框架都已經(jīng)集成到KleidiAI中了,這對于加速主流AI大模型是十分重要的。
值得一提的是,在A(yíng)rm看來(lái),CPU是唯一可以確保運行未來(lái)網(wǎng)絡(luò )的計算引擎,因此對于可以解鎖 Arm CPU 最高性能的Kleidi,無(wú)疑是開(kāi)發(fā)人員解鎖AI應用的最佳利器。
總體來(lái)看,此次Arm終端CSS出色的架構升級、性能和能效的大幅提升為功能更豐富、性能更強、更智能的終端設備鋪路,擴展了移動(dòng)設備的可能性和能力。同時(shí)Arm的軟件層面的開(kāi)發(fā)工具和平臺則讓開(kāi)發(fā)者可以快速地將這些Arm的技術(shù)優(yōu)勢落地到應用和產(chǎn)品中,可以說(shuō)Arm打造了移動(dòng)端AI落地的“百寶箱”。
二、AI PC火爆加速WoA生態(tài)生長(cháng),移動(dòng)端AI生態(tài)圈Arm挑大梁
正如前文所說(shuō),Arm提供的不僅僅是某一單點(diǎn)技術(shù)或產(chǎn)品,而是一個(gè)完整的解決方案,這背后,基于架構、硬件、軟件之上實(shí)現的生態(tài)優(yōu)勢,也是Arm最硬的底牌之一。
在A(yíng)I手機和AI PC兩大移動(dòng)智能終端設備快速發(fā)展的當下,Arm生態(tài)迎來(lái)一輪新的增長(cháng)高潮。隨著(zhù)微軟等廠(chǎng)商對于移動(dòng)AI PC的大力推動(dòng),Windows與Arm生態(tài)的融合加速,我們將有望看到越來(lái)越多的PC終端巨頭推出基于A(yíng)rm架構處理器的AI PC。
在本周的臺北國際電腦展上,Arm首席執行官喊出,五年內Arm架構的PC將搶下50%市場(chǎng)份額。這強大的自信很大一部分是來(lái)自 “Arm原生”的爆發(fā)式增長(cháng)。
McNiven特別談到,對于WoA生態(tài)系統來(lái)說(shuō),今年是成果豐碩的一年。除了Microsoft Office、Dropbox、Zoom、Adobe套件,越來(lái)越多的應用正在成為Arm 原生應用,尤其是吉印通、嗶哩嗶哩、Chrome 瀏覽器、愛(ài)奇藝、搜狗、騰訊吉印通13816211622音樂(lè )等頭部應用。
此外還有許多針對創(chuàng )作者的開(kāi)源工具,例如最近新增的Audacity、Blender和OBS Studio,這些應用整合了大量的開(kāi)源庫和開(kāi)發(fā)者工具。
Arm與微軟合作,通過(guò)資助開(kāi)源和發(fā)布面向Windows的Arm性能庫來(lái)發(fā)展生態(tài)系統。據了解,對于大多數用戶(hù)來(lái)說(shuō),他們絕大部分時(shí)間都在基于A(yíng)rm CPU的AI PC上運行Arm原生應用。
微軟CEO薩蒂亞·納德拉(Satya Nadella)在Build大會(huì )上說(shuō),現有Arm PC應用程序中有87%都是原生的Arm版本,這一數字還在不斷增長(cháng)。
可以預見(jiàn),隨著(zhù)越來(lái)越多Arm原生應用的加入,Arm PC的體驗和WoA生態(tài)也將更加完善。
據了解,如今Arm的技術(shù)合作伙伴已經(jīng)有1000多家,Arm無(wú)疑有著(zhù)芯片領(lǐng)域的“最強朋友圈”,而這個(gè)朋友圈,更直觀(guān)的來(lái)看,就是Arm生態(tài)——更多的設備基于A(yíng)rm,更多的應用基于A(yíng)rm,移動(dòng)終端AI體驗,離不開(kāi)Arm。
生態(tài)是Arm最硬的王牌之一,Arm也成為移動(dòng)智能終端產(chǎn)業(yè)的“幕后王者”。
今天的Arm,正在提升企業(yè)和開(kāi)發(fā)者快速把AI用在產(chǎn)品中,用對、用好,實(shí)現落地的能力,真正打造出生成式AI時(shí)代的移動(dòng)芯片百寶箱。
結語(yǔ):從IP到計算子系統,Arm成為移動(dòng)AI生態(tài)隱形王者
可以看到,Arm正將前沿的CPU和GPU技術(shù)、生產(chǎn)就緒的物理實(shí)現和持續的軟件優(yōu)化相結合,終端計算子系統(CSS)與Kleidi軟件的結合,也令其成為當下芯片設計領(lǐng)域新AI計算平臺的優(yōu)秀范例。
如今,Arm低功耗處理器設計和軟件平臺已應用于超過(guò)2800億顆芯片,從傳感器到智能手機乃至超級計算機。在A(yíng)I變得無(wú)處不在的未來(lái),Arm同樣將無(wú)處不在??梢哉f(shuō),Arm架構是未來(lái)的基石,Arm生態(tài)也將繼續加速生長(cháng)。
面向生成式AI的未來(lái),移動(dòng)智能終端產(chǎn)業(yè)必然將涌現出更多創(chuàng )新,Arm將如何通過(guò)技術(shù)創(chuàng )新保持自身的核心競爭力并不斷壯大自身的生態(tài),我們拭目以待。