向下扎到根,向上捅破天,華為闖入AI深水區
智谷趨勢(ID:zgtrend) | 王延鶴
華為,底氣十足。
剛剛,華為開(kāi)發(fā)者大會(huì )(HDC 2024)召開(kāi),華為向世界展現了一種精神:向下扎到根,向上捅破天。下一個(gè)破局者,依然是華為。
本次大會(huì ),盤(pán)古大模型5.0全面升級,將AI扎根到千行百業(yè),解決落地問(wèn)題;華為云昇騰AI云服務(wù),要做好算力底座,破解算力的瓶頸。
華為抓住了AI當前最核心的問(wèn)題,技術(shù)突破、自證價(jià)值、真正落地。當人們習慣強調AI炫技或者價(jià)格時(shí),華為更強調產(chǎn)業(yè)落地創(chuàng )造實(shí)際的價(jià)值。
過(guò)去幾年,華為勇挑大梁,在做底層硬件、算力、AI大模型以及應用生態(tài)的全面更新。
如果只看研發(fā)資金,華為2023年的投入超1647億元,是唯一研發(fā)超過(guò)200億美金,能與谷歌、蘋(píng)果、微軟和Meta媲美的中國企業(yè)。
這種務(wù)實(shí)精神的背面,是華為的孜孜追求:能否將破局之力,帶入更多領(lǐng)域的科技創(chuàng )新?
01
9.9一杯的奶茶,成本100億的AI大模型,能有什么共同點(diǎn)?
答:他們都在打價(jià)格戰。
過(guò)去一個(gè)多月,幾乎是AI界的春晚。從OpenAI更新GPT-4o,谷歌I/O大會(huì ),微軟的AI PC,英偉達3萬(wàn)億美金到蘋(píng)果公布Apple Intelligence。各種“顛覆式”“AI時(shí)刻”主導了這段時(shí)間的科技圈。
而AI大戰的B面,則是價(jià)格戰。ChatGPT在去年就推出Enterprise企業(yè)版,并且下調B端調用價(jià)格吸引客戶(hù),對于C端用戶(hù)也有限免費了GPT-4o。Sam Altman聲稱(chēng)92%的世界500強公司已在使用ChatGPT。
國內科技界則把價(jià)格戰卷到了新地步?;梅紻eepSeek、智譜AI先后降價(jià),之后字節跳動(dòng)將豆包通用模型Pro-32k的輸入價(jià)格,直接打到0.0008元/千tokens,號稱(chēng)比行業(yè)均價(jià)便宜99.3%;
阿里將9款通義千問(wèn)模型降價(jià),其中Qwen-Long主力模型降價(jià)97%;吉印通則直接宣布,將ERNIE Speed和ERNIE Lite兩款模型免費。
這場(chǎng)降價(jià)潮里,是普通用戶(hù)、開(kāi)發(fā)者和中小企業(yè)受益,加速了AI在國內的滲透普及率。但質(zhì)疑的聲音也被提出:價(jià)格戰能否持續??jì)r(jià)格戰之外的路,比如模型技術(shù)、打造超級應用,誰(shuí)有差異化競爭優(yōu)勢?
李開(kāi)復表示,整個(gè)行業(yè)每年降低10倍推理成本是可以期待的,瘋狂降價(jià)是“雙輸”的打法,技術(shù)還是最重要的,如果技術(shù)不行,就純粹是貼錢(qián)賠錢(qián)做生意。
月之暗面創(chuàng )始人楊植麟認為,今天AI在人的工作流中占比可能只有1%,未來(lái)AI在某個(gè)節點(diǎn)超過(guò)人類(lèi),就會(huì )產(chǎn)生新的商業(yè)模式,不再像今天在B端API調用上打價(jià)格戰,而是一個(gè)普惠的AI。
“降低模型推理成本并不難,難的是探索模型總和能力的上限?!盡inimax創(chuàng )始人閆俊杰表示。
紅杉資本此前發(fā)布了報告《生成式AI的第二幕》,指出兩點(diǎn):
·由技術(shù)驅動(dòng)的生成式AI第一幕已經(jīng)落幕;
·市場(chǎng)進(jìn)入“第二幕”,需要真正直面人類(lèi)的問(wèn)題,回應客戶(hù)的需求。
這些觀(guān)點(diǎn)指向一個(gè)現實(shí):AI目前最大的問(wèn)題,還不是需求或成本,數據也不是壁壘,商業(yè)和應用上證明AI的價(jià)值更重要。
在席卷業(yè)界的大討論里,華為云始終保持冷靜。
對賬面資金充裕的華為來(lái)說(shuō),要打價(jià)格戰不要太容易,是很容易就能相出的策略。但什么是“正確的事,正確地做”?
在HDC 2024,華為給出的答案是降落傘自己先跳,先把事情干好。
會(huì )上,華為常務(wù)董事、華為云CEO張平安發(fā)布盤(pán)古大模型5.0,在全系列、多模態(tài)、強思維三個(gè)方面升級;且展示了盤(pán)古大模型應用到自動(dòng)駕駛、工業(yè)設計、具身智能和高鐵、鋼鐵、氣象等落地實(shí)踐案例。
此外,華為云CTO張宇昕、華為諾亞方舟實(shí)驗室主任姚駿分別就華為云全棧系統性創(chuàng )新、盤(pán)古大模型5.0技術(shù)解密發(fā)表主題演講,詳細解讀華為云在A(yíng)I領(lǐng)域的全棧創(chuàng )新優(yōu)勢。
他們要回答最根本的問(wèn)題:AI到底能做什么事?行業(yè)怎么才能用上AI?中國發(fā)展AI還有哪些堵點(diǎn),要怎么打通?
這需要華為在技術(shù)創(chuàng )新能向上捅破天,在產(chǎn)業(yè)落地上要向下扎到根。
這種極為務(wù)實(shí)的精神,指導著(zhù)華為闖入AI的第二幕。
02
盤(pán)古大模型所有努力都是朝著(zhù)一個(gè)方向:讓AI真正解難題、做難事,重塑千行萬(wàn)業(yè)。
這既要技術(shù)突破瓶頸,也要解決非常實(shí)際的落地工程問(wèn)題。早在盤(pán)古大模型3.0發(fā)布時(shí),華為云就采用完全的分層解耦設計,包括“5+N+X”的三層架構,可以快速適配、快速滿(mǎn)足行業(yè)的多變需求。
L0層是包含自然語(yǔ)言、視覺(jué)、多模態(tài)、預測、科學(xué)計算的5個(gè)基礎大模型;
L1層是N個(gè)行業(yè)通用大模型,目前已在政務(wù)、制造、金融、礦山、氣象等30多個(gè)行業(yè)落地;
L2層是更細化的場(chǎng)景模型,比如政務(wù)熱線(xiàn)、臺風(fēng)路徑預測、網(wǎng)點(diǎn)助手等,主打“開(kāi)箱即用”的應用服務(wù),目前已在400多個(gè)場(chǎng)景落地;
盤(pán)古大模型此次升級,直接進(jìn)入5.0時(shí)代,正是讓技術(shù)真正“創(chuàng )造價(jià)值”的。
首先,盤(pán)古5.0包括小中大超大杯,4種不同參數規格,可以讓客戶(hù)根據訴求隨心選擇。
Pangu E(Embeded):十億級參數,可支撐手機、PC等端側的智能應用;
Pangu P(Professional):百億級參數,滿(mǎn)足低時(shí)延、低成本的推理需求;
Pangu U(Ultra):千億級參數,成為企業(yè)通用大模型的堅實(shí)底座;
Pangu S(Super):萬(wàn)億參數超級大模型,能夠處理跨領(lǐng)域多任務(wù);
同時(shí),盤(pán)古5.0重點(diǎn)升級了多模態(tài)和強思維兩方面的能力,幫助大模型更好更精準理解我們生活的多模態(tài)的物理世界。
從現場(chǎng)演示來(lái)看,它在學(xué)習了整張清明上河圖后,可以精準回答“趙太丞家有多少個(gè)人?”,答,“一共有四個(gè)人”。而趙太丞家在原畫(huà)里占的畫(huà)幅還不到200分之一。
清明上河圖答題
多模態(tài)升級后,盤(pán)古5.0能精準地理解物理世界,包括文本、圖片、視頻、雷達、紅外、遙感等多種模態(tài)。其次,憑借華為云首創(chuàng )的可控時(shí)空生成技術(shù)(STCG),AI能夠真正“看懂”這些信息,并且生成更符合物理規律的多模態(tài)內容。
這種能力,可以直接應用到工業(yè)制造、自動(dòng)駕駛、建筑等價(jià)值場(chǎng)景。
比如,輸入一張衛星遙感圖片,盤(pán)古大模型能準確分析這片區域的地理情況,農作物的生長(cháng)環(huán)境,然后預估作物產(chǎn)量,并且給出培育和防病蟲(chóng)害的建議;再比如通過(guò)巨大的病理照片找到我們想要的病菌的數量級,賦能醫學(xué)研究。
在思維鏈方面,盤(pán)古5.0將思維鏈技術(shù)與策略搜索深度結合,極大提升了數學(xué)能力、復雜任務(wù)規劃能力,以及工具調用能力。思維鏈技術(shù)能幫助智能體(如機器人)更好地理解和預測環(huán)境變化,"策略搜索"則是智能體用來(lái)適應這些變化并做出決策的過(guò)程。兩者共同作用,能使智能體能夠在復雜環(huán)境中進(jìn)行有效的學(xué)習和決策。
智能體是AI的未來(lái),能夠進(jìn)行復雜邏輯推理,也是大模型成為行業(yè)助手最關(guān)鍵的特征。
在具身智能方面,華為云現場(chǎng)展示了搭載盤(pán)古5.0的樂(lè )聚“夸父”機器人。
它可以識別和理解自己所處的環(huán)境,并且通過(guò)學(xué)習和決策,完成10步以上的復雜任務(wù)規劃。比如它除了回答問(wèn)題、打招呼以外,就能理解人類(lèi)“口渴”的需求,并從現場(chǎng)物品中選出瓶裝水、遞水。
03
中國有很多規模做到世界第一的產(chǎn)業(yè)。這背后意味著(zhù)生產(chǎn)制造的世界工廠(chǎng),和豐富的消費場(chǎng)景,都是能激發(fā)AI、利用AI的對象。
用AI科技革命疊加產(chǎn)業(yè)轉型升級,也是目前政府推動(dòng)新質(zhì)生產(chǎn)力發(fā)展的主要陣地。
在HDC 2024上,華為云展示了豐富的盤(pán)古大模型落地案例,有兩個(gè)案例給我印象最深刻。
一個(gè)是鋼鐵大模型。
寶武鋼鐵是目前全球規模最大的鋼鐵企業(yè),年鋼產(chǎn)量超1億噸。這個(gè)龐然大物要轉型,既是一個(gè)AI落地課題,也事關(guān)綠色環(huán)保、產(chǎn)業(yè)升級的進(jìn)程。
2023年,寶武鋼鐵已經(jīng)和華為就數字化轉型展開(kāi)合作,雙方致力于立足鋼鐵行業(yè)前沿課題,運用人工智能、大數據工具和方法,形成鋼鐵冶金領(lǐng)域或工業(yè)領(lǐng)域大模型。
華為云方案主要應用在高爐煉鐵和熱軋鋼帶兩個(gè)環(huán)節中。
高爐煉鐵場(chǎng)景被認為是AI落地最難的應用場(chǎng)景,雙方通過(guò)用盤(pán)古鋼鐵大模型進(jìn)行高爐爐況預測,指導高爐生產(chǎn)調控,可以大幅提升爐內工況的穩定性。經(jīng)過(guò)實(shí)踐發(fā)現,每減少10℃的溫度波動(dòng),每噸鐵水就能減少1kg焦炭消耗,成本降低3塊錢(qián);僅每年高爐爐況的優(yōu)化,就能讓寶鋼降低10億元的成本。
另一個(gè)是華為云在自動(dòng)駕駛的應用。
我們知道,自動(dòng)駕駛的競爭到了關(guān)鍵時(shí)刻。在自動(dòng)駕駛訓練里,最難的是遍歷復雜場(chǎng)景的Corner Case,這要靠車(chē)企海量的路測數據,或者在虛擬環(huán)境仿真訓練,成本高、耗時(shí)長(cháng)。
這次升級多模態(tài)升級后,盤(pán)古5.0可以生成像Sora一樣,符合物理規律、真實(shí)世界的視頻的。
但華為沒(méi)有去做一鏡到底的娛樂(lè )視頻,而是把能力投入到行業(yè)急需的價(jià)值場(chǎng)景,就比如,生成自動(dòng)駕駛的訓練數據。
盤(pán)古大模型能生成車(chē)身六個(gè)攝像頭視角的視頻,并且能控制行駛環(huán)境的天氣、道路、車(chē)況,這就解決了自動(dòng)駕駛的數據難題。
現在車(chē)企在競速解鎖高階智駕,華為能否跑到前面,或許要由盤(pán)古大模型決定。
作為大模型行業(yè)應用的主力軍和排頭兵,政企客戶(hù)通常業(yè)務(wù)場(chǎng)景復雜多樣,對數據安全、訓推效率和開(kāi)發(fā)成本都有極致的要求。能夠兼顧安全合規與成本的大模型混合云,正在成為越來(lái)越多企業(yè)的優(yōu)先選擇。在2023年,華為云就推出業(yè)界首個(gè)大模型混合云華為云Stack。
經(jīng)過(guò)一年實(shí)踐,華為云不斷精進(jìn),總結發(fā)布了大模型混合云十大創(chuàng )新技術(shù),包括多樣性算力調度、云邊協(xié)同、AI-Native存儲、增強AI網(wǎng)絡(luò )、算子加速、全鏈路數據工程、統一數據編碼、精細視覺(jué)神經(jīng)網(wǎng)絡(luò )、無(wú)感斷點(diǎn)續訓、安全護欄,覆蓋從云基礎設施到AI開(kāi)發(fā)平臺以及模型層,致力于解決大模型在政企落地的“最后一公里”,加速政企大模型應用進(jìn)程。
實(shí)際上,行業(yè)場(chǎng)景應用之外,AI手機、AI PC等終端也是目前人工智能應用規模最大的場(chǎng)景。
華為的盤(pán)古大模型,也堅持“自己的降落傘自己先跳”,把華為的云服務(wù)、手機、汽車(chē)、操作系統等業(yè)務(wù)都改造一遍。
去年12月,問(wèn)界M9發(fā)布,車(chē)載的智能助手小藝已經(jīng)接入盤(pán)古大模型;今年4月,余承東也宣布MateBook X Pro應用盤(pán)古,打造AI PC;目前華為手機,已經(jīng)升級了AI拍照增強、AIGC生成、云助小藝的功能。
這些提升,是C端消費用戶(hù)能直接體驗到的。隨著(zhù)HarmonyOS NEXT的到來(lái),華為終端和華為云盤(pán)古大模型的融合,還將繼續深化。
04
算力是AI時(shí)代的核心驅動(dòng)力。
英偉達成為全球市值第一后,黃仁勛脫下黑色皮衣,跑去加州理工的畢業(yè)生做演講。
他引用諾獎物理得主理查德·費曼的名言,和流行天后Taylor Swift的梗:
“世界是不確定的,是不公平的,你可能拿到的是一張爛牌,那你該shake it off??倳?huì )有其他機遇,或者,創(chuàng )造你自己的機遇?!?/p>
AI創(chuàng )造遍地機遇的新世界,但算力供應已經(jīng)緊張。
微軟、亞馬遜、Meta等企業(yè),都有萬(wàn)張H100級的算力集群。
微軟宣布,每年要花500億美金建數據中心;Meta計劃再買(mǎi)35萬(wàn)張H100,到今年底可能累計有60萬(wàn)規模;馬斯克也準備了百億美金,買(mǎi)英偉達更先進(jìn)的B100和B200。
英偉達銷(xiāo)量
然而,英偉達的先進(jìn)GPU,哪怕是“閹割版”的A800/H800,中國企業(yè)也很難再獲取。
據報道,英偉達最新中國特供版的H20,算力只有H100的15%,性?xún)r(jià)比已經(jīng)不夠誘人。
國內除了阿里、吉印通、騰訊、字節跳動(dòng)少數互聯(lián)網(wǎng)公司,其他中廠(chǎng)和明星AI創(chuàng )業(yè)公司,都沒(méi)有萬(wàn)卡級A100/H100的算力儲備,依賴(lài)頭部云廠(chǎng)商的算力投資和合作。
這造成國內算力捉襟見(jiàn)肘。普通用戶(hù)也能感知到高峰時(shí)段明顯的等待和卡頓,而大企業(yè)用戶(hù)的采購需求也很難滿(mǎn)足。
當算力受限時(shí),我們又要如何創(chuàng )新,創(chuàng )造機遇呢?
華為的答案是,以昇騰AI云服務(wù)提供即開(kāi)即用的澎湃算力。
前兩天6月14日,華為云的華東(蕪湖)數據中心正式開(kāi)服。這標志著(zhù),華為云的貴州貴陽(yáng)、內蒙古烏蘭察布、安徽蕪湖、香港的4大AI云算力中心布局已經(jīng)成型。
通過(guò)AI算力一張網(wǎng),供應全國長(cháng)三角、大灣區、京津冀等地的需求,也為中國出海企業(yè)提供堅實(shí)可靠的支撐。企業(yè)不用再為自己買(mǎi)卡和自建數據中心焦慮,能從華為云買(mǎi)到即開(kāi)即用的算力。
去年9月,任正非提出,我們即將進(jìn)入第四次工業(yè)革命,基礎就是大算力。華為CFO孟晚舟說(shuō),要致力于打造中國堅實(shí)的算力底座,為世界構建第二選擇。
如今,華為云在不斷兌現自己的承諾。昇騰AI云服務(wù),就是專(zhuān)門(mén)提供AI算力,一個(gè)從硬件、基礎設施、算力集群、架構到軟件應用,華為全棧自研的生態(tài)。
除了自主可靠外,昇騰AI云服務(wù)在穩定性上也有競爭優(yōu)勢。業(yè)界萬(wàn)億參數模型訓練的平均無(wú)中斷時(shí)長(cháng)約2.8天,昇騰能做到40天穩定無(wú)中斷;業(yè)界平均集群故障恢復時(shí)間約60分鐘,昇騰AI云服務(wù)可以縮短到10分鐘。
在兼容性上,已全面適配行業(yè)主流的100多個(gè)大模型,服務(wù)600多家企業(yè)客戶(hù),以云服務(wù)的方式協(xié)助客戶(hù)開(kāi)發(fā),訓練,托管和應用模型,支撐了國內像大模型訓練、自動(dòng)駕駛研發(fā)、智慧城市等高算力需求的開(kāi)發(fā)項目。
華為在尋找一條破局之路。
它打破算力的束縛,成為一貫在做的“黑土地”,支撐模型研發(fā)、AI應用的誕生,讓千行萬(wàn)業(yè)放開(kāi)手腳去轉型升級;另一邊推動(dòng)AI大模型,從技術(shù)突破到產(chǎn)業(yè)落地,從理論前沿到最后一公里的突破。
華為在給世界構建第二選擇,也是在讓中國AI往前的底氣。