“文心大模型4.0與GPT4相比已毫不遜色”,近日,在2023百度世界大會上,百度CEO李彥宏如此介紹新發(fā)布的AI大模型。實(shí)際上,除了百度全情投入AI大模型研發(fā),國內(nèi)其它企業(yè)也在暗自較勁。國內(nèi)大模型市場已逐步形成“百模大戰(zhàn)”的局面,甚至在垂直汽車行業(yè)也刮起一股“GPT”熱風(fēng)。
眾多汽車廠商一邊競相注冊GPT商標(biāo),一邊加快GPT研發(fā)進(jìn)程,并衍生出兩種迥然不同的研發(fā)路徑。一種是大多數(shù)車企所選擇的“直接接入第三方AI大模型”路徑,例如長安接入百度AI大模型、奔馳使用微軟的Open AI服務(wù);另一種是少數(shù)車企堅(jiān)持的高難度“自研AI大模型”路徑,例如毫末智行發(fā)布了智能駕駛生成式大模型DriveGPT,吉利汽車在下半年即將發(fā)布汽車行業(yè)首個全棧自研的全場景AI大模型。
一眾車企摩拳擦掌背后,AI大模型究竟可以為汽車行業(yè)帶來哪些重大改變?面對這一輪極有可能引發(fā)行業(yè)大洗牌的科技革命,車企又該如何鍛造核心競爭力?
以AI大模型補(bǔ)齊智能駕駛“長尾問題”,優(yōu)化智能交互體驗(yàn)
掀起這一輪創(chuàng)業(yè)熱潮的AI大模型,指的是具有大規(guī)模參數(shù)和復(fù)雜結(jié)構(gòu)的人工智能模型。相比過去場景化定制的“小模型”,大模型可通過吸收數(shù)十億甚至數(shù)千億個訓(xùn)練參數(shù)而適配多種業(yè)務(wù)場景,并大幅降低AI開發(fā)與應(yīng)用的門檻,使得規(guī)模化解決行業(yè)問題成為可能。
具體到汽車行業(yè),在電動汽車作為新型智能終端的確切預(yù)期下,一個無法回避的問題是,目前車載智能系統(tǒng)的復(fù)雜多任務(wù)仍由諸多小模型分別實(shí)現(xiàn),并且仍有10%的智能駕駛場景難以覆蓋。而AI大模型在海量數(shù)據(jù)的加持下,有助于智能駕駛實(shí)現(xiàn)從感知到?jīng)Q策、規(guī)劃、控制的全AI優(yōu)化,同時幫助覆蓋全部道路場景,緩解智能駕駛的“長尾問題”。
目前,長城、理想、奔馳等眾多汽車廠商均在AI大模型領(lǐng)域競相發(fā)力,而吉利汽車更是早在2021年就進(jìn)行布局。上個月,吉利基于全棧自研的AI? DRIVE大模型,在國際智能駕駛領(lǐng)域的著名極端場景數(shù)據(jù)集ACDC(包含雨、霧、雪、夜等復(fù)雜場景)性能驗(yàn)證中,取得實(shí)時排行榜全球第一名的成績,代表了吉利AI?DRIVE大模型在極端場景的語義分割和泛化能力上處于國際領(lǐng)先水平。
與此同時,AI大模型還能有效改進(jìn)智能座艙的交互能力,在“軟件定義汽車”時代,這也是車企進(jìn)入智能化下半場角逐的關(guān)鍵。相比多數(shù)車企還停留在PPT或量產(chǎn)驗(yàn)證階段,吉利汽車全新自研汽車行業(yè)首個基于超大規(guī)模神經(jīng)網(wǎng)絡(luò)的AI對話模型,已完成對話大模型訓(xùn)練,包括500TB超大規(guī)模中文文本數(shù)據(jù)構(gòu)建及數(shù)據(jù)清洗算法開發(fā),使用了1.5T token超大規(guī)模中文數(shù)據(jù)集,能讓人車對話更流暢,讓車機(jī)實(shí)現(xiàn)秒懂秒回應(yīng)。
此外,吉利汽車已經(jīng)成功實(shí)現(xiàn)人工智能WOW壁紙的行業(yè)首發(fā),并首創(chuàng)AI音樂MV、AI兒童繪本等AI智能技術(shù)。作為國內(nèi)首款基于AI智能大模型全面開發(fā)的電混家轎,吉利銀河L6率先應(yīng)用這些AI技術(shù),已實(shí)現(xiàn)“新一代AI智能座艙十大應(yīng)用場景”全覆蓋,不僅掌握了主動搭訕、自動嗨歌等“i人”羨慕的社交神技,還能幫你哄娃、為你表演燈光秀......妥妥的“社牛神車”。據(jù)悉,這些AI智能技術(shù)也將陸續(xù)搭載在吉利和領(lǐng)克品牌的新車上。
大模型之爭尚處早期,算力和數(shù)據(jù)是關(guān)鍵
盡管AI大模型可以在智能駕駛、智能座艙等方面有效提高汽車競爭力,但也有不少行業(yè)人士認(rèn)為,大模型尚未合格,離規(guī)?;瘧?yīng)用在整車上距離尚遠(yuǎn)。其中一個難點(diǎn)在于,隨著智能駕駛算法進(jìn)一步升級,對運(yùn)算支持能力的要求也隨之升高。簡言之,AI大模型競爭,算力是關(guān)鍵。
今年9月,特斯拉自研超算Dojo就曾因摩根士丹利的研報而市值暴漲。實(shí)際上,國產(chǎn)自主車企并未甘居下游,吉利、小鵬、毫末等車企也在同步布局超級計算機(jī)產(chǎn)業(yè)鏈。其中,吉利星睿智算中心在今年2月上線,是自建規(guī)模最大、數(shù)據(jù)體量領(lǐng)先的國內(nèi)車企。
據(jù)悉,吉利星睿智算中心云端總算力高達(dá)81億億次/秒,可將人工智能大模型訓(xùn)練速度提升200倍,10億圖片數(shù)據(jù)全量訓(xùn)練時間從2.5個月縮短到8小時。吉利AI DRIVE大模型能夠在極端場景數(shù)據(jù)集ACDC性能驗(yàn)證中全球領(lǐng)先,核心支撐就在于星睿智算中心的強(qiáng)大算力。可以說,吉利汽車?yán)卫握莆樟薃I大模型開發(fā)中不可或缺的算力底座。
算力之外,優(yōu)質(zhì)數(shù)據(jù)的重要性日益凸顯。眾所周知,模型的進(jìn)一步優(yōu)化需要更多數(shù)據(jù),但隨著大模型已經(jīng)在窮盡所有公開的網(wǎng)絡(luò)數(shù)據(jù),大公司所掌握的私有數(shù)據(jù)成為差異化優(yōu)勢的關(guān)鍵。在眾多車企中,吉利掌握的優(yōu)質(zhì)私有數(shù)據(jù)源也極具競爭力。截至今年1月,吉利星睿智算中心已承載智能駕駛和車聯(lián)網(wǎng)實(shí)驗(yàn)數(shù)據(jù)近100PB,已實(shí)現(xiàn)對百萬在線車輛提供計算支持,日均數(shù)據(jù)增量成果100TB,預(yù)計2025年數(shù)據(jù)存儲規(guī)模將達(dá)到EB級別。
此外,車企在資本、人才、商業(yè)生態(tài)等領(lǐng)域的比拼也日益激烈。據(jù)國盛證券測算,大語言模型僅單次訓(xùn)練成本就介于200萬~1200萬美元之間,一般車企真的很難持續(xù)支持AI大模型研發(fā)迭代。作為汽車行業(yè)大模型的領(lǐng)頭羊,吉利汽車2022年?duì)I收1480億元,研發(fā)投入84億人民幣,能夠長效支持AI大模型研發(fā)迭代。
以ChatGPT為代表的AI大模型,其重要性被比爾·蓋茨評價為“不亞于互聯(lián)網(wǎng)誕生”。聚焦到汽車行業(yè),各家車企關(guān)于AI大模型的角逐也已箭在弦上。核心原因在于,電動化發(fā)展的下一個進(jìn)程是智能化。智能化是決定汽車革命下半場競爭勝負(fù)的關(guān)鍵。不發(fā)展智能化,電動化的先發(fā)優(yōu)勢也可能保不住。而AI大模型正是智能化競速的橋頭堡。
總之,汽車行業(yè)的AI大模型之爭剛剛開始,智能化浪潮沖擊帶來行業(yè)格局的洗牌也在所難免??v然勝負(fù)難料,不過對于那些早已瘋狂奔跑在前,并鍛造出深厚護(hù)城河的先發(fā)者,落后車企需要追趕的路程還很遠(yuǎn)。