佐思汽研發(fā)布《2024年車載AI Agent產(chǎn)品開發(fā)與商業(yè)化研究報告》,圍繞AI Agent產(chǎn)品開發(fā)和商業(yè)化開展了廣泛、深入的調(diào)研,助力產(chǎn)品開發(fā)和相關(guān)決策者。
AI Agent是大模型上車最佳方案
以“蔚小理”為代表的造車新勢力搶先將大模型應用在汽車座艙上,開啟了智能座艙的大模型時代。但從實車體驗看來,座艙大模型還不夠成熟,存在喚醒失敗、延遲響應、語音識別錯誤、記憶失效等幻覺等問題。這些問題主要源于基礎(chǔ)大模型理解、推理能力不足、上下文記憶有限、對環(huán)境背景信息感知不足。為解決這些問題,工程師們先后提出Prompt-Engineering(提示詞工程)、RAG(檢索增強生成)、Fine-Tuning(微調(diào))、AI Agent(基于大模型的智能體)等方案,圍繞“使模型獲得更多的知識信息、用更專業(yè)的數(shù)據(jù)訓練模型”兩個方面提高模型智能水平,使用戶體驗更好。(圖1為基于LLM的AI Agent一般模型)
經(jīng)過幾年的實踐,大部開發(fā)人員認為AI Agent是大模型商業(yè)化落地的最佳方案。今年3月,吳恩達在一次演講中談到,基于 GPT-3.5 構(gòu)建的Agent 工作流程在應用中的表現(xiàn)能比 GPT-4 要好。從蔚來、小鵬等車企公布的座艙大模型架構(gòu)來看,也都采用了AI Agent技術(shù)方案。
AI Agent將成為智能座艙的靈魂
本土品牌汽車的智能座艙經(jīng)過幾年的迅猛發(fā)展,已經(jīng)來到一個硬件堆疊時代——多媒體大屏、智能燈效、智能音效、AR-HUD……與此同時,在稍微復雜的人機交互功能不盡如人意。擁有多模態(tài)感知、交互,超強的泛化理解能力的AI Agent將成為人車交互的完美方案,使用戶可以極低的學習成本使用豐富的座艙功能。不僅如此,AI Agent還可以實現(xiàn)由用戶主動使用為被動享受貼心的代理服務(wù)。這一變革,將使智艙硬軟件大量投入,最大化地兌換成用戶價值。所以說,AI Agent將成為智能座艙的靈魂,對未來主機廠的發(fā)展具有重要的戰(zhàn)略意義。
AI Agent戰(zhàn)略意義重大,但開發(fā)難度和資金投入大,主機廠應如何布局?
AI Agent是從環(huán)境、信息感知到?jīng)Q策、執(zhí)行的復雜工作流程設(shè)計,以大模型為核心大腦,包括Perception(感知)、Reasoning(推理)、反饋(Reflection)、工具調(diào)用(Tool Use)、規(guī)劃(Planning)和多智能體協(xié)作(Multi-agent Collaboration)等多個模塊。AI Agent的開發(fā)難度、開發(fā)成本遠大于Prompt-Engineering、RAG、Fine-Tuning。實際上很多AI Agent包含Prompt、RAG。目前,車載AI Agent尚處于概念驗證、試驗開發(fā)階段。已上車的AI Agent只是AI Agent思想的簡單運用。在整車價格、成本病態(tài)內(nèi)卷的背景,主機廠應如何平衡短期降本任務(wù)和長期戰(zhàn)略布局,以正確的姿態(tài)應對AI Agent掀起的座艙變革。我們從客戶咨詢問題中,挑出問詢最多的三個問題進行探討。
問題.01、自研or外包,主機廠如何決策?
每一輪技術(shù)變革來臨,企業(yè)自制外購決策都將決定著未來的命運。1980年代個人電腦興起,擁有壟斷地位的IBM將操作系統(tǒng)及相關(guān)軟件外包給Microsoft,直接導致競爭優(yōu)勢的逐漸削弱,直到退出PC市場。作為智能座艙最具顛覆性的新技術(shù),AI Agent的自研外包決策也必然影響主機廠未來的競爭地位。
根據(jù)主機廠發(fā)布信息,結(jié)合招聘數(shù)據(jù)推測,發(fā)現(xiàn)當前主機廠AI Agent自研外包決策主要有自研、合作研發(fā)、外包三種模式。造車新勢力以自主開發(fā)模式為主,其中小米采取合作研發(fā)模式,零跑采取完全外包模式。傳統(tǒng)主機廠以完全外包模式為主,其中奇瑞、吉利同時采取合作研發(fā)模式。
表1 主機廠AI agent開發(fā)模式
來源:佐思汽車根據(jù)公開信息分析,如有錯誤,請聯(lián)系我們及時改正。
表面上看,各大主機廠的決策理所當然。采用傳統(tǒng)的能力要素和成本效益標準的決策樹方法很容易得到現(xiàn)行決策,如圖2所示。
圖2 主機廠AI Agent自研外包決策樹分析
來源:佐思汽研
但是,延用傳統(tǒng)制造業(yè)自制-外購決策方式是存在風險的。因為經(jīng)典的“決策樹”、“基于成本-效益-風險的綜合評價法”等方法,忽略了新技術(shù)產(chǎn)品的長遠戰(zhàn)略意義。常用的“Made Buy Decision Analysis Matrix”、“IBM 公司分包業(yè)務(wù)分析矩陣”一定程度上考慮到技術(shù)在競爭中的戰(zhàn)略意義,以及外環(huán)境的變化,但沒有構(gòu)建系統(tǒng)的決策流程。
與成熟產(chǎn)品不同,新技術(shù)產(chǎn)品的自制外購決策,不能僅以成本效益為決策標準,而要側(cè)重長遠的戰(zhàn)略考量;不能僅分析當前的能力優(yōu)勢,還要審視所需能力優(yōu)勢的培養(yǎng)和形成。因此,新技術(shù)產(chǎn)品的自研外包決策,應按照“長遠戰(zhàn)略意義及價值分析——各階段成本效益綜合分析——自研的必要條件分析”框架進行系統(tǒng)分析決策。
此外,輸出決策不能僵化、靜止,而要預判內(nèi)部、外部各種變量,并做出相應的決策轉(zhuǎn)變。例如,蘋果的芯片自制外購決策就是一個成功的典范。早期蘋果曾嘗試自研自制芯片,后來很長一段時間轉(zhuǎn)向外包,直到2020又全面轉(zhuǎn)向自研自制。同樣的,對于車載AI Agent而言,短期內(nèi)傳統(tǒng)主機廠不具備開發(fā)能力,可以外包或合作研發(fā)為主,但考慮期長遠的戰(zhàn)略意義,需以各種方式積累能力優(yōu)勢,在恰當?shù)臅r刻轉(zhuǎn)向自研,以獲得競爭優(yōu)勢。
問題.02、如何定義、規(guī)劃AI agent產(chǎn)品?
在AI agent產(chǎn)品定義方面,目前主機廠普遍缺乏想象力,停留在助手、陪伴、以及具體場景功能列舉層面。比如,訊飛星火——懂你的汽車助手;蔚來NOMI側(cè)重于情緒價值,打造懂你的情感伙伴;小鵬——生活助理-AI小P、人機共駕-AI保鏢、出行助理-AI司機;理想同學的功能定位總結(jié)的最全面,包括用車助手、出行助手、娛樂助手、百科老師。
這些定義只體現(xiàn)了Agent初級功能——“反應、交互、社交、陪伴、助理”等,對Agent最重要的類人自主代理功能——“理性、善良、自主化身”體現(xiàn)不充分。在功能越來越復雜的智能座艙中,AI Agent僅發(fā)揮交互、協(xié)助功能,是不夠的。用戶會因大量的交互、發(fā)布指令而感到麻煩。AI Agent的核心價值是在于免交互中默默地為人服務(wù)。
2024年5月,清華智能產(chǎn)業(yè)研究院與小米、華為、Vivo、理想聯(lián)合發(fā)表的文章,提出個人用戶AI Agent五個智能等級,最高級被稱為“自主化身Autonomous Avatar”,可代理完全代表用戶完成復雜的事務(wù),與其他用戶或代理進行交互,保證安全可靠。如代理閱讀電子郵件和消息,無需用戶干預即可回復;代理參加工作討論會,根據(jù)用戶的工作日志發(fā)表意見,聽取建議,并撰寫會議記錄;代理記錄用戶的日常飲食和活動,私下研究或詢問專家任何異常情況,并提出健康改善建議等。這樣看來,座艙AI Agent的定義應當充分體現(xiàn)“自主化身”,將功能聚集在“免交互的自主處理冗繁事務(wù)”。
當前車載AI Agent處于早期的智能交互階段,發(fā)展到最高等級的自主代理,可能要經(jīng)過幾個階段:智能交互——策略輔助——自主化身。在當前智能交互階段,各主機廠AI Agent的產(chǎn)品規(guī)劃,主要針對以下10大場景,設(shè)計相應的功能。這些規(guī)劃體現(xiàn)出主機廠廠基于場景,尋找用戶價值的務(wù)實態(tài)度。
表4 車載AI Agent場景、功能規(guī)劃
來源:佐思汽研整理
這些場景功能的用戶體驗不僅取決于軟件算法水平,還與硬件算力緊密相關(guān)。作為Agent大腦的LLM智能水平主要取決于參數(shù)量、Tokens和數(shù)據(jù)質(zhì)量。而參數(shù)量和Tokens提升又依賴訓練、推理算力。Deepmind和OpenAI的研究表明模型損失與算力負相關(guān),如圖4所示。
車載大模型一個棘手問題是車端算力的局限。為解決車載大模型算力問題,業(yè)界提出了“車端、云端、車云協(xié)作”三種模式。清華智能產(chǎn)業(yè)研究院、小米、華為、Vivo、理想聯(lián)合研究對三種模式做了業(yè)內(nèi)專家調(diào)研。結(jié)果顯示,近9成的專家認為車云協(xié)同是最佳方案。超8成認為僅云端是不可取方案。主要原因是延遲、隱私泄漏風險、云服務(wù)成本高等。車端方案排在第二,主因是當下本地硬件的算力還無法支持高階的Agent服務(wù)。因此,車云協(xié)同的方案成為最優(yōu)方案。隨著車端算力芯片性能提升,大模型推理算力部署可能會由車云協(xié)同向車端過渡。但這并不意味著云端算力對AI Agent發(fā)展沒有意義。大模型訓練需要的算力規(guī)模要遠大于推理,只能放在云端。云端的算力部署仍然決定著主機廠AI Agent的發(fā)展水平。
表5:車載AI Agent算力部署方案
來源:佐思汽研根據(jù)公開資料整理
問題.03、AI Agent如何盈利?
根據(jù)多家主機廠調(diào)研的情況來看,目前由于AI Agent產(chǎn)品還不完善,各主機廠普遍采用免費。但AI Agent的收費模式相比高階輔助駕駛、OTA、車聯(lián)網(wǎng),擁有更大的想象空間。以特斯拉為代表,國內(nèi)外主機廠紛紛推出高級輔助駕駛、車聯(lián)網(wǎng)、OTA一次性購買和訂閱模付費模式,一定程度得到市場的驗證。
圖6 ?特斯拉軟件收費模式
來源:佐思汽研根據(jù)公開資料整理
相比而言,AI Agent的應用場景包括駕駛、用車、娛樂等眾多場景下的消費內(nèi)容推薦,與早期車聯(lián)網(wǎng)平臺功能類似,并且AI Agent一旦成熟,被廣泛高頻使用,其對各類消費內(nèi)容推薦能力要遠大于早期車聯(lián)網(wǎng)平臺的推薦能力?;谶@樣的消費內(nèi)容推薦能力可以想象未來的盈利模式有多種可能。
-
- 對車主完全免費,依靠消費內(nèi)容推薦廣告費獲利。如加油站、汽車保養(yǎng)、維修、餐飲、快消品、旅游景點、書籍、電影、游戲、露營用品等。對車主完全免費,依靠消費提成獲利。
不僅對車主完全免費,還可以對給予車主體驗券、代金券等福利。
當然,推薦消費內(nèi)容需遵循消費者權(quán)益保護法等相關(guān)法律。主機廠也可設(shè)計不同程度的消費內(nèi)容推薦,供用戶選擇。例如,只推薦完全符合用戶偏好的消費內(nèi)容、用戶偏好+部分廣告內(nèi)容+福利。此外,與原來車聯(lián)網(wǎng)的廣告植入不同,AI Agent可以更智能地了解用戶偏好,做出更符合用戶體驗的消費推薦。未來,我們期待車載AI Agent帶給用戶驚艷體驗的同時,以創(chuàng)新的付費模式為主機廠帶來豐厚的利潤回報。
主要參考文獻:
The Rise and Potential of Large Language Model Based Agents: A Survey.
Deepmind, Training Compute-Optimal Large Language Models,2022.
OpenAI,Scaling Laws for Neural Language Models,2020.
Is the Make vs. Buy Decision Process a Core Competence.
白慶華,劉鐵軍. 運用自制/外購決策矩陣對企業(yè)外包進行決策分析.
Personal LLM Agents: Insights and Survey About The Capability, Efficiency and Security.