來源:雷科技互聯(lián)網(wǎng)組?|?編輯:冬日果醬?|?排版:單環(huán)
雖然在 2023 年,OpenAI 已經(jīng)在移動端推出了 App 版的 ChatGPT,可以讓用戶在手機上更方便地使用 ChatGPT 的對話服務,年底的時候還宣布 App 版上的語音功能已經(jīng)免費開放給所有用戶。
但又必須得說,作為一個「AI 助手」,ChatGPT 在手機上還是不夠方便,不信你比較下手機自帶的語音助手,通常是一鍵、一劃、一呼就能呼出進行對話,肯定要比打開 ChatGPT App、點擊語音或者輸入框進行輸入來得方便。
OpenAI 也看到了這一點。
在上個月,也就是 2023 年 12 月更新的 1.2023.352 版本中,Android 端的 ChatGPT 添加了「com.openai.voice.assistant.AssistantActivity」的新活動,直接指向了 Android 系統(tǒng)的語音助手功能。此外,該版本還加入了一系列的相關(guān)代碼和信息。
雖然上述的新活動還沒有正式啟用,就算強行啟用,也只會出現(xiàn)尚未完成的動畫,然后……就沒有然后了。但毫無疑問,OpenAI 不可能無緣無故加入這些代碼和信息。
不出意外,我們在不久后就會看到 Android 端的 ChatGPT 將可以設(shè)置為「默認助理應用」,用戶通過平時呼出系統(tǒng)自帶助手的方式,比如長按電源鍵或是手勢操作就能呼出 ChatGPT,并直接進行語音對話。
從這個角度來看,留給谷歌助理、蘋果 Siri 以及 OPPO 小布等手機 AI 助手的時間不多了……嗎?
ChatGPT 一聲炮響送來了手機 AI 助手的大模型時刻
OpenAI 最早在 2022 年 11 月底上線了網(wǎng)頁端的 ChatGPT,很快就在科技圈掀起了一輪「旋風」,其中最核心的一點在于強大的自然語言理解能力,通俗來講就是:聽得懂人話,說得了人話。
緊接著,ChatGPT 引發(fā)的浪潮愈演愈烈,席卷了從各國政府到各個行業(yè),僅兩個月后的月活用戶就突破了 1 億大關(guān)。與此同時,無數(shù)人也看到了 ChatGPT 背后大模型技術(shù)的廣泛應用前景,大模型層出不窮,應用層也在進行尋找和探索。
手機 AI 助手就是最早被看到的機會之一。
3 月,微軟 CEO 薩蒂亞·納德拉就對英國《金融時報》吐槽,蘋果的 Siri、亞馬遜的 Alexa,微軟自家的 Cortana(中文名:小娜)以及公認拔尖的 Google Assistant,這些語音助手有一個算一個:
都笨得跟石頭一樣。
Siri 的聯(lián)合創(chuàng)始人 Adam Cheyer 也承認,ChatGPT 理解復雜信息的能力讓現(xiàn)有的語音助手看起來很蠢。這是問題,也是機會。
年初我們就在《ChatGPT 能讓 Siri 和小愛同學變聰明嗎?》一文中介紹了一些個人開發(fā)者的嘗試——將小愛同學、Siri 等常用手機助手接入 ChatGPT,當時我們也作出了判斷:巨頭的入場,不遠了。
到下半年,手機廠商陸續(xù)在大版本系統(tǒng)升級中加入了大模型加持的小藝(華為)、小布(OPPO)、小愛(小米)、小 V(vivo),谷歌正在開發(fā)本地接入 Gemini 大模型的谷歌助理。就連「一向不趕時髦」的蘋果,也被傳出正在將生成式 AI 整合到 Siri 中,預計將在今年 WWDC 上正式亮相。
趨勢來了,擋也擋不住,順勢而上才是王道。
但另一個問題是,算力更強、更「聰明」的 ChatGPT(OpenAI)、Copilot(微軟)、文心一言(百度),還有更多類 ChatGPT 的 AI 對話服務總歸也要面對同一波的趨勢。
手機江湖,誰主沉浮
在 Google Play 上,ChatGPT 的下載量早就超過了 1000 萬次,評分有 4.7,在 App Store 的評分更是 4.9。高評分的背后,是大部分用戶的好評、認可,更是 GPT-3.5/4 在模型輸出質(zhì)量上的水平體現(xiàn)。
圖/蘋果
相比之下,手機廠商雖然普遍開始在系統(tǒng)自帶 AI 助手上接入云端、端側(cè)大模型,但用戶評價并不高,在邏輯推理、語言理解等各方面的能力都較弱。
實際上,廠商也不可能去訓練和采用太大參數(shù)規(guī)模的模型,核心是成本太高又很難建立合理的收費模式。試想一下,ChatGPT、文心一言等可以采用訂閱收費的方式,但系統(tǒng)自帶 AI 助手很難說服用戶付費訂閱,甚至容易引起聲討。
換言之,手機廠商自己的 AI 助手,很難和 ChatGPT 比「智能」。但手機廠商也有自己很大的優(yōu)勢。
我們之前就多次談過「端側(cè)大模型上機(手機、PC)」的必然趨勢,比如在《重新定義智能手機,大模型會是手機廠商的偽命題嗎?》中就指出:
端側(cè)大模型的數(shù)據(jù)處理都在端側(cè),用戶的個人數(shù)據(jù)將不會上傳至云端服務器,用戶才會放心將數(shù)據(jù)交給 AI 去學習,這才能為手機 AI 助手真正成為個人助理提供了先決條件。
其次,雖然在 Android 上谷歌很早就向第三方開放了語音助手的權(quán)限,用戶可以將第三方語音助手,如微軟小娜、三星 Bixby 等設(shè)置為默認語音助手,可以很方便地呼出,但實際上第三方應用獲得的權(quán)限、接口還是無法與自帶的谷歌助理相比。
換言之,ChatGPT 就算后續(xù)支持設(shè)置為默認語音助手,實際在系統(tǒng)層面的影響力可能還是有限,無法像自帶 AI 助手通過指令對系統(tǒng)進行一系列的操作,比如語音跳轉(zhuǎn)導航、提醒事項等。或許,ChatGPT 能夠得到最大的好處也就是可以更便捷的呼出了,這當然也很關(guān)鍵,但始終很難借此成為用戶真正的「數(shù)字助理」。
而這還是「最開放」的谷歌,蘋果和 OPPO、華為、小米等國產(chǎn)廠商,更不會在系統(tǒng)層面開放給類似 ChatGPT 等第三方應用。去年 WWDC 上,蘋果宣布用戶呼出 Siri 不用再「Hey Siri」,只要說「Siri」就行了;國產(chǎn)手機廠商過去幾年也在不斷降低自帶 AI 助手的使用門檻,加入更多的功能。
在手機這片江湖中,過江龍還是很難直面地頭蛇。
當然了,科技行業(yè)的顛覆往往不是從中心,而是從邊緣發(fā)起的。
圖/ OpenAI
1 月 5 日,The Verge 拿到一份發(fā)自 OpenAI 的郵件顯示,醞釀已久的 GPT 商店將于下周正式上線,GPTs 的開發(fā)者們屆時可以上架「售賣」自己的 GPT(基于 GPT-4),從中獲利。(關(guān)于 GPTs 計劃,這里可以參見雷科技文章《ChatGPT 的 2023:開創(chuàng)人工智能的新紀元》,其中就一部分介紹。)
再加上 ChatGPT 已有的插件生態(tài),你很難說這會不會是又一次「App Store 式」的變革,并且顛覆現(xiàn)有的計算系統(tǒng):
到時候可能就是降維打擊了。