別硬把大模型往手機里塞
越來越多手機廠商將目光瞄向了AI大模型,那么,在手機上運行大模型這件事,可能會遇到哪些方面的挑戰(zhàn)?手機廠商們是否思考清楚了“把大模型裝進手機里”這個動作的背后意義?一起來看看作者的分析。
商業(yè)迷霧當中,那些看似金光閃閃的“機會”,往往是一把將人們困住的鐐銬。
CNBC最新消息稱,全球芯片巨頭高通打算在加州兩大據(jù)點砍掉約1258名員工。事實上,高通早就向加州就業(yè)部門送交了這份“死亡名單”:圣迭戈1064名、圣克拉拉194名。這場人事地震預計將在12月13日爆發(fā)。
高通上個季度的報告中,已經(jīng)暗示了這次“血洗”。從財務結構來看,手機芯片是高通的主要收入來源,占比超過一半,但在三季度里收入同比下降了21.6%。智能手機市場的飽和,像一把無形的大手,正在悄悄扼殺上游供應鏈的巨頭。
手機市場的增長現(xiàn)在主要依賴于設備的升級周期。自2019年以來,受5G驅動的手機更換熱潮已經(jīng)持續(xù)了近四年。但Counterpoint的資深分析師Peter Richardson卻揭示了一個冷酷的事實:到2022年時,全球手機更換周期已達到史上最長的43個月。
過去五年,手機界苦苦追尋創(chuàng)新之路,急于改變僵局。但當連Apple這樣的市場領導者也難以拿出令人震撼的新功能時,其他廠商更是難以維持其市場地位。越來越多的消費者開始質(zhì)疑,換一部新手機的價值究竟在哪?
有行業(yè)專家指出,真正的破局點或許是軟件,尤其是AI領域像LLM、Transformer等大模型背后蘊藏著的力量。
盡管目前還不清楚,該如何最大化地利用這些潛力,但這并不妨礙國內(nèi)手機巨頭試圖突圍。華米OV等都把目光瞄準了AI大模型,迫切要開辟一個新戰(zhàn)場。
一、手機巨頭爭斗大模型賽場
一時之間,國內(nèi)手機廠商好像都追起了大模型的風頭。
8月14日,小米年度發(fā)布會上,小米AI大模型亮相,霎那之間成為焦點。在C-Eval、CMMLU兩大測試平臺上,它分別斬獲第十名和中文榜首的佳績。
雷軍信心滿滿地宣布,小米的這個13億參數(shù)大模型已經(jīng)在手機端完美運行,其實力在某些場景中甚至能與60億參數(shù)的云端模型匹敵。而家喻戶曉的小愛同學也將強化AI大模型的能力,邀請測試已在發(fā)布會當天拉開序幕。
瞄準AI大模型的狼煙不只在小米一處升起。
早在8月4日的2023年華為開發(fā)者大會,余承東就大手一揮,宣布HarmonyOS 4將受益于“盤古大模型”的加持。與眾不同的是,華為決定將大模型深度整合進手機系統(tǒng),實現(xiàn)更高層次的融合。
繼華米之后,vivo和OPPO亦不斷展露其對大模型領域的雄心。
近期,OPPO宣布對其全新“小布助手”進行首輪公開測試,引發(fā)業(yè)內(nèi)關注。此產(chǎn)品基于了AndesGPT大模型技術。
AndesGPT模型出自OPPO旗下安第斯智能云團隊之手,其核心是一個基于混合云架構的高級生成式大語言模型。用戶可以通過喚醒小布語音助手并說出“小布大模型”,參與小布1.0公測版報名。更多信息將在11月16日的ColorOS 14發(fā)布會上公布。
與同行的宣傳異曲同工,AndesGPT在其官方介紹中也榮獲了“行業(yè)翹楚”等封號,此模型在多個權威評測榜單上頻頻亮相。
另一個戰(zhàn)線上,vivo已鎖定11月1日,要召開年度開發(fā)者大會。此番集結,vivo將揭曉其獨家研發(fā)的AI大模型與全新操作系統(tǒng);而廣受矚目的OriginOS 4也將初露鋒芒。
尤其引人關注的,vivo打造的AI大模型矩陣極為豐富,覆蓋了十億、百億及千億三大參數(shù)級別,共五款模型,旨在滿足多樣化的核心應用場景。
同樣,這批尚在神秘面紗后的產(chǎn)品,已在多個權威評測中嶄露頭角。最新數(shù)據(jù)顯示,vivo自研AI大模型在C-Eval和CMMLU兩大平臺上均雄踞榜首。
近期,手機行業(yè)已經(jīng)見證了各大品牌逐個投身于AI大模型的深海。存量市場的激烈爭奪,使得各大廠商都希望借助新技術鋒芒,為自身在高端市場塑造更具競爭力的形象。
多位行業(yè)內(nèi)有深度洞察的人士認為,強調(diào)AI功能的優(yōu)勢,顯然是各大廠商策略的重要一環(huán)。不僅能刺激用戶對高端產(chǎn)品的欲望,更能帶動產(chǎn)品價格上漲,從而為品牌創(chuàng)造更為豐厚的利潤。
隨著時間的推移或能見到,首波真正的“AI手機”即將震撼登場,而未來兩年,更會是AI在手機上的創(chuàng)新大爆發(fā)時刻。
二、大模型角逐移動端,路徑逐漸統(tǒng)一
雖然手機廠商們在宣傳中表現(xiàn)得在手機上運行大型模型就如同喝水吃飯般輕松,但實際操作中,背后隱藏的挑戰(zhàn)遠超預期。
根據(jù)小米技術委員會AI實驗室大模型團隊負責人欒劍的分享,要真正在手機上運行大模型,對手機硬件的要求絕不會低,特別是處理器和內(nèi)存兩項。
大模型首先就是其“大”的特性,一旦占據(jù)過多的手機工作內(nèi)存,將導致其他應用受限,甚至可能造成手機無響應、整體性能銳減,或者最糟糕的情況是直接死機。
此外,計算能力也是評判的關鍵點。若生成一個字符就需要花費好幾秒的時間,這對于用戶體驗無疑是災難性的??紤]到人們的平均閱讀速度約為每秒十幾個漢字,故模型的“生成速度”必須遠超于此。
而功耗問題也不容忽視。許多網(wǎng)上的模型Demo常常疏忽這一關鍵環(huán)節(jié)。高負載下的計算芯片會導致手機急速發(fā)熱,若如此長時間運作,勢必會對電池的續(xù)航產(chǎn)生嚴重損害。
綜上,手機大模型真正的挑戰(zhàn)在于如何在處理速度、散熱和電池續(xù)航等之間找到一個精妙的平衡。因此,業(yè)界的重心還放在了端云協(xié)同之上。
不久前,聯(lián)發(fā)科與OPPO達成協(xié)議,共同研發(fā)大模型在端側的輕量化部署方案,旨在讓大模型技術更為貼近消費者的實際使用。
10月18日,聯(lián)發(fā)科同樣宣布與vivo在AI領域深度合作和聯(lián)調(diào),實現(xiàn)了10億和70億AI大語言模型以及10億AI視覺大模型在手機端側的落地,共同為消費者帶來端側生成式AI應用創(chuàng)新體驗。
端側大模型的好處是,用戶可以享受更快的響應速度,同時數(shù)據(jù)也不需要上傳到云端,更加安全。目前許多主流廠商都在研發(fā)在移動終端部署 AI大模型的解決方案,以實現(xiàn)在端側運行大模型的目標。
然而,不能假定僅憑手機端便能解決所有問題。正如小米透露的,他們將繼續(xù)遵循端云結合的策略。某些功能或能力,如果可以通過端側的模型來實現(xiàn),就無需轉移到云端處理。
觀察vivo的情況,雖然缺乏確切的數(shù)據(jù),但可以合理推測,它也將采納云端和本地結合的大模型策略。
從其大模型的參數(shù)量級可以分析,660億、1300億和1750億量級的云端大模型目的在于確保處理能力,以應對更復雜的問題。而10億和70億量級的本地大模型則是為了確保用戶隱私、能效和快速響應。
這意味著,vivo很可能會采取端云協(xié)同工作的方式,即通過評估問題的復雜性來決定是否在本地處理或轉移到云端。
結合云端和本地的大模型不僅可以有效地節(jié)省成本,而且能夠滿足用戶在計算能力、性能、能耗和隱私保護等多個方面的需求,這無疑是目前整合手機和AI大模型的優(yōu)選策略之一。
三、廠商跟風之下,一些潛在的挑戰(zhàn)
某些業(yè)內(nèi)觀點,將目前嘗試在手機端運行大模型的技術視作一柄鋒利之劍。然而深入背后,也不免露出一種應景而非真正求變的短視之感。
首先,對于“大模型”的界定仍舊模糊不清。以小米的端側模型為例,其參數(shù)量達到13億,與GPT2的1.5B參數(shù)相差無幾,但這真的足以賦予其“大模型”的頭銜嗎?
不乏有業(yè)界人士拋出質(zhì)疑:手機端的大模型實踐,更多地是為了滿足市場短期熱潮,而非技術的真正躍進。若手機真的能毫不費力地驅動大模型,那顯卡巨頭英偉達的存在意義又在哪里?
再者,為了讓大模型適應手機,制造商不得不通過剪枝、蒸餾和量化等策略對其進行大幅壓縮。以vivo為例,它可能通過連續(xù)的模型裁剪和蒸餾,將參數(shù)從1750億降低到僅10億,這種操作是否過于牽強,值得思考。
要認識到,大模型并不僅僅是參數(shù)數(shù)量的簡單疊加,它的真正價值在于深度學習中的“深度”。大量的參數(shù)意味著更多的信息、知識和上下文的捕捉。
因此,當把一款千億參數(shù)的模型剪裁到幾十億參數(shù)時,勢必要失去一些原有的學習深度。對于AI的日常應用來說,可能影響不大,但對于那些期望從AI獲得深度見解和理解的高端用戶來說,這種損失是無法接受的。
即便小米宣稱其端側模型能與云端模型相提并論,但這其中的細節(jié)仍不容忽視。擁有13億參數(shù)的端側模型自然難以與擁有千億參數(shù)的云端模型相比。為了彌補這種差距,小米可以選擇讓其端側模型在特定場景下與云端模型匹敵,但終歸不能全面比肩。
從這些層面出發(fā),當前手機上的大模型實現(xiàn)方式似乎有點“矯枉過正”。對于普通用戶而言,他們并不真正關心模型的參數(shù)數(shù)量,而更關心能為他們帶來什么價值。vivo和小米的這些嘗試固然值得鼓勵,但也應該反思其真正的目的和意義。
更重要的是,盡管眾多手機制造商都在積極探索AI大模型的應用,但未來的路徑仍然充滿未知。手機市場上,什么才是下一個“殺手級”應用,還有待時日揭曉。
目前手機制造商對AI大模型的具體應用似乎過于偏重“語音助手”。這種單一方向的追求,是否只是迎合了科技熱點趨勢,而非真正考慮用戶的實際需求?
以近期知名博主對vivo新款AI大模型的分享為例,盡管其在OriginOS 4上以煥然新姿亮相,但與現(xiàn)行的語音助手相比,核心并無太大顛覆。
簡而言之,AI大模型在手機領域的真正普及仍舊步履蹣跚。如今的種種努力,只是冰山初露的探秘之旅。
參考資料:
騰訊科技-小米的大模型“野心”,始于端側
作者:樟稻;編輯:伊頁
來源公眾號:科技新知(ID:kejixinzhi),洞察技術變化背后的產(chǎn)業(yè)變遷。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @科技新知 授權發(fā)布,未經(jīng)許可,禁止轉載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
大模型 怕是要構建新一代的信息繭房
確實,趕緊學起來