色噜噜狠狠狠狠色综合久,成人精品在线视频,日韩精品成人区中文字幕

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

發(fā)布

注冊 | 登錄

從燒錢到落地，大模型到了“驗收”時刻

DoNews

2025-01-03

0 評論 251 瀏覽 0 收藏

15 分鐘

在人工智能的競技場上，大模型技術(shù)正經(jīng)歷著從燒錢競賽到實際落地的轉(zhuǎn)變。文章還分析了大模型技術(shù)在商業(yè)化應(yīng)用中的挑戰(zhàn)與機遇，為我們揭示了AI技術(shù)如何從概念走向現(xiàn)實，影響著我們的未來。讓我們一起探索這場“AI大模型+”的革命，了解它如何重塑行業(yè)格局。

繼通用大模型的價格以厘計算之后，字節(jié)再次將多模態(tài)大模型帶入“厘時代”。

在12月18日舉辦的火山引擎 Force 大會上，字節(jié)跳動正式發(fā)布發(fā)布豆包·視覺理解模型。同時公布其售價為千tokens輸入0.003元，相當(dāng)于一元錢就可處理284張720P的圖片。

對比claude 3.5 Sonnet的0.021元/千tokens，qwen-vl-max的0.02元/千tokens，GPT-4o的0.0175元/千tokens，豆包視覺理解模型比行業(yè)價格便宜85％。

而在此之前的5月份，字節(jié)跳動發(fā)布的豆包大模型，其主力模型在企業(yè)市場的定價為0.0008元/千Tokens，0.8厘能處理1500多個漢字，比行業(yè)便宜99.3%，讓大模型從以分計價到以厘計價。

這一操作迫使阿里云的三款通義千問主力模型再次降價，最高降幅達90%。百度智能云更是直接宣布，文心大模型的兩款主力模型ENIRE Speed、ENIRE Lite全面免費。

不到一年半的時間，字節(jié)是如何做到在AI大模型市場后來居上？多模態(tài)大模型又發(fā)展到了哪一步？未來大模型技術(shù)在應(yīng)用側(cè)的新趨勢會是什么？

一、國內(nèi)第一全球第二，“卷王”豆包后來居上

2023年是國產(chǎn)大模型“大爆發(fā)”的一年。

自去年3月起，眾多大廠及創(chuàng)新型企業(yè)紛紛亮出自研大模型產(chǎn)品：阿里通義千問1.0、騰訊混元、360智腦、華為盤古、科大訊飛星火、商湯日日新、百川大模型以及智譜AI的GLM等，均誕生于這一年。

作為AI起步較晚的選手，字節(jié)在去年1月才成立大模型研發(fā)團隊，8月才發(fā)布“云雀”大模型和對外測試AI對話產(chǎn)品“豆包”。

國內(nèi)大模型發(fā)展時間線圖源：第一新聲

盡管來得晚，但架不住人家漲得快。

據(jù)量子位智庫數(shù)據(jù)顯示，截至11月底，豆包2024年的累計用戶規(guī)模已超過1.6億；11月平均每天有80萬新用戶下載豆包，單日活躍用戶近900萬，僅次于OpenAI的ChatGPT，位列全球第二、國內(nèi)第一。

而今年5月發(fā)布的豆包通用大模型，據(jù)字節(jié)跳動對外公布的數(shù)據(jù)顯示，截至12月中旬，豆包通用模型的日均tokens使用量已超過4萬億，較七個月前首次發(fā)布時增長了33倍。

“豆包”能有這樣增長，離不開字節(jié)這個“卷王”的大力推動。

首先就是卷流量。

據(jù)App Growing統(tǒng)計，截至11月15日，Kimi、豆包、星野等國內(nèi)十款大模型產(chǎn)品，合計已投放超625萬條廣告，投放金額達15億元。其中，Kimi和豆包是投放最瘋狂的兩個產(chǎn)品，分別投放了5.4億元和4億元。

圖源：App Growing

當(dāng)下，花錢投流買量是AI產(chǎn)品啟動一個最直接快捷的方式。而在各家的投放渠道中，基本都離不開字節(jié)的巨量引擎（字節(jié)跳動旗下廣告投放平臺，涵蓋今日頭條、抖音、西瓜視頻等營銷資源）。

這使得背靠字節(jié)的豆包將流量池的優(yōu)勢發(fā)揮到了極致。在抖音上，字節(jié)幾乎屏蔽了除豆包以外所有AI應(yīng)用的投放，只留給自家的豆包。盡管重金投流能否換來超級應(yīng)用無法確定，但至少目前給豆包帶來了肉眼可見的用戶增長。

其次是卷產(chǎn)品。

從聊天助手、視頻工具，到娛樂應(yīng)用、辦公領(lǐng)域，字節(jié)陸續(xù)推出了十幾個 AI 應(yīng)用，覆蓋了幾乎所有主要 AI 產(chǎn)品方向。字節(jié)今年10月還推出了能與豆包語音對話的 Ola Friend 耳機，近期還在研發(fā) AI 眼鏡。

這樣飽和式的研發(fā)，一方面能讓豆包大模型依托諸多AI應(yīng)用加速迭代，另一方面則是期待AI硬件終端能拓寬豆包大模型使用場景，進而實現(xiàn)整個“豆包+”產(chǎn)業(yè)鏈閉環(huán)。

此外，豆包也在卷場景，以期在應(yīng)用層面多點開花。

據(jù)了解，豆包大模型已經(jīng)與八成主流汽車品牌合作，并接入到多家手機、PC等智能終端，覆蓋終端設(shè)備約3億臺，來自智能終端的豆包大模型調(diào)用量在半年時間內(nèi)增長100倍。而最近3個月，豆包大模型在信息處理場景的調(diào)用量增長了39倍，客服與銷售場景增長16倍，硬件終端場景增長13倍，AI工具場景增長9倍，學(xué)習(xí)教育等場景也有大幅增長。

可以說，豐富的內(nèi)部生態(tài)、持續(xù)的資源投入、龐大的優(yōu)質(zhì)數(shù)據(jù)和應(yīng)用場景，且都全面接入AI并相互打通，這才是豆包能成為行業(yè)“卷王”的秘訣。

二、“百模大戰(zhàn)”下半場，開始比拼多模態(tài)

自 OpenAI 推出 Sora，讓“一句話生成視頻”變成可能；谷歌發(fā)布 Gemini ，可以泛化并無縫地理解、操作和組合不同類型的信息，國內(nèi)主要公司就開始陸續(xù)跟進、布局視頻、音樂、語音等多模態(tài) AI 應(yīng)用。

例如，今年5月開始，生數(shù)科技Vidu、快手可靈、字節(jié)即夢、智譜清影、商湯Vimi等都相繼發(fā)布文生視頻模型；9月，MiniMax正式發(fā)布視頻模型video-01、阿里云在云棲大會上發(fā)布通義萬相全新視頻生成模型、美圖宣布MiracleVision大模型完成視頻生成能力的升級；到了11月，騰訊混元大模型正式上線視頻生成能力，月之暗面旗下Kimi則被爆出正在內(nèi)測AI視頻生成功能“Kimi創(chuàng)作空間”……多模態(tài)的“多”正在成為新的發(fā)展方向。

通過騰訊元寶APP-AI應(yīng)用-AI視頻即可使用該功能圖源：騰訊優(yōu)圖實驗室

而此次火山引擎發(fā)布的豆包·視覺理解模型，據(jù)介紹，主要能力包括：

更強的內(nèi)容識別能力：不僅可以識別出圖像中的物體類別、形狀等基本要素，還能理解物體之間的關(guān)系、空間布局以及場景的整體含義。
更強的理解和推理能力：不僅能更好地識別內(nèi)容，還能根據(jù)所識別的文字和圖像信息進行復(fù)雜的邏輯計算。
更細膩的視覺描述能力：可以基于圖像信息，更細膩地描述圖像呈現(xiàn)的內(nèi)容，還能進行多種文體的創(chuàng)作。

繼 GPT-4 在語言方向的里程碑式突破之后，業(yè)界普遍認為“視覺”是下一個爆發(fā)的賽道。畢竟人類的五感之中有 80% 是視覺信息，未來的大模型也應(yīng)該充分利用更多種類的感官，以此探索實現(xiàn) AGI 的路徑。

火山引擎總裁譚待也在采訪中表示，推出視覺理解模型相當(dāng)于解鎖了一個很大的場景，同過去只有文字對話形式的AI相比，聊天功能與深度推理的、圖像視覺理解等能力的融合，能讓模型有能力處理好真實世界大量綜合性的信息，輔助人類完成一系列復(fù)雜工作。

比如，在旅游場景中，幫助游客看外文菜單、講解照片中建筑的背景知識；在教育場景中，為學(xué)生優(yōu)化作文、科普知識；在辦公場景下，除了識別內(nèi)容，模型還能幫助用戶分析圖表中的數(shù)據(jù)關(guān)系，處理代碼邏輯。

豆包·視覺理解模型教育場景應(yīng)用案例圖源：火山引擎 Force 大會

此外，火山引擎除了推出視覺理解模型之外，還發(fā)布、升級了多個其他模型。比如，豆包通用模型pro已全面對齊GPT-4o；音樂模型從生成60秒的簡單結(jié)構(gòu)，升級到生成3分鐘的完整作品；文生圖模型2.1版本接入即夢AI和豆包App……

可以看出，盡管相比于市場同類產(chǎn)品，豆包系列大模型發(fā)布的時間并不算早，但一直保持著較快速度的更新，并且將最新能力通過即夢AI、豆包App等應(yīng)用，迅速開放給了普通用戶使用。

而當(dāng)下，AI 市場關(guān)注的重心正逐漸從“大模型”轉(zhuǎn)變到“大模型+”。除了常規(guī)的 AI 文本對話類應(yīng)用，多模態(tài)的“多”正在成為新的方向。

三、“應(yīng)用之戰(zhàn)”打響，大模型到了該“驗收”的時候

在2024世界人工智能大會上，百度創(chuàng)始人李彥宏在演講中提到，“2023年國內(nèi)出現(xiàn)了百模大戰(zhàn)，其實造成了社會資源的巨大浪費，尤其是算力的浪費?！钡拇_，無論是技術(shù)上的研發(fā)成本，還是應(yīng)用上的運行成本，大模型的成長每一步都少不了真金白銀的支持。

在行業(yè)回歸理性的今天，越來越多的AI企業(yè)意識到卷參數(shù)量、卷Token數(shù)、卷集群規(guī)模、卷價格，其實都意義不大，大模型的商業(yè)化落地才是最需要關(guān)注的問題。

而按終端用戶類型，AI大模型的商業(yè)模式可分為to C、to B。

lto C：即面向個人消費者，包括免費和付費訂閱模式。免費模式如騰訊元寶、百度的文心一言（3.5版本）；付費訂閱模式如百度的文心一言（4.0版本）、OpenAI的ChatGPT（4.0版本）；
lto B：即面向企業(yè)，包括API調(diào)用授權(quán)、SaaS模式。API調(diào)用授權(quán)模式中，企業(yè)客戶可在自己的應(yīng)用程序或服務(wù)中集成AI功能，通?；谡{(diào)用次數(shù)或數(shù)據(jù)量來計費，如阿里通義千問、智譜AI；SaaS模式中，大模型企業(yè)為客戶提供軟件服務(wù)，客戶無需安裝和維護軟件，如Google Cloud AI。在實際應(yīng)用中，大模型企業(yè)通常混合使用多種商業(yè)模式。

當(dāng)下多模態(tài)大模型競爭火熱，將帶動諸多行業(yè)重塑生產(chǎn)環(huán)節(jié)，勢必會在以下幾個領(lǐng)域引發(fā)新一輪的升級與角逐：

影音創(chuàng)作：當(dāng)大模型由單模態(tài)生成轉(zhuǎn)向多模態(tài)生成，AIGC應(yīng)用降低了專業(yè)創(chuàng)作門檻，這將改變影音傳媒行業(yè)的生產(chǎn)模式，塑造全新內(nèi)容生產(chǎn)范式，實現(xiàn)創(chuàng)作效率提升、創(chuàng)作空間拓展及作品質(zhì)量提升的目標(biāo)。

情緒智能：基于最新的AI模型如GPT-4o和Gemini 1.5 Pro，未來AI陪伴將通過流式語音識別、多模態(tài)AI和情感計算等技術(shù)極大地提升互動體驗。這意味著多模態(tài)大模型將賦予機器情感價值，并通過深度分析用戶的情感和行為，滿足用戶的多元化陪伴訴求。

工業(yè)智造：未來多模態(tài)大模型有望與當(dāng)前普遍使用的專用小模型互補融合，深度賦能工業(yè)制造的各個環(huán)節(jié)，并隨著場景數(shù)據(jù)的整合和積累，進一步升級感知和理解能力，以滿足生產(chǎn)制造中的個性化需求，從而推動工業(yè)產(chǎn)業(yè)變革。

總之，現(xiàn)如今AI領(lǐng)域的競爭核心，已經(jīng)從大模型的“有無之戰(zhàn)”變成了“應(yīng)用之戰(zhàn)”。在這個階段里，比拼的不再是宏觀概念，而是落地能力和商業(yè)化的進展。

隨著國內(nèi)大模型持續(xù)迭代與升級，疊加國內(nèi)GPU供應(yīng)問題逐步緩解、政策牽引等，國內(nèi)大模型訓(xùn)推算力需求有望逐步釋放，這不僅將為大模型的落地應(yīng)用進一步提速，也將給AI時代帶來新的行業(yè)機遇。

撰文 | 文? 林編輯 | 楊博丞

本文由人人都是產(chǎn)品經(jīng)理作者【DoNews】，微信公眾號：【DoNews】，原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載。

題圖來自Unsplash，基于 CC0 協(xié)議。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App