深度剖析字節(jié)豆包AI

20 評(píng)論 13638 瀏覽 123 收藏 50 分鐘

在國(guó)內(nèi)的AI產(chǎn)品中,不少都做了APP以供用戶更方便地使用,豆包就是其中之一。這篇文章,我們嘗試對(duì)豆包AI進(jìn)行深度分析,看看能否通過這款比較典型的產(chǎn)品,了解AI 助手APP這個(gè)賽道。

這將會(huì)是三白的又一篇萬字以上的深度分析報(bào)告,作為一個(gè)AI深度愛好者以及從業(yè)人員,從去年8月份字節(jié)豆包上線至今,我一直都在密切的關(guān)注這款產(chǎn)品的每一次更新和動(dòng)向,并頻繁和字節(jié)已經(jīng)行業(yè)內(nèi)的AI從業(yè)的朋友們交流和討論這款產(chǎn)品,最近花了近3天左右的時(shí)間,把過去1年的積累的內(nèi)容重新整理并輸出形成一個(gè)完整的報(bào)告。

全篇內(nèi)容共13000字,閱讀時(shí)間預(yù)計(jì)需要半小時(shí),我將按照一個(gè)標(biāo)準(zhǔn)的產(chǎn)品分析報(bào)告的視角,系統(tǒng)的介紹和分享個(gè)人關(guān)于字節(jié)豆包這款產(chǎn)品的一些觀察、分析、思考,我將從產(chǎn)品、行業(yè)、商業(yè)、用戶、競(jìng)品等多個(gè)角度綜合分析這款目前字節(jié)炙手可熱的AI產(chǎn)品,需要聲明的是,以下全部?jī)?nèi)容僅代表個(gè)人觀點(diǎn),內(nèi)容僅供參考,若存在有失偏頗的地方歡迎大家和我溝通討論;

由于內(nèi)容較多,為了提升大家的閱讀效率,我整理了一個(gè)全文腦圖如下,沒有時(shí)間細(xì)細(xì)閱讀的朋友可以快速看腦圖即可:

1.為什么想分析字節(jié)豆包這款產(chǎn)品?

一般我挑選分析對(duì)象,通常會(huì)選擇該賽道比較典型、或者有代表性的產(chǎn)品,也最好希望通過一個(gè)產(chǎn)品能夠把這個(gè)賽道基本了解清楚,一方面我先不選擇ChatGPT,主要是它是海外的產(chǎn)品,可能很多用戶都體驗(yàn)不到,而豆包為國(guó)內(nèi)公開使用的產(chǎn)品,且目前在使用規(guī)模上據(jù)個(gè)人了解目前是用戶規(guī)模前三的AI產(chǎn)品;另外一方面,豆包對(duì)比chatgpt,在產(chǎn)品特性上,除了基本具備Chatgpt的大部分功能之外,還增加了關(guān)于智能體agent、Agent開發(fā)平臺(tái)、AI社交、開發(fā)者和創(chuàng)作者生態(tài)等多個(gè)領(lǐng)域,所以能夠覆蓋的領(lǐng)域,因此分析它的價(jià)值可能更高;

2.全文內(nèi)容的信息獲取來源?

本篇文章全部?jī)?nèi)容和信息主要基于如下幾個(gè)信息來源:

  • 個(gè)人基于長(zhǎng)期對(duì)產(chǎn)品的關(guān)注、體驗(yàn)、思考而形成的個(gè)人觀點(diǎn)
  • 來自和騰訊、字節(jié)、百度、阿里等國(guó)內(nèi)大廠的AI從業(yè)朋友的討論與交流;
  • 參考市面上公開的深度資訊、專題分析、公開報(bào)道、數(shù)據(jù)平臺(tái)等;

3.適合哪些人群?

  • 想要系統(tǒng)的了解AI應(yīng)用端產(chǎn)品,建立行業(yè)認(rèn)知的朋友;
  • AI產(chǎn)品經(jīng)理和運(yùn)營(yíng)人員;
  • 研究AI和字節(jié)產(chǎn)品的金融或者戰(zhàn)略研究人員;

一、產(chǎn)品概述

1.1. 產(chǎn)品基本信息介紹

1.1.1. 豆包是一款什么產(chǎn)品?

豆包是字節(jié)跳動(dòng)在2023年8月份推出的一款A(yù)I產(chǎn)品,產(chǎn)品直接對(duì)標(biāo)的競(jìng)品是ChatGPT、文心一言這一類的產(chǎn)品,屬于字節(jié)跳動(dòng)在chatbot領(lǐng)域推出的重量級(jí)產(chǎn)品,此外,字節(jié)還在海外上線了一款豆包海外版的產(chǎn)品,產(chǎn)品名稱是cici;

產(chǎn)品在字節(jié)跳動(dòng)公司內(nèi)的組織架構(gòu)是在字節(jié)去年11月份剛成立的FLOW團(tuán)隊(duì),根據(jù)flow業(yè)務(wù)負(fù)責(zé)人朱駿公開信息,目前豆包在國(guó)內(nèi)的月活已經(jīng)有2600萬,算是目前國(guó)內(nèi)活躍規(guī)模最高的AI產(chǎn)品,目前應(yīng)用內(nèi)已經(jīng)累計(jì)創(chuàng)建了800萬+智能體

與ChatGPT和文心一言等ChatAI類的產(chǎn)品不同的是,豆包的產(chǎn)品定位更傾向于成為一個(gè)綜合性的AI 智能體(AI Agent)平臺(tái),產(chǎn)品整體的交互形式以智能體的形式呈現(xiàn),通過一個(gè)個(gè)智能體(Agent)的方式滿足用戶在不同應(yīng)用場(chǎng)景的使用需求;通用場(chǎng)景下,用戶可以和“豆包”默認(rèn)智能體聊天對(duì)話,也可以尋找其他垂直應(yīng)用的智能體對(duì)話解決垂直場(chǎng)景的問題;

1.1.2. 豆包的研發(fā)背景和發(fā)展歷程

官方對(duì)于為什么產(chǎn)品叫豆包的說法是,一開始想著是抖音內(nèi)的AI工具包,或者是抖音內(nèi)的所有AI應(yīng)用都包了,所以叫豆包,很多用戶調(diào)侃這個(gè)名字取的太過于俗氣,但是目前從行業(yè)的風(fēng)氣上看,大廠的AI產(chǎn)品們都傾向于取一些比較實(shí)物化、普通而接地氣的名字,而不是一些高大上的名字;

豆包的前身是字節(jié)去年內(nèi)部孵化的產(chǎn)品項(xiàng)目,名稱是Grace,當(dāng)時(shí)Grace還沒有上升到整個(gè)公司重視的程度,據(jù)了解當(dāng)時(shí)公司內(nèi)部高層對(duì)于AI的態(tài)度還處于想搞清楚這是個(gè)什么東西的階段,創(chuàng)始人張一鳴也在不停地會(huì)話行業(yè)內(nèi)的專家試圖了解大模型到底是怎么回事的階段;

23年8月份的時(shí)候豆包開始灰度上線,當(dāng)時(shí)的用戶體量還不是很大,月活可能10萬都不到,并且在8~10月份一直保持著自然增長(zhǎng),根據(jù)QM公開的數(shù)據(jù)統(tǒng)計(jì),豆包的整體活躍在11月份的時(shí)候開始了跳躍性的增長(zhǎng),月活已經(jīng)開始超過1000萬,個(gè)人猜測(cè)產(chǎn)品從11月份開始對(duì)外投放廣告,因此帶來了比較明顯的增長(zhǎng),后來又經(jīng)過半年左右的時(shí)間,5月月活規(guī)模達(dá)到2600萬規(guī)模(參考字節(jié)官方公布數(shù)據(jù));

1.2. 產(chǎn)品定位

1.2.1. 豆包的產(chǎn)品定位:從產(chǎn)品、公司戰(zhàn)略的角度看產(chǎn)品定位

1)從產(chǎn)品形態(tài)的角度看產(chǎn)品定位從產(chǎn)品形態(tài)上看,前面也提到,豆包的產(chǎn)品定位是一個(gè)綜合性的AI智能體平臺(tái);目前豆包內(nèi)的智能體包括3種類型:

  1. 豆包默認(rèn)智能體:這個(gè)是用戶默認(rèn)使用的智能體,用戶首次使用時(shí)進(jìn)入的是豆包默認(rèn)的智能體,新建對(duì)話的時(shí)候也是默認(rèn)調(diào)起默認(rèn)智能體;
  2. PGC智能體:第二部分是豆包官方創(chuàng)建的智能體,目前豆包官方創(chuàng)建了25個(gè)官方智能體,包括AI圖片生成、愛聊天的小寧、全能寫作助手等;
  3. UGC智能體:這部分是用戶自己創(chuàng)建的智能體,根據(jù)官方公示,截止到24年5月份,豆包應(yīng)用內(nèi)目前已經(jīng)有將近800萬的智能體;

2)從公司戰(zhàn)略的角度看產(chǎn)品定位從公司戰(zhàn)略的角度上看,產(chǎn)品的定位包括如下幾點(diǎn):

  • 豆包更傾向于打造成為公司的品牌和門面的AI產(chǎn)品,包括從目前的產(chǎn)品規(guī)模和增長(zhǎng)趨勢(shì),以及公司的大模型名稱從之前的云雀大模型改名為豆包大模型,種種跡象都表明,公司有意將這款產(chǎn)品打磨成為一款明顯標(biāo)桿產(chǎn)品,甚至成為公司的品牌和門面的AI產(chǎn)品;
  • 豆包也是字節(jié)大模型秀肌肉的產(chǎn)品,目前豆包整體一直都免費(fèi)開放給用戶使用,起成本和消耗也不小,但是個(gè)人認(rèn)為這是一種通過C端占領(lǐng)用戶市場(chǎng)和心智,然后帶動(dòng)大模型售賣的一種方式,企業(yè)級(jí)的客戶通過使用和體驗(yàn)豆包的能力可以感受和對(duì)比豆包大模型的能力,如此更加有利于大模型的售賣,所以豆包也是字節(jié)大模型體驗(yàn)和秀肌肉的產(chǎn)品;
  • 豆包是字節(jié)AI場(chǎng)景的試驗(yàn)田,在扶持一個(gè)體量較大的AI產(chǎn)品之后,豆包也承擔(dān)起了AI應(yīng)用場(chǎng)景和市場(chǎng)驗(yàn)證的責(zé)任,目前個(gè)人感受到的思路是,flow團(tuán)隊(duì)會(huì)將一些想要驗(yàn)證的場(chǎng)景以智能體的方式放到豆包應(yīng)用內(nèi)驗(yàn)證并觀察的增長(zhǎng)的數(shù)據(jù)情況并驗(yàn)證需求,一旦需求和市場(chǎng)獲得了驗(yàn)證,便采用獨(dú)立APP的方式單獨(dú)運(yùn)作;這樣的案例,目前可以看到有貓箱、coze等產(chǎn)品;

1.3. 產(chǎn)品核心產(chǎn)品能力

目前chatbot類的產(chǎn)品功能基本都大同小異,因此這里也就不面面俱到的產(chǎn)品具體產(chǎn)品的功能,個(gè)人主要分享幾點(diǎn)個(gè)人認(rèn)為豆包做的相對(duì)還比較不錯(cuò)的,或者可以算的上產(chǎn)品核心能力的產(chǎn)品功能;

1.3.1.手機(jī)端核心產(chǎn)品功能

  • 沉浸態(tài)的語音對(duì)話的功能:目前從大部分使用用戶的反饋看,豆包的語音對(duì)話聊天的功能在自然度、擬人化和流暢度等方面都是相對(duì)來說比較不錯(cuò)的,和文心一言等競(jìng)品可以形成相對(duì)的差異,個(gè)人也主要是通過行業(yè)內(nèi)的研究人員們關(guān)注到這點(diǎn),可見目前字節(jié)在語音模型、語音合成等方面確實(shí)具備比較領(lǐng)先的技術(shù)優(yōu)勢(shì);
  • 自定義智能體:用戶可以通過創(chuàng)建智能體的方式自己捏一個(gè)角色或者智能體,并應(yīng)用于個(gè)人使用,或者公開給他人使用,目前APP內(nèi)創(chuàng)建智能體的方式比較簡(jiǎn)單,只提供了prompt、頭像、聲音配置的選項(xiàng),沒有提供太多個(gè)性化的配置能力,這部分個(gè)性化的能力目前在智能體開發(fā)平臺(tái)扣子/coze里面實(shí)現(xiàn);
  • 發(fā)現(xiàn)智能體:該模塊主要滿足需要想要尋找垂直應(yīng)用場(chǎng)景的智能體的需求,目前發(fā)現(xiàn)智能體模塊提供了頭像生成、學(xué)習(xí)、AI繪畫、游戲動(dòng)漫、角色扮演、影視小說、工作、創(chuàng)作、生活、情感、趣味等十幾類智能體;
  • 文生圖能力:豆包目前支持文生圖的功能,個(gè)人體驗(yàn)了國(guó)內(nèi)多款文生圖的chatbot類產(chǎn)品,目前在生成質(zhì)量、準(zhǔn)確性等方面,豆包的表現(xiàn)還是相對(duì)比較不錯(cuò)的,因此個(gè)人認(rèn)為目前在視覺生成方面,可能字節(jié)的能力和表現(xiàn)會(huì)相對(duì)更好一些;
  • AI生成文本+短視頻推薦組合形成query回復(fù):目前當(dāng)你涉及一些吃喝玩樂相關(guān)的話題的時(shí)候,豆包除了生成文字回復(fù),還會(huì)推流一個(gè)抖音短視頻給用戶,這種方式主要是為了解決模型無法很好的應(yīng)對(duì)實(shí)時(shí)性和物理世界相關(guān)的信息這個(gè)問題,配合人工生成的短視頻,可能能夠更好的解答用戶的問題,讓回復(fù)質(zhì)量更高;
  • 本地生活推薦:豆包支持基于用戶的LBS推薦用戶定位附近的商家,給用戶提供本地生活推薦的服務(wù),這塊的功能,個(gè)人猜測(cè)是接入了抖音本地生活推薦的數(shù)據(jù),但是目前該功能還沒有大力做,產(chǎn)品體驗(yàn)和使用價(jià)值相對(duì)一般,但是在眾多的AI產(chǎn)品里面,目前只看到了豆包做了這個(gè)嘗試,也算是一個(gè)值得一提的功能;

1.3.2.電腦端核心產(chǎn)品功能

豆包電腦端目前除了網(wǎng)頁(yè)端web版的功能,還推出了PC客戶端的版本,整體產(chǎn)品以瀏覽器的形式存在,基本有點(diǎn)類似于對(duì)標(biāo)360AI瀏覽器,其核心功能包括如下:

  • AI搜索:AI和搜索結(jié)合的場(chǎng)景,是AI的一個(gè)關(guān)鍵應(yīng)用領(lǐng)域,目前豆包的AI搜索功能,個(gè)人認(rèn)為在搜索結(jié)果的時(shí)效性、準(zhǔn)確性等方面是相對(duì)比較不錯(cuò)的,其AI搜索的能力,個(gè)人認(rèn)為甚至目前做的比文心一言的AI搜索還更好一些;據(jù)個(gè)人了解,百度搜索目前在AI搜索領(lǐng)域的布局目前還處于觀望和滯后狀態(tài),可能因?yàn)锳I搜索的成本比較高,并且AI搜索會(huì)沖擊傳統(tǒng)搜索廣告的業(yè)務(wù),所以目前沒有重點(diǎn)發(fā)力;

  • 文檔對(duì)話和閱讀總結(jié):文檔對(duì)話的產(chǎn)品目前也比較多,包括以kimi為主的產(chǎn)品,大家的體驗(yàn)表現(xiàn)上其實(shí)都差不多,但是個(gè)人體驗(yàn)到的豆包表現(xiàn)優(yōu)越的點(diǎn)在于模型的OCR能力更好,例如上傳掃描件PDF文檔的時(shí)候,豆包可以準(zhǔn)確是識(shí)別文檔的內(nèi)容,但是kimi等產(chǎn)品并沒有達(dá)到響應(yīng)的水平;
  • 內(nèi)容創(chuàng)作:支持細(xì)分場(chǎng)景的AI內(nèi)容創(chuàng)作,從之前通用的AI創(chuàng)作工具,到目前逐步支持場(chǎng)景化創(chuàng)作,總體上比之前更近一步了,但是說實(shí)話從目前的創(chuàng)作結(jié)果上,還沒有達(dá)到專業(yè)級(jí)的水平,相比市面上垂直應(yīng)用領(lǐng)域的AI寫作產(chǎn)品還是差了一些;

  • 瀏覽器插件:瀏覽器插件的功能是今年5月份左右剛剛推出的功能,能支持在瀏覽器里面實(shí)現(xiàn)基于頁(yè)面瀏覽的AI功能,包括劃詞搜索和翻譯、頁(yè)面摘要、視頻轉(zhuǎn)文字等實(shí)用功能,目前做的還比較不錯(cuò)并保持著很高頻率的產(chǎn)品更新;關(guān)于插件安裝體驗(yàn),可訪問如下文檔 https://bytedance.larkoffice.com/wiki/ZwUjwehjyibYCTksatkcb9iXnKc

  • 電腦插件:整體功能和瀏覽器插件差不多,支持切換到電腦的應(yīng)用場(chǎng)景;具體使用可搜索下載豆包電腦客戶端,安裝后進(jìn)入首頁(yè)即有相關(guān)引導(dǎo);

1.4. 豆包的關(guān)鍵版本迭代記錄

過去一年,基本豆包的每一次產(chǎn)品更新,我都在重點(diǎn)的關(guān)注,其中個(gè)人認(rèn)為值得關(guān)注的重點(diǎn)包括:

  • 去年11月份的版本更新是豆包產(chǎn)品整體改頭換面的一個(gè)版本,實(shí)現(xiàn)了幾乎豆包大部分的核心能力;
  • 之后的版本里陸續(xù)通過各種動(dòng)作探索和發(fā)展第三方智能體的價(jià)值;
  • 2月份和扣子打通,支持扣子創(chuàng)建并發(fā)布智能體到豆包;
  • 3月份強(qiáng)化搜索和文件對(duì)話能力,應(yīng)對(duì)kimi的市場(chǎng)熱度;
  • 以及Q2重點(diǎn)發(fā)展PC客戶端和瀏覽器插件;

具體的版本迭代明細(xì)見下:

23年11月迭代版本

  • 推出22個(gè)豆包官方智能體:包括英語學(xué)習(xí)助手、聊天、AI生成漫畫、音樂電臺(tái)、智能體創(chuàng)建助手、ai生成圖片、文學(xué)伴侶、戀愛大事、旅游規(guī)劃師、電影評(píng)論家、星座運(yùn)勢(shì)、起名專家、本地推薦、編程助手;
  • 強(qiáng)化AI聯(lián)網(wǎng)搜索能力:和今日頭條、抖音搜索數(shù)據(jù)打通,生成的搜索結(jié)果支持溯源并打開跳轉(zhuǎn)頭條和外部網(wǎng)站的內(nèi)容,支持查看出處,目標(biāo)是為了增加生成結(jié)果的可靠性問題;這個(gè)階段,豆包開始和頭條搜索和抖音搜索密切合作,聯(lián)網(wǎng)搜索的能力也主要是基于頭條和抖音搜索,尚未拓展到全網(wǎng)搜索;
  • 增加了關(guān)聯(lián)問題推薦的功能:基于用戶的問題提供問題推薦的功能,節(jié)省用戶輸入問題的時(shí)間,提供提問的靈感幫助用戶獲得更多的信息,增加用戶提問的頻率;
  • 支持LBS的本地生活搜索推薦:其中美食推薦還比較準(zhǔn)確,但是其他的推薦還不準(zhǔn)確,包括酒店、生活服務(wù)等;
  • 支持文生圖的產(chǎn)品能力;
  • 首頁(yè)改版強(qiáng)化智能體模塊:發(fā)現(xiàn)智能體的入口從右上角遷移到底部欄,增加了AI智能體的模塊,進(jìn)一步的強(qiáng)化了智能體平臺(tái)的定位,同時(shí)也可以看出對(duì)發(fā)展智能體生態(tài)的重視;
  • 支持抖音短視頻內(nèi)容推薦:生成文本的同時(shí)匹配與之相關(guān)的相關(guān)匹配度最高的短視頻內(nèi)容;該能力主要彌補(bǔ)ai生成內(nèi)容泛化的問題,AIGC+UGC互補(bǔ)結(jié)合更好的解決用戶對(duì)回復(fù)內(nèi)容滿意度的問題,同時(shí)抖音短視頻的內(nèi)容真實(shí)性的感覺更強(qiáng),進(jìn)一步解決用戶對(duì)生成內(nèi)容的信任感問題;

24年1月迭代版本

  • 首頁(yè)改版進(jìn)一步強(qiáng)化智能體的露出:智能體置頂?shù)绞醉?yè)頂部,支持滑動(dòng)展示;
  • 開始對(duì)智能體做進(jìn)一步的分類:分類整理出不同的分類的智能體,這個(gè)階段可見智能體的規(guī)模已經(jīng)初步發(fā)展起來;
  • 將搜索框固定到首頁(yè)頂部,強(qiáng)化搜索功能,但是后來又將搜搜框下架,主要原因可能因?yàn)樗阉黧w驗(yàn)不佳,或者也可能是針對(duì)AI搜索的一次測(cè)試;

24年2月迭代版本

  • 虛擬聊天智能體增加聊天背景封面優(yōu)化聊天氛圍,體驗(yàn)越來越像星野,且智能體創(chuàng)建支持AI生成頭像以及支持AI生成提示詞;
  • 國(guó)內(nèi)版智能體開發(fā)平臺(tái)“扣子”上線,和豆包打通,支持發(fā)布豆包;
  • 豆包AI拓展字節(jié)內(nèi)部其他產(chǎn)品:包括抖音應(yīng)用內(nèi)上線AI搜索功能,今日頭條APP首頁(yè)右上角上線豆包AI功能,內(nèi)嵌頭條;

24年3月迭代版本

  1. 智能體開始灰度支持定制個(gè)人的音色功能;
  2. 增加文檔對(duì)話分析能力:支持上傳PDF、表格、PPT、word、txt等格式文件,不支持圖片格式,文檔大小限制50個(gè)以內(nèi),大小限制20M以內(nèi);
  3. 接入bing搜索,聯(lián)網(wǎng)搜索拓展全網(wǎng)搜索,支持抖音搜索和頭條搜索之外的內(nèi)容搜索;
  4. 上線豆包PC客戶端和瀏覽器插件;

24年5月迭代版本

  1. PC端推出“問答”能力:整體產(chǎn)品形態(tài)對(duì)標(biāo)知乎產(chǎn)品,目前主要通過搜索問答類的內(nèi)容,通過搜索引擎入口引流;為利用AI問答的能力做的搜索投放獲客的能力;官方將問答內(nèi)容和生成結(jié)果沉淀為問答內(nèi)容,形成一個(gè)問答社區(qū);社區(qū)鏈接如下:https://www.doubao.com/traffic/ask
  2. 瀏覽器插件更新:支持b站視頻總結(jié)、ARXIV論文閱讀;

24年6月迭代版本

  • 豆包瀏覽器插件更新:支持youtube視頻總結(jié)和中英雙字幕,詳細(xì)功能參考如下文檔:https://bytedance.larkoffice.com/wiki/ZwUjwehjyibYCTksatkcb9iXnKc

二、產(chǎn)品所屬賽道分析

2.1. 賽道定義與細(xì)分

2.1.1. AI的賽道細(xì)分

對(duì)于目前的AI的賽道,個(gè)人總結(jié)賽道的整體布局如下,其中今年上半年比較火熱的應(yīng)用領(lǐng)域,基本聚焦在chatbot、智能體開發(fā)平臺(tái)、虛擬社交、AI搜索這幾個(gè)領(lǐng)域:

2.1.2. 豆包所屬細(xì)分賽道:Chatbot賽道

盡管很多人對(duì)于豆包的產(chǎn)品定位比較有爭(zhēng)議,稱它長(zhǎng)得像ChatGPT,又長(zhǎng)得像character.ai,但個(gè)人認(rèn)為,目前的整體產(chǎn)品形式,基本都是源于ChatGPT,所以我更傾向于歸類為chatbot賽道;

2.1.3. 賽道內(nèi)的主要競(jìng)爭(zhēng)者和市場(chǎng)競(jìng)爭(zhēng)情況

既然歸屬于chatbot賽道,因此其主要的競(jìng)爭(zhēng)對(duì)手主要包括ChatGPT、文心一言、騰訊元寶等產(chǎn)品;另外因?yàn)槎拱秃诵墓δ苓€包括虛擬社交、AI搜索等場(chǎng)景,所以kimi、character.ai、星野等產(chǎn)品,也可以視為其主要競(jìng)品;

目前從用戶體量上看,海外活躍規(guī)模的體量整體相對(duì)更高,ChatGPT毫無爭(zhēng)議為目前全球活躍規(guī)模最高的AI應(yīng)用產(chǎn)品;

對(duì)于國(guó)內(nèi),文心一言目前根據(jù)QM和similarweb提供的相關(guān)數(shù)據(jù),截止今年3月份WEB+APP的整體月活將近3000萬左右,而豆包截止5月對(duì)外公開的月活規(guī)模是2600萬,其后是kimi月活將近1800萬;

三、核心產(chǎn)品技術(shù)分析

3.1.MOE架構(gòu)模型

豆包的應(yīng)用內(nèi)承載力虛擬社交聊天、AI搜索、文檔對(duì)話、文生圖、內(nèi)容創(chuàng)作等多種使用場(chǎng)景,如此之多的功能放在一個(gè)產(chǎn)品里面,很難只是通過一個(gè)通用的大模型就能支持所有的產(chǎn)品能力,必然需要用到多種模型能力,因此豆包的底層采用的應(yīng)該是MOE(混合專家模型)架構(gòu)的模型;

MOE模型簡(jiǎn)單講就是在模型中組合了多種類型的模型,在處理實(shí)際的任務(wù)的時(shí)候,動(dòng)態(tài)匹配解決任務(wù)需要的模型組合,高效的執(zhí)行任務(wù);以在豆包內(nèi)構(gòu)建一個(gè)實(shí)時(shí)資訊聊天機(jī)器人并語音對(duì)話為例,整個(gè)過程中可能涉及到如下幾個(gè)模型:

  • 角色扮演模型:在用戶創(chuàng)建一個(gè)虛擬角色的時(shí)候,后臺(tái)可能會(huì)使用角色扮演模型輔助用戶創(chuàng)建一個(gè)具體角色的Agent;
  • RAG模型(增強(qiáng)檢索模型):用戶在和角色聊天的時(shí)候,因?yàn)橛脩魧?duì)話的query要求的是實(shí)時(shí)的資訊聊天,所以模型在響應(yīng)的時(shí)候,需要基于聯(lián)網(wǎng)檢索的結(jié)果做生成輸入,所以這個(gè)環(huán)節(jié)可能需要調(diào)用RAG模型,完成響應(yīng)輸出;
  • TTS模型(文本轉(zhuǎn)語音模型):模型完成文本的輸出之后,需要將文本合成為語音之后以語音的方式輸出給用戶,這個(gè)過程需要用到TTS模型;

以上我們通過一個(gè)案例理解什么是MOE架構(gòu)模型以及其工作原理,接下來個(gè)人猜測(cè)一下豆包的MOE模型中可能混合的哪些專家模型:

  • 基礎(chǔ)大模型:也就是豆包大模型,在解決一些通用場(chǎng)景的內(nèi)容生成,例如豆包默認(rèn)智能體的生成輸出的時(shí)候,大概率可能直接使用的是基礎(chǔ)大模型;
  • 行業(yè)大模型:包括在解決虛擬聊天和角色扮演等應(yīng)用場(chǎng)景的時(shí)候,可能使用的是角色扮演模型;
  • 文生圖模型:涉及圖像生成等場(chǎng)景的時(shí)候,必然使用的是圖像生成模型;
  • 語音合成模型、音色定制模型:目前語音聊天的場(chǎng)景,包括提供不同的音色,以及語音聊天的輸出,都是通過語音合成模型和音色定制模型技術(shù)實(shí)現(xiàn);
  • RAG模型(增強(qiáng)檢索模型)、知識(shí)圖譜:如前舉例,涉及需要聯(lián)網(wǎng)檢索,或者調(diào)用外部知識(shí)庫(kù)解答的問題,可能會(huì)用到RAG模型和知識(shí)圖譜技術(shù);
  • 向量化模型:例如在回答用戶問題時(shí),通過向量化模型,系統(tǒng)可以快速查找到和用戶問題相關(guān)的知識(shí)并生成準(zhǔn)確的回答,向量化模型主要用于將知識(shí)庫(kù)向量化,方便根據(jù)用戶問題匹配到跟用戶最相關(guān)的知識(shí),然后生成回答;

四、商業(yè)模式分析

4.1.關(guān)于豆包當(dāng)前的商業(yè)路徑的思考

當(dāng)前豆包基本完全免費(fèi),并且無限量的提供給用戶使用,在C端基本沒有商業(yè)付費(fèi)的場(chǎng)景,個(gè)人認(rèn)為目前豆包的商業(yè)模式更多的是C端免費(fèi)使用,形成市場(chǎng)規(guī)模、品牌效應(yīng)和用戶教育之后,通過模型端收費(fèi),但是鑒于最近這段時(shí)間字節(jié)大模型大幅度降價(jià)之后,可能短期售賣模型也不賺錢,而是通過模型消耗帶來的基礎(chǔ)云服務(wù)的售賣,其商業(yè)變現(xiàn)的鏈條如下:

豆包C端免費(fèi)———>企業(yè)端購(gòu)買大模型,帶動(dòng)云服務(wù)售賣———>通過售賣云服務(wù)賺錢;

所以,當(dāng)前的商業(yè)路徑,表面上是在做AI產(chǎn)品,實(shí)際上可能兜兜轉(zhuǎn)換最后可能變成了賣傳統(tǒng)的云服務(wù)賺錢。

4.2.豆包未來可能通過什么模式實(shí)現(xiàn)商業(yè)化

參考目前市面上競(jìng)品的做法以及個(gè)人的看法,未來豆包的商業(yè)化方式可能包括如下3種方式:

1)個(gè)人增值訂閱的模式:個(gè)人增值訂閱簡(jiǎn)單講就是付費(fèi)會(huì)員,與ChatGPT的plus訂閱,文心一言的會(huì)員類似,增值訂閱目前是廣泛的用戶普遍可以接受的一種方式,而增值訂閱的方式,關(guān)鍵在于未來通過什么增值功能引導(dǎo)用戶付費(fèi),我覺得可能的增值點(diǎn)可能包括:

  • 更強(qiáng)的模型:例如免費(fèi)用戶使用基礎(chǔ)模型,使用更強(qiáng)的模型需要付費(fèi);
  • 付費(fèi)智能體:例如圖像生成等對(duì)成本消耗比較高的智能體智能限量使用,超過一定使用量之后需要付費(fèi);
  • 增值功能付費(fèi):包括深度檢索功能、音色定制功能、上傳文件大小等;

2)廣告模式:作為互聯(lián)網(wǎng)廣告的收入大戶,即使在AI產(chǎn)品,未來也未嘗不可嘗試廣告變現(xiàn)的模式,其中包括檢索生成的索引入口、商家和服務(wù)的推薦等,都可能是比較合適的廣告入口,當(dāng)產(chǎn)品的體量逐步上來之后,廣告的規(guī)??赡芤矔?huì)比較可觀;

3)應(yīng)用分成模式:目前豆包應(yīng)用內(nèi)的第三方智能體為用戶創(chuàng)建并維護(hù),未來也不排除可以做成付費(fèi)智能體的可能性,特別是通過coze/扣子創(chuàng)建并發(fā)布到豆包的智能體,當(dāng)?shù)谌街悄荏w支持付費(fèi),并且豆包內(nèi)打通支付路徑之后,作為平臺(tái)方也可以向第三方應(yīng)用抽取分成;

以上三種方式,僅為個(gè)人猜測(cè),并且個(gè)人認(rèn)為增值訂閱和廣告模式的概率比較高,應(yīng)用分發(fā)的難度相對(duì)會(huì)比較大,目前豆包官方暫時(shí)也沒有對(duì)外公開其商業(yè)化的計(jì)劃和進(jìn)展情況;

4.3.豆包未來的付費(fèi)用戶可能是誰?

個(gè)人認(rèn)為,對(duì)于豆包類的chatbot的產(chǎn)品,未來潛在的主要付費(fèi)群體包括如下幾種:

  • AI愛好者:也就是ChatGPT帶起來的第一批AI的興趣用戶,這批用戶具備非常高的質(zhì)量,既理性又有消費(fèi)力,愿意為價(jià)值買單,我的身邊有非常多的這樣的群體,他們甚至愿意想盡一切辦法購(gòu)買訂閱費(fèi)用比較貴的ChatGPT plus的會(huì)員,屬于高價(jià)值、付費(fèi)購(gòu)買意愿比較強(qiáng)的群體,該部分群體的整體年齡也相對(duì)比較高,大部分聚焦在30~40歲的用戶,并且男性用戶居多;
  • 辦公族群體:包括商務(wù)辦公、學(xué)習(xí)教育、營(yíng)銷創(chuàng)作、商業(yè)服務(wù)、金融法律等行業(yè)和場(chǎng)景的用戶群體,解決的是不同領(lǐng)域的工作場(chǎng)景的需求,大部分用戶更愿意為場(chǎng)景付費(fèi),該部分用戶的年齡聚焦在25歲~40歲區(qū)間的群體;
  • 中小學(xué)生群體:社交和游戲偏好的群體可能也會(huì)是主要的付費(fèi)用戶,虛擬社交目前也是豆包的重要使用場(chǎng)景,個(gè)人該領(lǐng)域用戶畫像觀測(cè)分析認(rèn)為,該場(chǎng)景在年輕人群體中的偏好較高,未來年輕一代的用戶可能更加愿意為虛擬社交和娛樂聊天付費(fèi);

4.4.用戶的核心付費(fèi)動(dòng)機(jī)和需求是什么?

  • 為效率提升付費(fèi):現(xiàn)在大部分用戶更傾向于希望AI產(chǎn)品是一個(gè)提升效率的工具,所以用戶更傾向于為效率付費(fèi),包括生產(chǎn)效率、信息獲取效率、學(xué)習(xí)效率、辦公效率、溝通效率、決策效率等,其中生產(chǎn)效率和信息獲取效率的提升是用戶需求更強(qiáng)的場(chǎng)景;
  • 為精神娛樂和情緒價(jià)值付費(fèi):AI除了以實(shí)用價(jià)值為出發(fā)點(diǎn)的效率場(chǎng)景之外,還有以虛擬社交等為例的精神娛樂和情緒價(jià)值的應(yīng)用場(chǎng)景,該場(chǎng)景用戶為社交獵奇、情感陪伴、情緒宣泄等付費(fèi);

那么,對(duì)于效率和娛樂這兩個(gè)方向,預(yù)計(jì)哪個(gè)有可能更快看到商業(yè)變現(xiàn)?

個(gè)人認(rèn)為娛樂方向的變現(xiàn)價(jià)值可能會(huì)跑的更快,因?yàn)樾蕡?chǎng)景的變現(xiàn)極大的依賴大模型的能力,要想要做出一個(gè)能解決具體的效率場(chǎng)景的產(chǎn)品出來,現(xiàn)在說實(shí)話真的太難了,而對(duì)于效率群體而言,普通的產(chǎn)品能力如果不能切實(shí)的解決他們的問題,用戶斷然是不愿意付費(fèi)的,所以效率場(chǎng)景短期變現(xiàn)難;而娛樂場(chǎng)景,目前模型的能力基本也足以滿足,用戶的付費(fèi)也有更多的是沖動(dòng)付費(fèi)的場(chǎng)景,因此目前從市場(chǎng)上看,投資人們更多的偏好虛擬社交的產(chǎn)品;

4.5.豆包的成本結(jié)構(gòu)

對(duì)于豆包類的AI產(chǎn)品,其核心成本主要包括技術(shù)、人力、市場(chǎng)營(yíng)銷費(fèi)用這幾部分成本,至于具體的成本規(guī)模,尚不得而知;

  • 技術(shù)成本:包括模型成本、服務(wù)器和帶寬成本;
  • 人力成本:包括研發(fā)人員、產(chǎn)品和運(yùn)營(yíng)人員的人力成本
  • 市場(chǎng)費(fèi)用:拉新獲客的市場(chǎng)投放、市場(chǎng)營(yíng)銷的成本;

五、字節(jié)的AI產(chǎn)品布局和豆包的位置

5.1.字節(jié)激進(jìn)的AI應(yīng)用布局

從去年的6月份開始,字節(jié)已經(jīng)開始密集的布局AI領(lǐng)域的應(yīng)用,去年8月的時(shí)候,字節(jié)還只是上線了豆包、小悟空等少數(shù)幾個(gè)產(chǎn)品,半年多過去,目前字節(jié)在國(guó)內(nèi)和國(guó)外已經(jīng)上線了十幾個(gè)AI應(yīng)用,覆蓋了不同的熱門賽道,可謂全面開花,基本在大廠里面,在AI應(yīng)用層如此激進(jìn)的,基本也就字節(jié)了;

縱觀字節(jié)的整個(gè)AI布局,可以看到,基本上半年幾個(gè)火熱的AI應(yīng)用領(lǐng)域,字節(jié)基本都入局了,包括以豆包為標(biāo)桿的Chatbot領(lǐng)域、以貓箱為主的虛擬社交領(lǐng)域,以扣子為主的智能臺(tái)開發(fā)平臺(tái)領(lǐng)域,加上集團(tuán)內(nèi)其他舊產(chǎn)品和AI的結(jié)合,布局版圖非常大,其中對(duì)于豆包,從目前字節(jié)在產(chǎn)品的增長(zhǎng)投入、以及甚至將原來的大模型名稱從云雀大模型改成豆包大模型等一系列動(dòng)作可以看出,豆包在整個(gè)字節(jié)的AI應(yīng)用的地位非常重要;

5.2.如何看待字節(jié)的激進(jìn)和騰訊的冷靜?

一方面,個(gè)人認(rèn)為字節(jié)在AI的激進(jìn)是自上而下的,從字節(jié)的發(fā)展進(jìn)展和動(dòng)作上看,字節(jié)的高層非常重視并看到AI帶來的應(yīng)用端的機(jī)會(huì),并且迅速的開啟了當(dāng)年互聯(lián)網(wǎng)時(shí)代小步快跑、快速驗(yàn)證市場(chǎng)需求的節(jié)奏,個(gè)人認(rèn)為字節(jié)目前的發(fā)展思路存在如下幾個(gè)特點(diǎn):

  1. 快速占領(lǐng)應(yīng)用端市場(chǎng):先在目前市場(chǎng)空白階段先通過應(yīng)用端快速占領(lǐng)用戶市場(chǎng),并順利拋出一個(gè)AI領(lǐng)域的超級(jí)應(yīng)用,未來掌握入局AI應(yīng)用領(lǐng)域的第一張門票;
  2. 應(yīng)用端積累更多的用戶數(shù)據(jù),反哺大模型迭代優(yōu)化:應(yīng)用端的數(shù)據(jù)越多,對(duì)于模型的迭代和發(fā)展就越有利;

另外一方面,反觀騰訊,過去半年騰訊在AI應(yīng)用側(cè)的進(jìn)展簡(jiǎn)直冷靜到讓人不敢相信,過去的一年里面對(duì)外公開AI應(yīng)用的產(chǎn)品并不多,并且原生AI應(yīng)用的產(chǎn)品也很少,目前只有騰訊元寶、騰訊元器剛剛推出沒多久;雖然騰訊混元的負(fù)責(zé)人的觀點(diǎn)認(rèn)為目前AI應(yīng)用的滲透整體都很低,所以大家都在同一個(gè)起跑線上,但是不可否認(rèn)的是,目前騰訊在AI應(yīng)用端的反應(yīng)相對(duì)滯后,個(gè)人的觀點(diǎn)認(rèn)為如下:

  • 大模型才是最核心的,應(yīng)用端并不著急:雖然騰訊在應(yīng)用端的發(fā)聲比較少,但是根據(jù)個(gè)人了解,騰訊內(nèi)部在模型端的投入并不低,騰訊混元集中了公司很多模型研發(fā)人員,并且對(duì)外招聘的力度也比較大,可見騰訊當(dāng)前的重點(diǎn)還是先發(fā)現(xiàn)大模型的基礎(chǔ)能力;
  • 過早進(jìn)入應(yīng)用端,并不會(huì)拉開差距,成本和模型能力反而會(huì)限制增長(zhǎng)規(guī)模:對(duì)于掌握著互聯(lián)網(wǎng)大半流量的騰訊而言,孵化一個(gè)超級(jí)應(yīng)用的難度并不大,但是更多的還是應(yīng)該先看清楚市場(chǎng)之后再出手,否則過早進(jìn)入,可能形成不了市場(chǎng)占有率優(yōu)勢(shì),反而還受限成本以及模型能力,導(dǎo)致規(guī)模難以快速增長(zhǎng);

字節(jié)和騰訊對(duì)待AI應(yīng)用的兩種不同的態(tài)度,基本也代表了目前市面上大家對(duì)AI的態(tài)度和心智,只能說各有立場(chǎng)、沒有優(yōu)劣,只不過是不同認(rèn)知下的選擇而已。

六、豆包如何實(shí)現(xiàn)用戶增長(zhǎng)?

以下內(nèi)容,為個(gè)人觀測(cè)觀點(diǎn),尚未獲得實(shí)際數(shù)據(jù)驗(yàn)證,個(gè)人認(rèn)為豆包的獲客新增策略主要基于如下4個(gè)策略:

  • PLG產(chǎn)品驅(qū)動(dòng):通過持續(xù)拓展和新增更多的產(chǎn)品能力,覆蓋不同的AI賽道,滿足不同場(chǎng)景的使用需求,目前豆包基本兼容了主流的chatbot、虛擬社交、智能體創(chuàng)建、AI搜索、AI創(chuàng)作等多個(gè)方向的應(yīng)用場(chǎng)景;
  • 廣告投放:大廠的產(chǎn)品的快速增長(zhǎng),自然離不開廣告投放,豆包的快速增長(zhǎng)也主要依托字節(jié)內(nèi)部的引流投放,包括抖音和頭條官方廣告、穿山甲廣告聯(lián)盟、抖音內(nèi)容創(chuàng)作者投放等;
  • 智能體的裂變分享:用戶在使用智能體的過程中,可以把智能體鏈接分享給其他用戶,給豆包帶來更多流量;
  • 插件化:從最近關(guān)注到的情況發(fā)現(xiàn),豆包開始做瀏覽器插件、電腦操作系統(tǒng)輔助插件、以及和今日頭條合作豆包ai助手、甚至傳言目前豆包正在和手機(jī)廠商合作手機(jī)助手,這些動(dòng)向表明了未來豆包的增長(zhǎng)會(huì)通過插件化的方式,對(duì)外釋放影響力和帶動(dòng)增長(zhǎng);

七、用戶畫像分析

7.1.豆包目前的用戶畫像分析

根據(jù)某第三方數(shù)據(jù)平臺(tái)觀察分析豆包APP用戶的畫像特征如下:

  1. 男性用戶為主:豆包活躍用戶中,將近70%的用戶為男性用戶,女性用戶僅30%左右,對(duì)于該數(shù)據(jù)現(xiàn)象,個(gè)人認(rèn)為和目前國(guó)內(nèi)整體AI興趣偏好人群的分布有關(guān)系,或許對(duì)于AI科技類的產(chǎn)品,本身男性用戶天然就是比女性用戶更感興趣;想通的數(shù)據(jù)平臺(tái),觀察文心一言等其他同類型的產(chǎn)品,也存在男性用戶占比明顯高于女性用戶的特征;
  2. 25歲~40歲職場(chǎng)用戶群體為主:豆包活躍用戶中,年齡在25~40歲之間的用戶占比將近70%,為豆包的主流用戶,參考整個(gè)互聯(lián)網(wǎng)大盤的數(shù)據(jù),該年齡階段的用戶占大盤的占比近30%左右;

7.2.豆包未來的核心用戶群體是哪些?

豆包當(dāng)前的用戶畫像更多的還是受目前市場(chǎng)用戶的整體情況所影響,個(gè)人認(rèn)為,對(duì)于一個(gè)綜合性的AI智能體平臺(tái),豆包的核心用戶群體,將逐步拓展如下用戶:

  1. 年輕一代用戶:包括大學(xué)生、中小學(xué)生群體,目前豆包的整體使用用戶,更多的還是以職場(chǎng)白領(lǐng)群體為主,年輕用戶相對(duì)較少,鑒于虛擬社交場(chǎng)景也是豆包的重點(diǎn)發(fā)展場(chǎng)景之一,個(gè)人認(rèn)為未來對(duì)于社交、游戲等新奇事物比較感興趣的年輕一代群體,將會(huì)是該場(chǎng)景的重要用戶群體;
  2. 拓展下沉用戶群體:目前AI和大模型的最新資訊,主要還是在一二線城市為主,未來下沉市場(chǎng)的用戶在AI的使用滲透可能會(huì)越來越高;
  3. 女性用戶的占比逐步提升起來:AI目前對(duì)于大部分人來說,還是個(gè)技術(shù)感比較強(qiáng)的東西,相比更加吸引男性用戶,隨著未來Ai的使用門檻和工程化越來越普及,女性用戶的占比會(huì)逐步提升起來;

八、核心競(jìng)品分析

8.1 核心產(chǎn)品能力對(duì)比

個(gè)人認(rèn)為,衡量一個(gè)ChatBot類的產(chǎn)品,其核心產(chǎn)品能力的對(duì)比應(yīng)該包括如下幾個(gè)維度:

  1. 文本生成:這是LLM最基礎(chǔ)的能力,作為一個(gè)崇尚技術(shù)派的人,個(gè)人比較看重的是文本生成在邏輯推理、專業(yè)性、場(chǎng)景化等方面的表現(xiàn),因?yàn)橥ㄓ玫纳赡芰?duì)我而言是沒啥用的,我們需要專才來解決我們的問題,而不是一個(gè)什么都會(huì)的通才;
  2. 語音聊天:其次是語音聊天的能力,包括語音聊天的流暢度、真實(shí)感、交互方式,我們需要的是一個(gè)接近真實(shí)的聊天AI,而不是一個(gè)像天貓精靈那樣的傻瓜機(jī)器人;
  3. 聯(lián)網(wǎng)搜索:不言而喻,聯(lián)網(wǎng)搜索的能力基本是一個(gè)chatbot產(chǎn)品非常關(guān)鍵的能力之一,也是一個(gè)核心競(jìng)爭(zhēng)的產(chǎn)品能力點(diǎn),通常對(duì)于聯(lián)網(wǎng)能力的判斷,個(gè)人主要看搜索結(jié)果的完整度、全面性、時(shí)效性、準(zhǔn)確性;
  4. 多模態(tài):多模態(tài)的能力主要包括跨模態(tài)的輸入和輸出,包括輸入方式上支持的格式類型(文本、語音、圖片、文件、視頻等),以及輸出方式上的格式類型;
  5. 垂直場(chǎng)景解決方案:也就是解決垂直場(chǎng)景的AI應(yīng)用的解決能力,包括平臺(tái)提供的智能體、插件的能力,以及支持用戶定制智能體和插件的能力;

以下為個(gè)人對(duì)豆包及其核心競(jìng)品核心能力的對(duì)比情況,其對(duì)比僅根據(jù)個(gè)人在過去將近1年的實(shí)際使用的感受獲得的結(jié)論,僅代表個(gè)人觀點(diǎn),如有不正確的地方歡迎指出,總結(jié)起來核心觀點(diǎn)主要如下:

  1. ChatGPT在文本生成的專業(yè)度、邏輯性,語音聊天能力體驗(yàn),多模態(tài)表現(xiàn)方面相比其競(jìng)品做的都相對(duì)比較出色;但是在聯(lián)網(wǎng)搜索、插件和GPTs發(fā)展方面相對(duì)弱一些;
  2. 豆包在語音聊天,聯(lián)網(wǎng)搜索方面表現(xiàn)出色,但是在文本生成、多模態(tài)方面表現(xiàn)比Chatgpt、文心一言相比遜色一些;
  3. 文心一言在文本生成方面相比豆包更優(yōu)秀,但是語音聊天、聯(lián)網(wǎng)搜索表現(xiàn)略比豆包遜色一些;
  4. 三個(gè)產(chǎn)品在垂直場(chǎng)景的解決方案方面均沒有非常出色的表現(xiàn);

8.2 終端布局對(duì)比

整體上,豆包在拓展終端,還有用戶使用入口這個(gè)事情上,做的更加激進(jìn),包括瀏覽器插件、電腦系統(tǒng)插件的植入,甚至據(jù)聞未來還計(jì)劃將產(chǎn)品能力拓展到抖音、頭條等產(chǎn)品;

8.3 底層大模型對(duì)比

對(duì)于模型的對(duì)比,站在使用端的角度上看,個(gè)人主要從模型基礎(chǔ)參數(shù)、模型綜合表現(xiàn)能力、價(jià)格這三個(gè)維度去做對(duì),根據(jù)個(gè)人關(guān)注了解到的信息和評(píng)價(jià),對(duì)比GPT4.0、豆包大模型、文心大模型,個(gè)人評(píng)價(jià)如下:

  1. 在基本參數(shù)方面,從模型參數(shù)規(guī)模上看,目前GPT4.0的參數(shù)規(guī)模預(yù)計(jì)應(yīng)該是最高的,其訓(xùn)練數(shù)據(jù)規(guī)模個(gè)人猜測(cè)預(yù)計(jì)應(yīng)該也是最高的,至于上下文長(zhǎng)度,目前大家基本豆包128k水平,至于目前市面上一堆生成百萬、千萬級(jí)的上下文,個(gè)人并不太理解為何能做到如此大的差異,其中可能有營(yíng)銷的嫌疑,但是個(gè)人比較相信GPT4.0的上下文長(zhǎng)度上限更加有代表性;
  2. 對(duì)于模型綜合表現(xiàn)方面,盡管目前國(guó)內(nèi)有不少模型都生成達(dá)到或者超過GPT4.0的水平,但是從個(gè)人實(shí)際在應(yīng)用接入的表現(xiàn)上看,GPT4.0的綜合表現(xiàn)基本遠(yuǎn)遠(yuǎn)超過國(guó)內(nèi)所有模型;
  3. 價(jià)格方面,目前價(jià)格最低的模型是豆包大模型,今年5月份的時(shí)候其主力模型把輸出的價(jià)格下降了將近60倍,低至2元/百萬token,這個(gè)對(duì)于行業(yè)應(yīng)用的開發(fā)者而言真的是一個(gè)福音,從個(gè)人的角度上看,GPT4o的價(jià)格雖然貴,但是能力和定價(jià)匹配,豆包大模型的能力和GPT4o能力有差異,但是性價(jià)比高,但是文心大模型的價(jià)格目前屬實(shí)太高,其定價(jià)基本對(duì)標(biāo)GPT4o,站在開發(fā)者的角度上看,性價(jià)比不高

九、未來的產(chǎn)品發(fā)展方向思考

對(duì)于未來這款產(chǎn)品將會(huì)如何發(fā)展,個(gè)人認(rèn)為,未來其發(fā)展應(yīng)該會(huì)包含如下5個(gè)模塊:

  1. 核心應(yīng)用場(chǎng)景能力升級(jí)和深化:除了底層大模型的同步發(fā)展之外,豆包在產(chǎn)品工程化方面?zhèn)€人認(rèn)為后續(xù)會(huì)越來越深入,其中對(duì)于AI目前在虛擬社交、搜索、內(nèi)容創(chuàng)作、辦公、教育、生活助手等這些核心的應(yīng)用場(chǎng)景的發(fā)展,后續(xù)會(huì)提供更多的功能升級(jí)和服務(wù);
  2. 智能體生態(tài)的發(fā)展:豆包將會(huì)重點(diǎn)發(fā)展第三方智能體生態(tài),其中關(guān)鍵的目標(biāo)是孵化超級(jí)智能體,也就是使用量較高,并且能帶來更高的裂變效應(yīng)和產(chǎn)品知名度的智能體;其次是如何將未來發(fā)展起來的智能體對(duì)外拓展和賦能,讓智能體的能力得到更多的使用;
  3. 多模態(tài)AI場(chǎng)景實(shí)現(xiàn):目前豆包的大部分能力基本都是單模態(tài),未來隨著多模態(tài)大模型的發(fā)展,相信產(chǎn)品也必將推出更多的多模態(tài)使用場(chǎng)景;
  4. 插件化:豆包的插件化主要是將豆包的產(chǎn)品能力拓展到更多的用戶使用場(chǎng)景,把產(chǎn)品能力接入到更多的終端和生態(tài),其中包括PC使用場(chǎng)景的插件化、應(yīng)用插件化、硬件生態(tài)插件化,目前從產(chǎn)品的動(dòng)作和布局上,可以看到有這樣的傾向;
  5. 商業(yè)化:產(chǎn)品的商業(yè)化是必然會(huì)啟動(dòng)的,盡管目前產(chǎn)品是一個(gè)免費(fèi)產(chǎn)品,但是目前產(chǎn)品昂貴的模型成本和研發(fā)成本,必然會(huì)push產(chǎn)品開始探索商業(yè)化;

當(dāng)然,以上內(nèi)容均為個(gè)人基于對(duì)行業(yè)和產(chǎn)品的理解和經(jīng)驗(yàn)的一些想法,并非實(shí)錘信息,僅供參考。

OK,至此,關(guān)于字節(jié)豆包的產(chǎn)品分析到此為止,寫完以上內(nèi)容之后,三白表示心情十分舒暢,作為一個(gè)非常不喜歡積累收藏零散、支離破碎的知識(shí)信息的強(qiáng)迫癥患者,每次系統(tǒng)輸出某一個(gè)產(chǎn)品的知識(shí)體系的時(shí)候,就好像把自己亂七八糟的房子重新收拾了一遍一樣干凈和舒服,我挺享受這樣的知識(shí)梳理的過程。

作者:三白有話說,公眾號(hào):三白有話說

本文由 @三白有話說 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自字節(jié)豆包官網(wǎng)

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 寫的很好呀! 幫我更深度理解產(chǎn)品 行業(yè),感謝分享,高質(zhì)量?jī)?nèi)容

    來自北京 回復(fù)
    1. 謝謝呀

      來自廣東 回復(fù)
  2. 豆包比某些ChatGPT套殼的強(qiáng)

    來自廣東 回復(fù)
  3. 寫的非常好,花時(shí)間看完后對(duì)這塊產(chǎn)品有了大概的了解,也幫助我更好完成實(shí)習(xí)的工作!祝你保持狀態(tài),越來越好

    來自廣東 回復(fù)
    1. 謝謝喲

      來自廣東 回復(fù)
  4. 目前豆包AI完全免費(fèi),但以后就可能通過增值訂閱、廣告模式或應(yīng)用分成實(shí)現(xiàn)商業(yè)化。好耶歸好用,暗中賣價(jià)就不得而知了

    來自北京 回復(fù)
    1. 收費(fèi)和變現(xiàn)是一定會(huì)的,什么時(shí)候而已,AI產(chǎn)品成本那么高不收費(fèi)或者變現(xiàn)誰頂?shù)米?,暗中賣價(jià)是什么意思,沒懂!

      來自廣東 回復(fù)
  5. 專業(yè)的分析, 受益匪淺. 豆包也是我目前主力輔助工具, 豆包的火山翻譯是我目前用過最準(zhǔn)確的翻譯軟件. 期待作者的作品~

    來自河北 回復(fù)
    1. 點(diǎn)贊

      來自廣東 回復(fù)
  6. 謝謝您,我是應(yīng)屆生正好最近在準(zhǔn)備相關(guān)面試,這種知識(shí)框架的梳理真的是給我的思想提升了一個(gè)維度。感謝!

    來自四川 回復(fù)
    1. 點(diǎn)贊

      來自廣東 回復(fù)
  7. 這是真正產(chǎn)品經(jīng)理人,很牛啊!我感覺您應(yīng)該是女的,如此細(xì)心。希望豆包在繪圖方便能快速追上MJ,我愿意付費(fèi)。

    來自北京 回復(fù)
    1. 謝謝。俺是個(gè)漢子,哈哈哈??

      來自廣東 回復(fù)
  8. 好文章,感謝

    來自北京 回復(fù)
    1. 謝謝哈

      來自廣東 回復(fù)
  9. 寫的很細(xì),看完有所得

    來自廣東 回復(fù)
    1. 謝謝呀

      來自中國(guó) 回復(fù)
  10. 很驚訝競(jìng)品選擇中沒有智譜清言,作為同期發(fā)布的競(jìng)品,智譜清言不僅從模型質(zhì)量、自定義模型可配置程度、客戶端用戶體驗(yàn)等層面上都強(qiáng)過豆包,可以說從迭代功能上講豆包簡(jiǎn)直就是對(duì)智譜清言進(jìn)行拙劣模仿。居然還率先開始商業(yè)化了,果然賣產(chǎn)品靠的不是產(chǎn)品能力,而是推廣能力。

    來自江西 回復(fù)
    1. 感謝同行專家的評(píng)論,一看就是在行的,基于您的觀點(diǎn)和問題,回復(fù)如下:
      1.為什么競(jìng)品里面沒有智譜清言?
      ①首先智譜清言確實(shí)也是競(jìng)品之一,但是chatbot賽道的競(jìng)品非常多,除此之外,還有天工、訊飛星火,甚至海外還有很多產(chǎn)品,筆者并沒有選擇一一完整的羅列,站在產(chǎn)品分析的角度,個(gè)人不太喜歡面面俱到,更傾向于聚焦重點(diǎn),所以跟個(gè)人寫作的邏輯和風(fēng)格有關(guān);
      ②個(gè)人挑選聚焦重點(diǎn)競(jìng)品的邏輯,核心是基于活躍規(guī)模,根據(jù)目前個(gè)人觀察到的數(shù)據(jù),國(guó)內(nèi)chatbot類產(chǎn)品活躍前三的產(chǎn)品是文心一言、豆包、kimi,智譜清言在用戶規(guī)模上甚至還低于天工和訊飛星火,以上數(shù)據(jù)基于相對(duì)可靠的第三方平臺(tái)觀測(cè)數(shù)據(jù);至于按照活躍規(guī)模挑選競(jìng)品的邏輯是否有問題,個(gè)人認(rèn)為沒有問題,即使是騰訊、阿里、字節(jié)內(nèi)部,在選擇同賽道競(jìng)品的時(shí)候,也會(huì)優(yōu)先看規(guī)模,其次看產(chǎn)品力;

      2.“迭代功能上講豆包簡(jiǎn)直就是對(duì)智譜清言進(jìn)行拙劣模仿”個(gè)人認(rèn)為這句話“拙劣”一詞有些偏頗,不夠客觀
      從整個(gè)行業(yè)上看,大家都是在抄chatgpt,國(guó)內(nèi)的產(chǎn)品算不上模仿和抄襲,也沒有必要,即使部分功能由于上線先后,存在學(xué)習(xí)模仿的嫌疑,行業(yè)內(nèi)大家相互學(xué)習(xí)參考,沒啥問題,算不上拙劣;至于模型、產(chǎn)品之間能力差異,個(gè)人認(rèn)為,現(xiàn)在只有國(guó)內(nèi)和國(guó)外的差異,國(guó)內(nèi)的差異不值一提;

      3.“果然賣產(chǎn)品靠的不是產(chǎn)品能力,而是推廣能力”
      個(gè)人認(rèn)為,商業(yè)層面的PK,自然是多個(gè)維度的,產(chǎn)品是很重要的維度,但是不能否認(rèn)企業(yè)在流量獲客、品牌營(yíng)銷等方面的重要性,就好像海外的幾個(gè)頭部的模型,誰敢說GPT4就是遠(yuǎn)遠(yuǎn)比他們更好,但是大部分人第一個(gè)記住的是GPT4,不排除有奧特曼個(gè)人的營(yíng)銷能力在里面;純粹的產(chǎn)品思維,僅僅只是站在產(chǎn)品角度考慮問題是不夠的,商業(yè)世界,要從商業(yè)的角度考慮問題;

      最后,個(gè)人沒有貶低智譜清言的意思,不可否認(rèn)它也是一個(gè)優(yōu)秀的產(chǎn)品,只是在我的邏輯之下沒有進(jìn)入觀測(cè)視角;另外對(duì)于不同產(chǎn)品的觀點(diǎn)和看法見仁見智,關(guān)鍵在于堅(jiān)守自己的核心邏輯,同時(shí)給觀點(diǎn)要帶論據(jù)!

      來自廣東 回復(fù)
    2. 想和您討論一下這個(gè)問題,首先就目前而言我認(rèn)同您的看法,智譜的模型能力,準(zhǔn)確性是優(yōu)于豆包的。

      但這里有一個(gè)現(xiàn)狀,無論智譜還是豆包都沒有達(dá)到 100 分,在這樣的情況下,我認(rèn)為優(yōu)秀的產(chǎn)品設(shè)計(jì)是能夠彌補(bǔ)功能的差異的,對(duì)用戶側(cè)就是更好的解決用戶問題(技術(shù)能力,方案涉及是其次)。所以我也相信這個(gè)結(jié)果也確實(shí)是市場(chǎng),用戶的選擇。

      再 By the way,第一個(gè)大模型的 API, 我是多用智譜來使用的,后來也希望于桌面端、瀏覽器端可以繼續(xù)使用它(因?yàn)檎J(rèn)同他的準(zhǔn)確性更好),可惜被豆包的功能設(shè)計(jì)搶走了我這個(gè)智譜原始用戶。

      來自香港 回復(fù)