重新理解抖音算法

0 評(píng)論 1561 瀏覽 3 收藏 16 分鐘

在信息爆炸的時(shí)代,推薦算法已成為各大平臺(tái)的核心競(jìng)爭(zhēng)力之一。抖音作為全球領(lǐng)先的短視頻平臺(tái),其算法的運(yùn)作機(jī)制和優(yōu)化策略備受關(guān)注。本文將深入剖析抖音算法的邏輯與原理,探討其如何通過(guò)協(xié)同過(guò)濾、Wide&Deep模型等技術(shù)手段實(shí)現(xiàn)千人千面的內(nèi)容推送。

技術(shù)革新是當(dāng)今社會(huì)廣泛關(guān)注的重要命題。

如近日舉行的2025年世界互聯(lián)網(wǎng)大會(huì)亞太峰會(huì),便著重探討了AI帶來(lái)的前景與挑戰(zhàn)。峰會(huì)發(fā)布了《以普惠包容的人工智能治理賦能全球可持續(xù)發(fā)展》報(bào)告,旨在深化AI治理與國(guó)際合作,通過(guò)普惠包容的AI發(fā)展,促進(jìn)彌合數(shù)字鴻溝。

科技發(fā)展不止于技術(shù)進(jìn)步本身,普惠是其重要一環(huán),而技術(shù)透明化則是通向普惠的關(guān)鍵路徑。

抖音日前舉辦的“安全與信任中心開(kāi)放日”活動(dòng)即是推動(dòng)技術(shù)透明化的典型一例。在活動(dòng)中,抖音算法工程師等相關(guān)工作人員拆解了抖音算法的邏輯與平臺(tái)審核流程。推薦算法是AI技術(shù)中機(jī)器學(xué)習(xí)的具體應(yīng)用領(lǐng)域。抖音推薦算法包含“協(xié)同過(guò)濾”算法、Wide&Deep模型、雙塔召回模型等多種技術(shù)手段,能夠通過(guò)分析和學(xué)習(xí)用戶行為來(lái)構(gòu)建千人千面的內(nèi)容推送。即便算法不懂內(nèi)容,也可以精準(zhǔn)捕捉用戶興趣,并以多元化方式增加平臺(tái)內(nèi)容豐富度和用戶留存率。

這是抖音持續(xù)努力的方向。2025年3月,抖音上線了“抖音安全與信任中心”網(wǎng)站,面向社會(huì)公開(kāi)算法原理、社區(qū)規(guī)范、治理體系和用戶服務(wù)機(jī)制。

這些動(dòng)作進(jìn)一步幫助公眾理解技術(shù)決策的邏輯,有助于建立用戶與用戶、用戶與平臺(tái)間的信任,以平臺(tái)倡導(dǎo)的優(yōu)質(zhì)多元內(nèi)容來(lái)助推互聯(lián)網(wǎng)內(nèi)容更好地發(fā)展。

01 繭房起于偏見(jiàn)

推薦算法的本質(zhì)是信息過(guò)濾系統(tǒng)。

當(dāng)下的人身處數(shù)據(jù)和信息爆炸的時(shí)代。據(jù)調(diào)研機(jī)構(gòu)IDC數(shù)據(jù),全球產(chǎn)生的數(shù)據(jù)量2024年達(dá)159ZB,到2028年將達(dá)384ZB。需要說(shuō)明的是,1ZB等于10萬(wàn)億億個(gè)Byte,如果以一部約兩小時(shí)的4K電影約20G的大小來(lái)衡量,159ZB相當(dāng)于7.95萬(wàn)億部電影,連續(xù)播放這些電影需要約18億年。

互聯(lián)網(wǎng)時(shí)代的信息遠(yuǎn)超個(gè)人所能處理的極限,必然需要平臺(tái)來(lái)分類、篩選和推薦。個(gè)性化推薦算法相當(dāng)于私人管家,已經(jīng)廣泛應(yīng)用在電商、視頻、社交等不同平臺(tái),能高效、準(zhǔn)確地滿足各個(gè)用戶的不同需求。

以抖音協(xié)同過(guò)濾算法與Wide&Deep模型的結(jié)合為例,協(xié)同過(guò)濾可以經(jīng)由不同用戶的行為推薦相似內(nèi)容,Wide&Deep模型則能發(fā)覺(jué)內(nèi)容的稀有特征并標(biāo)記相關(guān)性,兩者能夠互補(bǔ),使內(nèi)容推薦更為廣博多樣。

基于內(nèi)容的協(xié)同過(guò)濾算法會(huì)分析和比較用戶行為。假設(shè)用戶甲觀看了A、C、D內(nèi)容,用戶乙觀看了B、C、D內(nèi)容,用戶丙觀看了C、D、E內(nèi)容,算法就會(huì)判定C、D內(nèi)容有較高相似度,如果用戶喜歡C,大概率也會(huì)喜歡D。這更容易推出受更多人喜愛(ài)的頭部?jī)?nèi)容。

Wide&Deep模型則由Wide部分和Deep部分組成,Wide部分讓模型具有較強(qiáng)的記憶能力,可以直接學(xué)習(xí)并利用歷史數(shù)據(jù)中物品或特征同時(shí)出現(xiàn)的頻率;Deep部分則讓模型具有泛化能力,也就是能夠推測(cè)未見(jiàn)過(guò)的數(shù)據(jù)。比如推測(cè)一個(gè)喜歡美食的用戶可能對(duì)廚具測(cè)評(píng)感興趣。當(dāng)Wide&Deep模型與協(xié)同過(guò)濾算法共同發(fā)揮作用,平臺(tái)既可以快速推薦熱門內(nèi)容,又能挖掘用戶潛在的多樣化興趣,讓小眾內(nèi)容能被更多用戶關(guān)注。

不少人將算法視作“信息繭房”推手,但事實(shí)與之相去甚遠(yuǎn)。

信息繭房一詞來(lái)源于美國(guó)法學(xué)教授凱斯·R·桑斯坦2006年出版的《信息烏托邦》,指如果人只關(guān)注和選擇自我愉悅的內(nèi)容,信息接觸面便會(huì)越來(lái)越窄,困于自我編織的繭房中。事實(shí)上,這一概念提出時(shí)并非針對(duì)算法,也沒(méi)有實(shí)證研究和量化數(shù)據(jù)支撐。它在當(dāng)下的廣泛應(yīng)用更像是互聯(lián)網(wǎng)用戶信息焦慮的集中體現(xiàn)。

推薦算法的基礎(chǔ)是機(jī)器學(xué)習(xí),即通過(guò)對(duì)已有數(shù)據(jù)進(jìn)行數(shù)學(xué)建模,尋找規(guī)律,會(huì)將用戶對(duì)內(nèi)容的具體偏好抽象成數(shù)學(xué)關(guān)系。即使是最優(yōu)秀的算法工程師,也無(wú)法脫離算法技術(shù)的種種理論和架構(gòu),簡(jiǎn)單解釋為什么把某個(gè)視頻推薦給了這些用戶而非那些用戶。當(dāng)每個(gè)用戶都變成數(shù)據(jù)里的“點(diǎn)”時(shí),用戶無(wú)法縱覽全貌,必然極易感覺(jué)身處黑盒當(dāng)中。抖音推送的算法透明化,正是希望打開(kāi)黑盒,讓更多人真正理解算法的內(nèi)核。

澳大利亞學(xué)者阿克塞爾·布魯恩斯2019年發(fā)表的文章《問(wèn)題不在技術(shù),笨蛋》就援引了多位學(xué)者的實(shí)驗(yàn),表示社交媒體、搜索引擎等不同網(wǎng)絡(luò)平臺(tái)實(shí)際上擴(kuò)充了用戶的信息源,使用戶接觸到的信息多樣性高于不使用這些平臺(tái)的用戶,如對(duì)370萬(wàn)澳大利亞推特用戶的調(diào)研顯示,不同觀點(diǎn)的網(wǎng)絡(luò)用戶集群之間不會(huì)完全隔離,仍然保有良好互動(dòng)。

02 優(yōu)質(zhì)深度并舉

為促進(jìn)內(nèi)容豐富度提升,抖音推薦算法設(shè)置了興趣探索機(jī)制。

假如用戶特別喜歡觀看音樂(lè)類視頻,那么算法還會(huì)嘗試為用戶推送與音樂(lè)相關(guān)的其他藝術(shù)領(lǐng)域,比如美術(shù)賞析或舞蹈表演。用戶的興趣點(diǎn)還可能有大小之別,比如大部分人的觀看集中在美食領(lǐng)域,小部分人的觀看在攝影領(lǐng)域,算法推薦時(shí)也會(huì)給予像攝影這樣的小興趣點(diǎn)更多權(quán)重,避免大興趣點(diǎn)領(lǐng)域內(nèi)容的過(guò)多重復(fù)。

算法還會(huì)刻意進(jìn)行多樣化推薦,以免同質(zhì)化內(nèi)容讓用戶審美疲勞。一個(gè)喜愛(ài)搞笑情景劇的用戶,在算法不考慮多樣性的情況下可能會(huì)被連續(xù)推薦3個(gè)搞笑情景劇和2個(gè)其他內(nèi)容,但在算法設(shè)定多樣性時(shí)只會(huì)被推薦1個(gè)搞笑情景劇,其余均為多樣化的其他內(nèi)容。

如此一來(lái),算法既能貼合用戶需求,又能助力用戶探索更多可能。而且,這還有助于讓小眾、深度內(nèi)容找到真正喜愛(ài)它們的用戶。

據(jù)海克財(cái)經(jīng)了解,抖音曾嘗試直接給知識(shí)、歷史、科技等深度內(nèi)容做加熱,但實(shí)際效果不佳——此舉改變了算法的正常邏輯,會(huì)影響數(shù)據(jù)循環(huán),導(dǎo)致這些內(nèi)容的后續(xù)推薦受到干擾;此后,抖音轉(zhuǎn)換思路,針對(duì)深度內(nèi)容訓(xùn)練,預(yù)估收藏和重復(fù)觀看概率的模型,使平臺(tái)中的深度內(nèi)容分發(fā)效率更高。

博主“米三漢”2024年6月發(fā)布的“450分鐘解讀紅樓夢(mèng)”的長(zhǎng)視頻頗為典型。截至目前,這條視頻播放量超過(guò)3億,點(diǎn)贊量達(dá)1291萬(wàn),收藏量達(dá)773萬(wàn)。抖音總裁韓尚佑表示,2025年抖音優(yōu)質(zhì)內(nèi)容曝光量將增加300%。

淄博、哈爾濱、天水等城市的走紅也能印證算法對(duì)小而美內(nèi)容的力量。本地人習(xí)以為常的部分被算法挖掘出來(lái),分發(fā)給那些對(duì)旅游與地方特色感興趣的用戶,再經(jīng)由他們層層傳播,最終形成“破圈”的回響。

其中天水麻辣燙的走紅頗值一提。

2024年2月,博主“一杯梁白開(kāi)”在抖音發(fā)布了“建議全國(guó)普及甘肅麻辣燙”的視頻,視頻中的麻辣燙湯汁濃稠、色澤誘人,很快吸引了大量用戶。截至目前,該視頻點(diǎn)贊量達(dá)141萬(wàn)。后續(xù)“三個(gè)叁”“橘子公主”等博主前往天水,抖音熱榜出現(xiàn)了“到甘肅吃麻辣燙是什么體驗(yàn)”“甘肅天水打響2024旅游第一槍”等話題,越來(lái)越多用戶參與互動(dòng)。

得益于算法的精準(zhǔn)匹配和信息傳播的裂變高效,天水麻辣燙從“存在感”不強(qiáng)的本地小吃一躍成為當(dāng)?shù)卮鬅嵛穆肐P,且得到了網(wǎng)友的持續(xù)關(guān)注。官方數(shù)據(jù)顯示,2025年清明假期即4月4日至4月6日,天水憑借在線旅游訂單量入圍清明節(jié)全國(guó)“黑馬”旅游目的地,全市大部分酒店入住率近100%。

還有小眾的成都“三花”民間川劇團(tuán)、陜西考古研究員講解的考古知識(shí)、被網(wǎng)友稱作“人間清醒直擊靈魂”的作家史鐵生的作品等,都因推薦算法在抖音上煥發(fā)了新生命力。以史鐵生為例,據(jù)《2024抖音讀書生態(tài)報(bào)告》,抖音上相關(guān)視頻數(shù)量累計(jì)增長(zhǎng)192%,視頻總時(shí)長(zhǎng)增長(zhǎng)415%。

03 力促技術(shù)普惠

平臺(tái)提升內(nèi)容豐富度更能增強(qiáng)用戶粘性。

中國(guó)人民大學(xué)高瓴人工智能學(xué)院發(fā)布的《算法向善與個(gè)性化推薦發(fā)展研究報(bào)告》提及,內(nèi)容類型數(shù)量是否足夠多、內(nèi)容類型的分散程度是否足夠高,與用戶是否能長(zhǎng)期留存呈正相關(guān)態(tài)勢(shì)。清華大學(xué)社科院發(fā)布的《用戶使用、算法推薦與信息繭房研究報(bào)告》數(shù)據(jù)顯示,70%的用戶對(duì)個(gè)性化推薦算法持肯定態(tài)度,認(rèn)可算法能夠幫助用戶解決信息過(guò)載問(wèn)題。

在推薦算法的基礎(chǔ)上,抖音還進(jìn)一步擴(kuò)充了平臺(tái)機(jī)制和功能。

比如社交推薦機(jī)制,用戶可以長(zhǎng)按視頻,點(diǎn)擊“推薦”,相關(guān)視頻就會(huì)被分發(fā)給抖音內(nèi)的好友,并顯示是由哪位用戶推薦的。這種社交推薦即是對(duì)興趣推薦的補(bǔ)充。還有熱點(diǎn)熱榜,會(huì)展示當(dāng)天重要新聞事件,在話題內(nèi)容中匯集事件的最新進(jìn)展,平衡不同觀點(diǎn)以幫助用戶了解事件全貌,最大限度避免信息繭房產(chǎn)生。

抖音搜索也在持續(xù)保持增長(zhǎng)。據(jù)??素?cái)經(jīng)了解,部分知識(shí)類、攻略類內(nèi)容發(fā)布3個(gè)月以后,搜索的平均流量占比可達(dá)50%以上。平臺(tái)將搜索與推薦相結(jié)合,使優(yōu)質(zhì)內(nèi)容產(chǎn)生長(zhǎng)尾效應(yīng)。當(dāng)然,用戶也可以通過(guò)對(duì)內(nèi)容或者賬號(hào)點(diǎn)擊“不感興趣”,以及在內(nèi)容管理工具里面設(shè)置自己的內(nèi)容偏好來(lái)優(yōu)化個(gè)性化推薦內(nèi)容。

綜合而多元的機(jī)制為用戶提供了更多可能。

圖書即是如此。抖音上有大量經(jīng)典圖書、冷門佳作的相關(guān)視頻,用戶能夠在瀏覽過(guò)程培養(yǎng)興趣,并與出版社、讀書達(dá)人鏈接。這使圖書宣傳無(wú)需完全按照傳統(tǒng)的媒體宣傳、線下簽售、讀者見(jiàn)面會(huì)等路徑,原本獨(dú)立的讀者與作者、讀者與讀者被算法“打通”,甚至可以跨越時(shí)空界限。這也為圖書出版行業(yè)提供了新的渠道。

推薦算法使農(nóng)業(yè)技術(shù)推廣高效便捷。要知道,國(guó)內(nèi)中小農(nóng)戶分布廣,種植養(yǎng)殖種類眾多,需要的技術(shù)門類繁雜,原本科研機(jī)構(gòu)、農(nóng)業(yè)企業(yè)技術(shù)推廣的成本較高,正是短視頻、直播等形式使農(nóng)業(yè)技術(shù)推廣的覆蓋面更廣。

擁有22萬(wàn)粉絲的博主“梁老師講農(nóng)業(yè)”即是農(nóng)業(yè)技術(shù)推廣大軍的一員。該博主本名梁振清,已經(jīng)八十多歲,是從業(yè)40年的高級(jí)農(nóng)藝師,通過(guò)抖音來(lái)傳授自己畢生所學(xué)的農(nóng)技知識(shí)。在推薦系統(tǒng)的幫助下,他的視頻能被準(zhǔn)確推薦給對(duì)三農(nóng)、鄉(xiāng)村、農(nóng)技感興趣的用戶,用戶也能順勢(shì)在搜索框中搜索、了解農(nóng)技相關(guān)內(nèi)容,擴(kuò)展相關(guān)知識(shí)。

需要說(shuō)明的是,算法本身只是工具,內(nèi)容平臺(tái)不可能全由算法把控內(nèi)容。抖音通過(guò)人工參與的平臺(tái)治理為算法設(shè)置“護(hù)欄”,定義和識(shí)別各類風(fēng)險(xiǎn)內(nèi)容,結(jié)合內(nèi)外部反饋持續(xù)迭代算法,以確保推送的內(nèi)容合法合規(guī)。

隨著推薦算法在日常生活中的滲透率提升,公眾對(duì)算法的好奇與疑慮也在增長(zhǎng)。如今抖音通過(guò)算法透明化實(shí)踐,揭開(kāi)技術(shù)決策的數(shù)字面紗,或可由此消除誤解,累積信任,推動(dòng)內(nèi)容生態(tài)深層次變革。算法給出的不僅是瀏覽和互動(dòng)的數(shù)據(jù),更是對(duì)商業(yè)價(jià)值、文化生態(tài)、社會(huì)責(zé)任的多維支撐。追求正向內(nèi)容多元化的算法,正在成為技術(shù)向上向善的重要注腳。

文丨??素?cái)經(jīng)? 許俊浩

來(lái)源公眾號(hào):海克財(cái)經(jīng)(haikecaijing),打量商業(yè)表里,記錄時(shí)代精神。

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @海克財(cái)經(jīng) 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來(lái)自 Unsplash,基于CC0協(xié)議

該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!
专题
53646人已学习14篇文章
标题党,又爱又恨。但是如果你是运营,连标题都起不好,那就呵呵哒了。
专题
12513人已学习14篇文章
近年来,盲盒大量出现在公众视野,引起了一波又一波消费热潮。本专题的文章分享了解读盲盒营销。
专题
12872人已学习14篇文章
在这个大数据时代,数据对于企业的重要性越来越明显,因此不少企业将数据作为推动一款产品的重要前提。本专题的文章分享了如何用数据去驱动决策。
专题
35878人已学习14篇文章
原型对于产品经理来说是一门必修课。
专题
15817人已学习12篇文章
本专题的文章分享了如何从0-1搭建A/B Test。