內(nèi)容分發(fā)三分天下?編輯、算法與社交
文章探討了編輯、算法與社交三種分發(fā)方式適應(yīng)的場(chǎng)景以及它們?cè)趦?nèi)容分發(fā)系統(tǒng)里的應(yīng)用。
先拋出個(gè)人的結(jié)論:編輯(中心人工主導(dǎo))分發(fā)、算法(機(jī)器主導(dǎo))分發(fā)、社交(離散人工主導(dǎo))分發(fā)各有千秋。內(nèi)容分發(fā)服務(wù)追求的是分發(fā)所能觸及的遠(yuǎn)景,為了達(dá)成遠(yuǎn)景,就需要探尋每一種分發(fā)更合適的應(yīng)用場(chǎng)景,而不是要在“劍宗”和“氣宗”里爭(zhēng)個(gè)高下。
本節(jié)試圖探討的,就是每種分發(fā)方式適應(yīng)的場(chǎng)景和它們?cè)趦?nèi)容分發(fā)系統(tǒng)里的應(yīng)用。
編輯分發(fā) vs 算法分發(fā)
從紙質(zhì)報(bào)紙雜志到廣播電視,再到門(mén)戶網(wǎng)站,盡管信息傳播的載體發(fā)生了變化,但是內(nèi)容傳播始終保持著中心化分發(fā),展示位有限、千人一面的狀態(tài),信息傳播的決策權(quán)始終握在編輯手中。
編輯分發(fā)的優(yōu)勢(shì)在于,借由專業(yè)背景知識(shí)完成了從海量?jī)?nèi)容到有限展示位置的過(guò)濾和篩選,經(jīng)過(guò)篩選的內(nèi)容,其平均質(zhì)量是相對(duì)較高的。然而,基于專家的判斷難免會(huì)出現(xiàn)偏差,為了降低“叫好不叫座”或單個(gè)編輯偏差的情況,內(nèi)容分發(fā)方也上線了相應(yīng)的策略。比如傳統(tǒng)紙媒會(huì)有編委會(huì)投票機(jī)制,通過(guò)多人判斷選題,又如門(mén)戶網(wǎng)站分時(shí)段上首頁(yè),點(diǎn)擊率一定時(shí)間不達(dá)標(biāo)自動(dòng)下架等措施。
引入了機(jī)器推薦算法的分發(fā)系統(tǒng),由于達(dá)到了千人千面的效果,展示位數(shù)量得到了大量的擴(kuò)展。在篩選人力不足以匹配展示位數(shù)量的情況下,編輯又起到怎樣的作用呢?
首先,人工同機(jī)器一定不是對(duì)立的,不然,今日頭條也不會(huì)吸引到如此多資深的傳媒背景從業(yè)者。 我和組內(nèi)的同事不止一次的真心贊美吳達(dá)(時(shí)任頭條號(hào)運(yùn)營(yíng)總監(jiān)):“我們的運(yùn)營(yíng)團(tuán)隊(duì)都是豪華高配的文化人。我跟吳達(dá)老師聊天,是要帶字典的orz”。
編輯能夠幫助推薦系統(tǒng)更好的理解內(nèi)容,也能幫助我們更好的理解站在內(nèi)容背后的創(chuàng)作者群體。
在內(nèi)容層面,編輯和審核團(tuán)隊(duì)是能夠決定什么樣的內(nèi)容是低質(zhì)的,不應(yīng)被系統(tǒng)收錄和推薦的。編輯和審核評(píng)估團(tuán)隊(duì)就像是內(nèi)容推薦系統(tǒng)的門(mén)神一樣,對(duì)于不OK的內(nèi)容Say NO,對(duì)于低質(zhì)背后的做號(hào)者Say NO。
作為最大的信息和社交分發(fā)平臺(tái),F(xiàn)acebook也在事實(shí)甄別和低質(zhì)內(nèi)容管理上強(qiáng)依賴編輯和審核的人工工作。
2016年12月16日,F(xiàn)acebook上線了Fact-Checking(事實(shí)審核)機(jī)制,將用戶舉報(bào)過(guò)多的信息交付機(jī)構(gòu)記者來(lái)判斷。如果記者判斷這則內(nèi)容是假新聞,就會(huì)將內(nèi)容標(biāo)記為存在爭(zhēng)議,一方面會(huì)在前端頁(yè)面提示給用戶此內(nèi)容可能失實(shí),另一方面會(huì)從分發(fā)量的角度進(jìn)行控制。
2017年5月,扎克伯格發(fā)帖稱Facebook會(huì)再招聘3000名內(nèi)容審查員,在此次招聘后將會(huì)達(dá)到7500人。審查員會(huì)過(guò)濾社交媒體上的不適當(dāng)內(nèi)容,如戀童癖、身體暴露、種族仇恨等內(nèi)容。
除了Say NO之外,編輯同樣會(huì)對(duì)什么樣的內(nèi)容特別值得推薦Say Yes。
以推送場(chǎng)景為例,作為強(qiáng)打斷的場(chǎng)景,被推送的內(nèi)容需要被審慎的篩選出來(lái),以保證打斷用戶是值得的。在新聞客戶端上,一貫強(qiáng)調(diào)篩選出“Breaking News”,當(dāng)重點(diǎn)新聞發(fā)生時(shí),編輯一定是24小時(shí)值守的,驗(yàn)證真實(shí)性、確定推送范圍和推送級(jí)別,只為了不錯(cuò)過(guò)每一條值得用戶關(guān)注的內(nèi)容,讓用戶能夠更準(zhǔn)確快速的獲得最新的消息。在這一過(guò)程中,技術(shù)能夠輔助更快速的構(gòu)建新聞候選集,比如追蹤社交媒體、追蹤重點(diǎn)網(wǎng)站的發(fā)布情況(如氣象局、交通局)等,但人工才是做出最終裁決的角色。
當(dāng)然,為了保證系統(tǒng)的可擴(kuò)展性和有效性,我們希望在日常推薦中盡量避免人工的直接干預(yù),如對(duì)內(nèi)容進(jìn)行調(diào)權(quán)、對(duì)展示量進(jìn)行干預(yù)等等。但是,不直接干預(yù)并不代表缺位,編輯始終在扮演一個(gè)“糾偏”的角色,當(dāng)發(fā)現(xiàn)主觀覺(jué)得好的內(nèi)容沒(méi)有得到應(yīng)有推薦量的時(shí)候,當(dāng)發(fā)現(xiàn)主觀覺(jué)得差的內(nèi)容得到過(guò)高推薦量的時(shí)候,都會(huì)給產(chǎn)品和技術(shù)做出反饋。在這種情況下,產(chǎn)品、技術(shù)、編輯(內(nèi)容運(yùn)營(yíng))會(huì)坐下來(lái)探討:其一,這是不是一個(gè)問(wèn)題,如果是問(wèn)題的話,是不是一個(gè)頻發(fā)的問(wèn)題,以此來(lái)確定解決與否和優(yōu)先級(jí);其二,探討更系統(tǒng)性的解決方案,讓這一類而不是這一個(gè)問(wèn)題得到更系統(tǒng)性的解決。
在創(chuàng)作者體系層面。我們常說(shuō),做產(chǎn)品要有用戶視角。作為平臺(tái)方,你在面對(duì)了億萬(wàn)用戶的同時(shí),也在面對(duì)萬(wàn)量級(jí)的作者。作者同樣是內(nèi)容分發(fā)系統(tǒng)的用戶。編輯會(huì)更理解創(chuàng)作者的語(yǔ)境,成為創(chuàng)作者和作品的代言人,來(lái)影響系統(tǒng)的迭代。與此同時(shí),他們也能夠以創(chuàng)作者更可理解的方式去傳遞平臺(tái)的規(guī)則,幫助不同階段的創(chuàng)作者在平臺(tái)更好的成長(zhǎng)。
題外話,我發(fā)現(xiàn)吳達(dá)老師的案頭擺了本《python數(shù)據(jù)分析》了:文化人懂技術(shù),誰(shuí)都擋不住,笑。
社交分發(fā) vs 算法分發(fā)
在Facebook、微博、微信覆蓋了越來(lái)越多的用戶之后,內(nèi)容的分發(fā)逐步去中心化:每個(gè)人都可以創(chuàng)作內(nèi)容從而成長(zhǎng)為自媒體,每個(gè)人都可以借由社交關(guān)系評(píng)論、轉(zhuǎn)發(fā)從而完成傳播。信息的傳播權(quán)從傳統(tǒng)的精英編輯讓渡到每個(gè)普通人受眾,相當(dāng)于每個(gè)人都成為了編輯,成為了內(nèi)容分發(fā)的中心。
社交分發(fā)首次讓信息的傳播變成了“千人千面”。每個(gè)用戶都有了個(gè)性化的內(nèi)容消。2010年,F(xiàn)acebook主頁(yè)訪問(wèn)量超過(guò)Google訪問(wèn)量,意味著“社交分發(fā)”已經(jīng)成為了主流的分發(fā)方式。援引皮尤研究中心此前的調(diào)查,美國(guó)成年人中有62%通過(guò)社交媒體獲取新聞,18%高度依賴該平臺(tái),通過(guò)Facebook閱讀新聞的人數(shù)占比高達(dá)44%。
當(dāng)然,社交分發(fā)也帶來(lái)了新的問(wèn)題:
一方面,進(jìn)入穩(wěn)定期后,流量出現(xiàn)了新的壟斷:一些大V由于擁有海量的粉絲、保持了高頻的發(fā)布量,事實(shí)上掌握了平臺(tái)的流量分配權(quán)。比如,微博上大部分流量被營(yíng)銷(xiāo)號(hào)和大V所占據(jù),新的內(nèi)容生產(chǎn)者獲取流量的成本劇增。
另一方面,隨著社交關(guān)系的不斷擴(kuò)張,微博微信已經(jīng)成為了線上名片,用戶關(guān)注了越來(lái)越多的來(lái)源,基于社交分發(fā)的內(nèi)容質(zhì)量也逐步下跌。朋友圈中盛行的養(yǎng)生文、微商、曬娃等等就是最好的例證。
社交分發(fā)讓人們免于信息匱乏,卻同樣帶了信息過(guò)載的問(wèn)題。為了優(yōu)化用戶的信息消費(fèi)體驗(yàn),F(xiàn)acebook率先在自己的News Feed中應(yīng)用算法進(jìn)行排序。
Facebook最初的排序方式,稱之為邊際排名算法(Edge Rank Algorithm)。
算法的核心計(jì)算公式為:E = uwd:
- u:用戶與內(nèi)容發(fā)布者之間的親密度分?jǐn)?shù),互動(dòng)越高的關(guān)系分?jǐn)?shù)越高
- w:不同反饋動(dòng)作具有不同的權(quán)重,如展示、評(píng)論、點(diǎn)贊等。比如評(píng)論動(dòng)作的權(quán)重就會(huì)顯著高于點(diǎn)贊。
- d:基于時(shí)間的衰減,越新的內(nèi)容權(quán)重越高
借由上面的公式不難看出,親密度和動(dòng)作的引入,極大的抑制了大V和營(yíng)銷(xiāo)號(hào)刷屏的情況。此前,企業(yè)賬號(hào)一旦獲得了粉絲就相當(dāng)于獲得了穩(wěn)定的廣告位,所有新廣告以幾乎0成本的形式展現(xiàn)在這些粉絲的信息流中。但此后,沒(méi)有互動(dòng)的粉絲就只是停留在頁(yè)面上的一個(gè)數(shù)字而已,企業(yè)賬號(hào)必須同時(shí)下力氣來(lái)維護(hù)自己的粉絲群體。
在隨后的日子里,F(xiàn)acebook致力于借由機(jī)器學(xué)習(xí)方式改進(jìn)排序算法,除了最初的3個(gè)EdgeRank因素之外,不斷追加新的特征和排序方式,如Story Bumping(系統(tǒng)對(duì)用戶錯(cuò)過(guò)的信息中進(jìn)行二次判斷,如果判斷為重要,則會(huì)跳過(guò)時(shí)間序進(jìn)行置頂展示),Last Actor(系統(tǒng)根據(jù)用戶最近頻繁互動(dòng)的50人,進(jìn)行信息排序的調(diào)權(quán),放大短期興趣的影響)等等。
無(wú)獨(dú)有偶,在國(guó)內(nèi),微博也逐步意識(shí)到自己的流量被大V和營(yíng)銷(xiāo)號(hào)所挾持的問(wèn)題,開(kāi)始越來(lái)越多在信息流之上應(yīng)用推薦算法,將原有的時(shí)間排序調(diào)整為智能排序,以控制刷屏、廣告泛濫等問(wèn)題,優(yōu)化用戶的使用體驗(yàn)。如果你有關(guān)注過(guò)微信朋友圈的分發(fā),就會(huì)注意到,某些被疑似過(guò)度傳播的內(nèi)容(微商廣告、轉(zhuǎn)發(fā)集贊)是被微信降頻過(guò)濾的。
微博、Facebook將關(guān)注關(guān)系作為篩選因素,將用戶的點(diǎn)擊、評(píng)論行為作為調(diào)權(quán)因素,是在“關(guān)注關(guān)系產(chǎn)出內(nèi)容”的候選集上進(jìn)行算法排序。相較起來(lái),頭條將關(guān)注關(guān)系也弱化為調(diào)權(quán)因素,從而獲得了一個(gè)更廣泛的候選集范圍(用戶相當(dāng)于在頭條上關(guān)注了所有的頭條號(hào)),在此之上進(jìn)行的排序能夠有更高的效率匹配性和更好的可擴(kuò)展性。
算法分發(fā) 分發(fā)的終局?
某種角度來(lái)看,算法分發(fā)或許可以被稱之為終極解決方案。
為什么這么說(shuō)呢?因?yàn)橥扑]算法是個(gè)筐,什么都能往里裝。它是基于我們對(duì)現(xiàn)實(shí)世界理解進(jìn)行的抽象和建模,所有我們關(guān)心的因素(編輯分發(fā)、社交分發(fā))都可以轉(zhuǎn)化為算法推薦的參考因素。
如果我們化簡(jiǎn)這個(gè)問(wèn)題,將推薦的因素收斂到編輯因素、社交因素、模型因素三個(gè)部分,那么,一個(gè)內(nèi)容在系統(tǒng)中的得分可以表示為下列公式:
內(nèi)容得分= a編輯因素 + b社交因素 + c*模型因素
a,b,c分別為三個(gè)因素的權(quán)重。如果我們把某個(gè)因素的權(quán)重置為1,其他因素的權(quán)重置為0,那么算法分發(fā)就能夠等同于編輯分發(fā)或社交分發(fā)。
各種權(quán)重的調(diào)節(jié),則完全是以平臺(tái)的價(jià)值感導(dǎo)向所決定的。以FaceBook為例,其認(rèn)為來(lái)自真實(shí)好友關(guān)系的生活記錄內(nèi)容更重要,在分發(fā)過(guò)程中就會(huì)加強(qiáng)真實(shí)好友生活記錄內(nèi)容的權(quán)重,而弱化他們轉(zhuǎn)發(fā)內(nèi)容的權(quán)重,進(jìn)一步弱化媒體所發(fā)布內(nèi)容的權(quán)重等等。
事實(shí)上,我們所熟悉的各類內(nèi)容分發(fā)產(chǎn)品,無(wú)論起步如何,如今都走上了一條多元素融合的道路上:依賴中心化編輯引導(dǎo)和干預(yù),依賴去中心化用戶生產(chǎn)傳播,應(yīng)用機(jī)器學(xué)習(xí)提升效率。新版的微博也在關(guān)注頻道的旁邊放置了熱門(mén)頻道,提供了不依賴于訂閱關(guān)系的內(nèi)容推薦服務(wù),微信都上線了實(shí)驗(yàn)室功能“看一看”。
沉迷氣宗劍宗之爭(zhēng)的看官們,還是散了吧。
作者:閆澤華
來(lái)源:http://www.jianshu.com/p/af99c4dd08fa
本文由 @閆澤華 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。
題圖來(lái)自PEXELS,基于CC0協(xié)議
瞎幾把扯
請(qǐng)問(wèn)模型因素是指什么呢
請(qǐng)問(wèn)模型因素如何影響內(nèi)容得分呢?
內(nèi)容得分= a編輯因素 + b社交因素 + c*模型因素,這個(gè)吊