從B站審核變慢現(xiàn)象,聊聊內(nèi)容社區(qū)產(chǎn)品的內(nèi)容風(fēng)控要點(diǎn)
B站是中國(guó)年輕世代高度聚集的文化社區(qū)和視頻平臺(tái),近年來(lái)更是財(cái)報(bào)喜人。不過(guò)它最近卻受到UP主對(duì)審核速度以及審核機(jī)制的吐槽。這背后有什么深層原因呢?本文從產(chǎn)品和商業(yè)角度對(duì)此追根溯源,同時(shí)也試著分析一下內(nèi)容社區(qū)產(chǎn)品在內(nèi)容風(fēng)控策略上的一些要點(diǎn)。
3月18日,B站公布了截至2019年12月31日的第四季度和全年未經(jīng)審計(jì)的財(cái)務(wù)報(bào)告。2019財(cái)年總營(yíng)收達(dá)67.8億元人民幣,同比增長(zhǎng)64%,其中第四季度營(yíng)收同比增長(zhǎng)74%,達(dá)20.1億元人民幣,連續(xù)七個(gè)季度超市場(chǎng)預(yù)期。
UP主們一方面欣喜于“小破站”規(guī)模越來(lái)越大,另一方面也越來(lái)越對(duì)B站孱弱的變現(xiàn)能力、混亂的MCN生態(tài)和越來(lái)越長(zhǎng)的稿件審核時(shí)間、越來(lái)越嚴(yán)苛的內(nèi)容審核標(biāo)準(zhǔn)表示不滿(mǎn),尤其進(jìn)入3月以來(lái),B站UP主投遞一篇稿件,審核時(shí)間少則五六小時(shí),多則竟然超過(guò)24小時(shí),很多稿件錯(cuò)過(guò)了最佳的發(fā)布時(shí)間。
我前不久投遞的一個(gè)稿件,審核了超過(guò)20小時(shí),作為一名產(chǎn)品經(jīng)理,我認(rèn)為有必要從產(chǎn)品和商業(yè)角度,找一找B站審核變慢的原因,同時(shí)也可以試著分析一下內(nèi)容社區(qū)產(chǎn)品在內(nèi)容風(fēng)控策略上的一些要點(diǎn)。
一、B站審核為什么這么慢?
一個(gè)內(nèi)容社區(qū)的用戶(hù)角色,大致可分為內(nèi)容生產(chǎn)者(創(chuàng)作型用戶(hù))和內(nèi)容消費(fèi)者(瀏覽型用戶(hù)),既有內(nèi)容的生產(chǎn)創(chuàng)作,又有觀(guān)眾能夠消化掉創(chuàng)作產(chǎn)能,形成良好的社區(qū)內(nèi)容生態(tài)。
對(duì)于B站來(lái)說(shuō),UP主們?yōu)閻?ài)發(fā)電是B站快速增長(zhǎng)的重要基礎(chǔ),也是B站拿下國(guó)內(nèi)最大視頻UGC社區(qū)地位的重要基石。如何服務(wù)好這一波內(nèi)容生產(chǎn)者,是B站一個(gè)很關(guān)鍵的命題。
B站的社區(qū)氛圍和觀(guān)眾品味,都導(dǎo)致了社區(qū)用戶(hù)對(duì)于作品的要求極為苛刻,UP主們費(fèi)盡心機(jī),要討好“觀(guān)眾老爺”,那UP主受的委屈,當(dāng)然要在小破站上找回來(lái),平臺(tái)要是伺候不好UP主,那UP主就要炸毛了。
因此,3月以來(lái),審核時(shí)間大幅變長(zhǎng),引發(fā)了UP主大面積的抱怨,很多追熱點(diǎn)的稿件,等審核發(fā)布出來(lái),熱點(diǎn)都過(guò)去了。近日B站審核為什么這么慢?其實(shí)正如近幾日美股屢次熔斷一樣,B站審核變慢也是多重原因共同作用的結(jié)果。
1. 稿件量激增,創(chuàng)作者作品成倍增長(zhǎng)
從2019年開(kāi)始,B站“破圈”的跡象就越來(lái)越明顯,如今,B站已經(jīng)從一個(gè)小眾的亞文化社區(qū),變成多元的大眾化平臺(tái),隨便一個(gè)用戶(hù),都能明顯地感受到,來(lái)B站做UP主的人變多了。
數(shù)據(jù)也支撐了這一點(diǎn)。根據(jù)B站2019年第四季度財(cái)報(bào),B 站月均活躍UP主數(shù)量突破100萬(wàn),同比增長(zhǎng)80%;其月均投稿量同比增長(zhǎng)66%達(dá)280萬(wàn)。與數(shù)量增長(zhǎng)相輔相成的,還有稿件類(lèi)型的多樣化,例如在這段時(shí)間入駐并快速大火的“巫師財(cái)經(jīng)”“半佛仙人”、入駐但沒(méi)火的“宇宙維修隊(duì)亨哼”等UP主,都在印證著B(niǎo)站內(nèi)容創(chuàng)作在各個(gè)領(lǐng)域的破圈。
在進(jìn)入2020年以來(lái),受疫情隔離影響,B站用戶(hù)數(shù)再次大規(guī)模激增,同時(shí)受到實(shí)體經(jīng)濟(jì)不景氣影響,開(kāi)始兼職UP主的專(zhuān)業(yè)人士也相應(yīng)增多。我根據(jù)av號(hào)(B站視頻唯一編碼)做了一個(gè)保守的大致估算,2018年12月,B站日審核視頻量大約為6萬(wàn)個(gè),而今年3月,達(dá)到了13萬(wàn)個(gè)。
如此快的稿件增長(zhǎng),B站的審核系統(tǒng)很難快速響應(yīng)擴(kuò)容,原有的審核資源再繼續(xù)啃翻倍的工作量,自然壓力很大。
同時(shí)還有一點(diǎn),大量作品新增,原有的服務(wù)器資源也壓力倍增,視頻轉(zhuǎn)碼和壓制時(shí)間也相應(yīng)變長(zhǎng),這可以從視頻投稿后的轉(zhuǎn)碼時(shí)間看出。
2. 受疫情影響,B站審核力量難以全量支持
疫情隔離對(duì)于用戶(hù)來(lái)說(shuō),是空閑在家有時(shí)間創(chuàng)作更多的視頻,但對(duì)于平臺(tái)來(lái)說(shuō),意味著大量員工難以正常返崗。
2018年7月,B站在國(guó)家多部門(mén)約談并要求后整改后,投入運(yùn)營(yíng)了位于武漢的新審核中心,擴(kuò)增一倍以上審核人力。
之后,B站大量的稿件審核都由武漢審核中心完成審核,此次受疫情影響,其他城市陸續(xù)返工,但武漢恢復(fù)正常工作秩序尚需時(shí)日。
上海總部的審核力量本身不足,而且內(nèi)容審核這個(gè)工作的離職率相當(dāng)高,年前離職的空缺,年后因?yàn)橐咔?,一時(shí)也不能快速補(bǔ)充新的人進(jìn)來(lái)。
一面是入水口變粗,一面是出水口變窄,自然泡在審核池子里的稿件就越積越多。
3. 新規(guī)定帶來(lái)新的審核標(biāo)準(zhǔn)
去年12月,國(guó)家網(wǎng)信辦針對(duì)互聯(lián)網(wǎng)內(nèi)容亂象,出臺(tái)了《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》,明確了網(wǎng)絡(luò)信息內(nèi)容服務(wù)平臺(tái)的責(zé)任,從2020年3月起正式開(kāi)始實(shí)行。
在剛剛開(kāi)始正式施行的這一關(guān)頭,誰(shuí)都不敢松懈,B站也相應(yīng)地調(diào)整了審核尺度的把關(guān),同時(shí),由于新規(guī)定需要更多的培訓(xùn)向基層審核人員普及,也需要時(shí)間適應(yīng)。
4.B站的內(nèi)容風(fēng)控審核機(jī)制
相較于其他平臺(tái),B站的審核屬于比較慢的那一種。這當(dāng)然是由于國(guó)情使然,不過(guò)也反映出了平臺(tái)審核機(jī)制的效率問(wèn)題。如何利用機(jī)器審核和人工相配合,如何權(quán)衡效率和成本,是B站亟需想明白的問(wèn)題。
插一句,不存在思考“效率和標(biāo)準(zhǔn)松緊”的問(wèn)題,內(nèi)容風(fēng)控不容半點(diǎn)馬虎,必須以最嚴(yán)苛標(biāo)準(zhǔn)為準(zhǔn)繩,一條違規(guī)信息,都可能導(dǎo)致整個(gè)平臺(tái)萬(wàn)劫不復(fù)。
二、內(nèi)容風(fēng)控策略的核心要點(diǎn)是什么?
對(duì)于一款產(chǎn)品來(lái)說(shuō),其基本業(yè)務(wù)框架的抽象模型可以總結(jié)為“業(yè)務(wù)”、輔助業(yè)務(wù)的“增長(zhǎng)”、保障業(yè)務(wù)的“風(fēng)控”和支撐以上三點(diǎn)的“數(shù)據(jù)”。
“業(yè)務(wù)”自然是產(chǎn)品最關(guān)鍵的地方,“增長(zhǎng)”“風(fēng)控”和“數(shù)據(jù)”都是輔助業(yè)務(wù)良態(tài)運(yùn)行。對(duì)B站的內(nèi)容業(yè)務(wù)來(lái)說(shuō),協(xié)調(diào)內(nèi)容生產(chǎn)者和內(nèi)容消費(fèi)者,形成良好的內(nèi)容生態(tài)是關(guān)鍵的核心,輔以用戶(hù)增長(zhǎng)(包括用戶(hù)增長(zhǎng)和創(chuàng)作者增長(zhǎng)兩個(gè)方面),并且對(duì)社區(qū)進(jìn)行風(fēng)控。
通過(guò)業(yè)務(wù)的發(fā)展和增長(zhǎng)、風(fēng)控的積累,形成用戶(hù)基礎(chǔ)數(shù)據(jù)、注冊(cè)信息、瀏覽行為、視覺(jué)偏好、用戶(hù)標(biāo)簽等數(shù)據(jù),然后通過(guò)這些數(shù)據(jù),再反向支撐業(yè)務(wù)發(fā)展,形成產(chǎn)品內(nèi)的數(shù)據(jù)打通。
本文所要著重分析的,就是風(fēng)控這一環(huán)節(jié)。 金融產(chǎn)品、信貸產(chǎn)品有風(fēng)控非常好理解,但其實(shí),所有類(lèi)型的產(chǎn)品都需要有風(fēng)控。電商產(chǎn)品要防薅羊毛,社交產(chǎn)品要防欺詐,而內(nèi)容產(chǎn)品,則是要對(duì)平臺(tái)內(nèi)容的質(zhì)量和合規(guī)性進(jìn)行風(fēng)險(xiǎn)控制。
對(duì)于內(nèi)容社區(qū)等UGC產(chǎn)品來(lái)說(shuō),風(fēng)控線(xiàn)就是生死線(xiàn)。內(nèi)容和社區(qū)產(chǎn)品的風(fēng)控壓力來(lái)源于監(jiān)管側(cè),風(fēng)控對(duì)象是用戶(hù)在平臺(tái)發(fā)布的內(nèi)容。
1. 內(nèi)容風(fēng)控要“控”什么?
來(lái)自?xún)?nèi)容側(cè)的風(fēng)險(xiǎn)主要有三類(lèi)。
政策層面的內(nèi)容合規(guī),要符合監(jiān)管的要求。
監(jiān)管要求的內(nèi)容可參考最新實(shí)行的《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》,對(duì)于各項(xiàng)違規(guī)內(nèi)容都做了詳細(xì)規(guī)定,大致概括可分為涉政、違禁、暴恐、色情等四類(lèi),這部分是政策紅線(xiàn),一旦觸及,輕則約談,重則下架、封禁。
社區(qū)氛圍的良性導(dǎo)向,如謾罵、隱私等。
這一類(lèi)型的內(nèi)容雖然不會(huì)觸及監(jiān)管紅線(xiàn),但倘若內(nèi)容社區(qū)充斥各種負(fù)能量,對(duì)于社區(qū)氛圍是非常嚴(yán)重的損害,傷及用戶(hù)體驗(yàn),導(dǎo)致用戶(hù)流失,影響產(chǎn)品商業(yè)利益。
這一類(lèi)型內(nèi)容風(fēng)控還包括對(duì)于產(chǎn)品運(yùn)營(yíng)主體的保護(hù),例如對(duì)吐槽公司工作人員的內(nèi)容進(jìn)行限流處理、對(duì)平臺(tái)和產(chǎn)品的詛咒進(jìn)行刪除等,屬于商譽(yù)和公關(guān)層面的維護(hù),同時(shí)也是對(duì)產(chǎn)品官方公信力的維護(hù)。
社區(qū)用戶(hù)安全的保證。
對(duì)于內(nèi)容和社區(qū)產(chǎn)品而言,平臺(tái)內(nèi)一定會(huì)存在導(dǎo)流、灰產(chǎn)、詐騙等不法手段,如何保護(hù)平臺(tái)內(nèi)用戶(hù)的財(cái)產(chǎn)安全和產(chǎn)品體驗(yàn),是非常關(guān)鍵的,互聯(lián)網(wǎng)發(fā)展至今,導(dǎo)流、詐騙等行為往往是成熟的灰黑產(chǎn)產(chǎn)業(yè)鏈所為,他們擁有豐富的反監(jiān)查和防過(guò)濾經(jīng)驗(yàn),揪出他們并進(jìn)行處理,需要平臺(tái)與其斗智斗勇。
2. 內(nèi)容風(fēng)控的方法和手段
在最早期的階段,對(duì)內(nèi)容進(jìn)行風(fēng)險(xiǎn)控制,只能通過(guò)編輯人工進(jìn)行審核。這種方式需要大量的人力物力,而且稿件審核需要時(shí)間長(zhǎng),時(shí)效性也被大大削弱。一般的公司,很難負(fù)擔(dān)起龐大的內(nèi)容審核團(tuán)隊(duì)。
之后,誕生了關(guān)鍵詞過(guò)濾等手段,成為成本較低,并且使用最為廣泛的內(nèi)容風(fēng)控措施。對(duì)于命中預(yù)設(shè)的違禁關(guān)鍵詞的內(nèi)容,直接阻止發(fā)出或者轉(zhuǎn)交人工審核。這種方式性?xún)r(jià)比極高,耗費(fèi)成本小,但基本可以過(guò)濾掉大多數(shù)的違規(guī)內(nèi)容。
關(guān)鍵詞過(guò)濾存在的問(wèn)題也很明顯,準(zhǔn)確率較低,經(jīng)常出現(xiàn)誤傷和漏網(wǎng)的情況,對(duì)于內(nèi)容和社區(qū)平臺(tái)來(lái)說(shuō),這是不能容忍的,前文已經(jīng)講過(guò),哪怕一篇違規(guī)內(nèi)容被放出來(lái),產(chǎn)品都有可能被封禁。
再加上網(wǎng)絡(luò)的普及,越來(lái)越多的人學(xué)會(huì)了通過(guò)拼音、亂碼、諧音等方式繞開(kāi)關(guān)鍵詞,關(guān)鍵詞過(guò)濾逐漸不再能勝任內(nèi)容風(fēng)控的工作任務(wù)。
以上基本還屬于規(guī)則的范疇,之后內(nèi)容風(fēng)控的發(fā)展,就進(jìn)入了AI+策略的時(shí)代。
AI方面,其實(shí)叫機(jī)器學(xué)習(xí)更加準(zhǔn)確,這是一套組合拳。舉個(gè)例子,對(duì)于一個(gè)視頻稿件的審核,就需要對(duì)整個(gè)視頻進(jìn)行逐一拆幀,然后通過(guò)OCR文字識(shí)別檢查字幕,此時(shí)對(duì)于字幕的檢查和文字內(nèi)容的檢查基本一致,文字識(shí)別涉及到NLP分詞、語(yǔ)義理解等AI技術(shù);
對(duì)于畫(huà)面,則是圖片識(shí)別,識(shí)別圖片中可能出現(xiàn)的違禁內(nèi)容,這里涉及到一個(gè)準(zhǔn)確率的問(wèn)題,暴恐視頻不能夠通過(guò),但游戲視頻也存在戰(zhàn)斗畫(huà)面,如何保證不誤傷;對(duì)于音頻,則需要兩個(gè)方面的審查,一方面是視頻當(dāng)中的語(yǔ)句,將語(yǔ)音轉(zhuǎn)文本,再通過(guò)文字的審核策略來(lái)審核,另一方面是音調(diào)識(shí)別,例如識(shí)別音頻當(dāng)中的嬌喘等無(wú)語(yǔ)句的聲音。
機(jī)器學(xué)習(xí)還是就稿件論稿件,而一個(gè)優(yōu)秀的內(nèi)容風(fēng)控平臺(tái),是需要配合策略的。策略產(chǎn)品經(jīng)理是近幾年一個(gè)特別火的崗位,提供更精細(xì)化的、動(dòng)態(tài)的、效率的產(chǎn)品解決方案。對(duì)于策略來(lái)說(shuō),內(nèi)容的風(fēng)控不能只在單個(gè)內(nèi)容上,還需要結(jié)合更高的維度,給與更加精細(xì)化的識(shí)別判斷。
策略要從單個(gè)內(nèi)容出發(fā),延伸到發(fā)布該內(nèi)容的用戶(hù)基礎(chǔ)信息、關(guān)系鏈、過(guò)往內(nèi)容、實(shí)名可信度等等諸多維度進(jìn)行調(diào)參和計(jì)算,以判斷這名用戶(hù)的這條內(nèi)容是否需要更細(xì)致的識(shí)別。
這里要特別強(qiáng)調(diào)一點(diǎn),即使平臺(tái)的機(jī)器算法再先進(jìn),所有的內(nèi)容還都需要過(guò)人審核。所有內(nèi)容過(guò)人,所有內(nèi)容過(guò)人,所有內(nèi)容過(guò)人,重要的事情說(shuō)三遍,至于原因,還是上面那一條,內(nèi)容和社區(qū)平臺(tái)不容有半點(diǎn)閃失。
不過(guò)機(jī)器平臺(tái)越先進(jìn),能夠?yàn)槿斯徍颂峁┑妮o助也就越全面準(zhǔn)確,人工審核的效率自然也就變高,審核人員的壓力也相應(yīng)減弱。
另外,對(duì)于內(nèi)容風(fēng)控,又會(huì)有前置風(fēng)控(先審后發(fā))和后置風(fēng)控(先發(fā)后審)等不同的方式,關(guān)于這一點(diǎn),以后有機(jī)會(huì)再詳細(xì)分析優(yōu)劣和適用場(chǎng)景。
對(duì)于B站來(lái)說(shuō),隨著內(nèi)容量越來(lái)越大,單純的對(duì)審核人工進(jìn)行擴(kuò)容,恐難以解決問(wèn)題。相比抖音、今日頭條、西瓜視頻等頭條系產(chǎn)品、背靠百度AI的愛(ài)奇藝、騰訊視頻、阿里大文娛旗下的優(yōu)酷視頻,B站崛起晚、資源少、技術(shù)儲(chǔ)備弱,在機(jī)器輔助審核上還比較弱勢(shì),今后加強(qiáng)內(nèi)容風(fēng)控技術(shù),優(yōu)化內(nèi)容審核策略,改善審核后臺(tái)的體驗(yàn),不失為一個(gè)好方法,畢竟工欲善其事,必先利其器。
作者:亨哼,一個(gè)正經(jīng)的互聯(lián)網(wǎng)產(chǎn)品人,微信公眾號(hào):亨哼陣地(ID:hengpaper)
本文由 @亨哼 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自pexels,基于CC0協(xié)議
有個(gè)問(wèn)題沒(méi)想通,風(fēng)控積累的用戶(hù)基礎(chǔ)數(shù)據(jù)、注冊(cè)信息、瀏覽行為、視覺(jué)偏好、用戶(hù)標(biāo)簽等數(shù)據(jù),都是紅線(xiàn)的數(shù)據(jù),怎么反向支撐業(yè)務(wù)發(fā)展
用戶(hù)基礎(chǔ)信息 行為信息 交易行為 應(yīng)該是個(gè)中臺(tái)資源,在做風(fēng)控、用戶(hù)增長(zhǎng)、交易方面都會(huì)用到這個(gè)
光收藏不點(diǎn)贊是人性的什么特點(diǎn)~
懶的點(diǎn)2下
收藏僅代表個(gè)體意識(shí),不需要客觀(guān)環(huán)境表明自己的立場(chǎng)
幾個(gè)詞就能概括 ?
入駐但不火??
審核離職率很高? 看來(lái)還是要掌握技能啊
原來(lái)有個(gè)武漢審核中心啊 怪不得