千萬級內(nèi)容類產(chǎn)品中臺應(yīng)該有哪些模塊?

5 評論 5146 瀏覽 62 收藏 6 分鐘

文章結(jié)合牛肉加工的案例,形象地梳理了內(nèi)容中臺的運(yùn)作機(jī)制,并對各個模塊展開了分析介紹,與大家分享。

說到內(nèi)容,可以把它想象為一塊牛肉。它首先是一頭牛,然后這頭牛被送進(jìn)了加工廠,在一系列加工之后,通過物流送到超市,最后,你通過消費(fèi)獲得這塊牛肉。內(nèi)容也是一樣,需要經(jīng)過生產(chǎn)、加工、審核、分發(fā)等工序最后展示在用戶面前。本文說的內(nèi)容中臺便是如此。

一頭牛(內(nèi)容原料/內(nèi)容生產(chǎn))

和通常說的UGC/PGC的分類不一樣,此處的說的中臺將內(nèi)容來源分為外部創(chuàng)作和內(nèi)部創(chuàng)作。

外部創(chuàng)作

外部創(chuàng)作指的是爬蟲采集、人工摘錄、渠道合作以及用戶創(chuàng)作內(nèi)容(UGC)。

(1)爬蟲采集:是指對特定信息源進(jìn)行機(jī)器爬蟲采集、內(nèi)容入庫。此處說的特定的信息來源通常是公開信息網(wǎng)站,比如gov類的。爬蟲采集要求全、快、準(zhǔn)、穩(wěn)。

  • 全,爬取的內(nèi)容要全,不能把信息源的文章少爬了幾篇。
  • 快,采集要快、入庫要快,最好是能在幾秒鐘內(nèi)就出現(xiàn)在內(nèi)部文章池,然而現(xiàn)在一般是在五分鐘左右。
  • 準(zhǔn),內(nèi)容要素要準(zhǔn)、內(nèi)容定位準(zhǔn)確,比如說不能把作者當(dāng)成媒體來源。
  • 穩(wěn),采集程序穩(wěn)定,而且要有及時的監(jiān)控報警機(jī)制。

(2)人工摘錄:主要是針對那些及時性要求比較高的內(nèi)容,比如突發(fā)性重大新聞。這也側(cè)面反映出爬蟲采集存在一定缺陷,比如時效性低,很難做到秒級反應(yīng)。此外部分來源也設(shè)有反爬蟲機(jī)制,會使得內(nèi)容有所缺失。這時候就需要人工摘錄進(jìn)行補(bǔ)充。

(3)渠道合作:是指由合作商提供接口,除了常規(guī)的內(nèi)容要素,還應(yīng)該包含增刪改信息,最好是有合適的日志以及信息同步機(jī)制。

內(nèi)部創(chuàng)作

內(nèi)部創(chuàng)作說的是企業(yè)原創(chuàng),這類又分為兩種:一種是純?nèi)斯?chuàng)作,另一種是智能寫稿。

  1. 純?nèi)斯?chuàng)作:也就是原創(chuàng)內(nèi)容,由強(qiáng)大的編輯團(tuán)隊(duì)一手創(chuàng)作
  2. 智能寫稿:這個有點(diǎn)像文字填充。產(chǎn)品經(jīng)理在經(jīng)過一系列的分析以后篩選出能夠滿足用戶需求并且能被技術(shù)支持的文章類型,再對每一類文章編寫模板并規(guī)定由機(jī)器填寫的字段。此后機(jī)器就能自動產(chǎn)出符合要求的內(nèi)容了。

加工廠(內(nèi)容加工)

加工廠主要有兩種“機(jī)器”,一類是標(biāo)簽體系(內(nèi)容分類),一類是內(nèi)容加工。

標(biāo)簽體系主要服務(wù)于構(gòu)建文章池并以此作為個性化推薦的基礎(chǔ)。比如說某篇文章的標(biāo)簽是{A,B},某用戶的標(biāo)簽也是{A,B},那么這篇文章便可能有很大的概率被推送到這個用戶面前。而此處的標(biāo)簽體系便是通過對內(nèi)容的分析給它們打上各種標(biāo)簽以便于后續(xù)的分發(fā)和推送。值得注意的是,標(biāo)簽并不是越多越好,而是要遵循一定的規(guī)則,這樣才能盡可能地提高匹配程度,從而提高文章的消費(fèi)率。

內(nèi)容加工主要有以下幾步:

  1. 首先是格式的優(yōu)化,對于采集過來的文章我們需要把不合適的內(nèi)容去掉,比如說超鏈、廣告等。
  2. 然后是內(nèi)容轉(zhuǎn)存,將文章的圖片和視頻轉(zhuǎn)到自己的服務(wù)器上(這需要取得對方許可)。
  3. 其次還有一些附加模塊,這塊主要作用于各前臺的特色功能或者個性化需求,比如在文章中添加圖片、表格、投票、附件、運(yùn)營模塊(主要是banner)等。
  4. 最后是蓋戳環(huán)節(jié),就像加工廠給牛肉蓋戳一樣,我們需要對內(nèi)容的合規(guī)性、與原文的一致性等進(jìn)行復(fù)核,主要是違規(guī)詞屏蔽(也就是你們在王者農(nóng)藥里顯示不出來的芬芳)、關(guān)鍵詞替換、原文比對等。

物流分發(fā)(內(nèi)容分發(fā))

物流分發(fā)輸出的就是成品牛肉——文章池,它最重要的元素有:標(biāo)題、摘要、正文、時間、排序、內(nèi)容標(biāo)簽、個性化模塊。分發(fā)的邏輯比較復(fù)雜,而且也需要配合前臺具體需求,這里就不展開論述了。

最后附上邏輯圖:

本次分享到此結(jié)束~

 

作者:宇觴醉月;公眾號:ZZ的產(chǎn)品筆記

本文由 @宇觴醉月 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 我認(rèn)為還有一點(diǎn)非常重要的,就是如何數(shù)據(jù)化沉淀,作為一個中臺,不僅僅是倉庫那么簡單,還要短期/長期了解中臺的產(chǎn)品相關(guān)的數(shù)據(jù)才方便以后的分析與決策。

    就比如,現(xiàn)在產(chǎn)品銷售數(shù)據(jù)化了,知道物流到哪里,銷售了多少。但是作為內(nèi)容這類數(shù)字化產(chǎn)品,如何有效監(jiān)控?cái)?shù)量。謝謝

    來自廣東 回復(fù)
    1. 內(nèi)容中臺數(shù)據(jù)可以從這幾個方面入手,①內(nèi)容中臺的業(yè)務(wù)支持能力,支撐了多少業(yè)務(wù)場景;②內(nèi)容相關(guān)數(shù)據(jù),包括用戶側(cè)的,安全上的等;③內(nèi)容中臺提升效率能力,比如原來需要三個月的項(xiàng)目,對接中臺可以縮短至2周

      回復(fù)
  2. 這個加工廠需要什么樣的技術(shù)支持?

    來自廣東 回復(fù)
    1. 比如一些自動化格式處理,語義分析,監(jiān)控,預(yù)警,熱度算法等等

      回復(fù)
  3. 厲害了,最近也在整中臺

    回復(fù)