知識(shí)圖譜在內(nèi)容類產(chǎn)品中的應(yīng)用
編輯導(dǎo)語(yǔ):內(nèi)容類產(chǎn)品若想提升用戶體驗(yàn),便需要提高內(nèi)容品質(zhì),使用戶能夠方便快捷地獲取內(nèi)容。那么,如何提升內(nèi)容類產(chǎn)品的品質(zhì)?本篇文章里,作者對(duì)當(dāng)前內(nèi)容類產(chǎn)品現(xiàn)狀做了簡(jiǎn)要闡述,并對(duì)知識(shí)圖譜如何應(yīng)用于內(nèi)容類產(chǎn)品做了總結(jié),一起來(lái)看一下。
一、前言
知識(shí)圖譜相信大家已經(jīng)不陌生,已經(jīng)大家比較熟知的一個(gè)詞匯了。最早知識(shí)圖譜是谷歌為了優(yōu)化搜索引擎提出的一套理論體系。最常見(jiàn)的大家如果搜索“王健林的兒子是誰(shuí)”,有了知識(shí)圖譜的加持,搜索引擎會(huì)直接告訴你答案是王思聰,而不是去檢索“王健林的兒子是誰(shuí)”這句話。
如今的知識(shí)圖譜已經(jīng)廣泛應(yīng)用于各種智能場(chǎng)景。例如在金融領(lǐng)域反欺詐的應(yīng)用,最常見(jiàn)的我們發(fā)現(xiàn)兩個(gè)不同的信貸客戶使用的竟然是同一個(gè)手機(jī)號(hào),發(fā)現(xiàn)這類異常,我們?cè)偃ミM(jìn)一步深挖原因,避免欺詐情況發(fā)生。
在NLP(Natural Language Processing,自然語(yǔ)言處理)中,知識(shí)圖譜常用于實(shí)體統(tǒng)一。正常的NLP如果沒(méi)有特殊配置,計(jì)算機(jī)一定是不理解“ICBC”就是指的是“中國(guó)工商銀行”。通過(guò)知識(shí)圖譜將“ICBC”都統(tǒng)一為“中國(guó)工商銀行”。
另外通過(guò)知識(shí)圖譜在指代消解中的應(yīng)用,增加計(jì)算機(jī)對(duì)于文本理解的準(zhǔn)確率。知識(shí)圖譜適用的領(lǐng)域還非常多,在此就不列舉了。
本文主要討論通過(guò)知識(shí)圖譜在內(nèi)容類產(chǎn)品中的應(yīng)用,提高內(nèi)容類產(chǎn)品的品質(zhì),進(jìn)而提升客戶滿意度與產(chǎn)品的競(jìng)爭(zhēng)力。
二、我們的痛點(diǎn)
目前處于信息大爆炸的時(shí)代,我們每時(shí)每刻都接收大量信息。當(dāng)我們?cè)谒阉饕婊蚴莾?nèi)容類應(yīng)用去查看信息時(shí),往往會(huì)給我們呈現(xiàn)許多與我們不相關(guān)的垃圾信息。有些信息是在內(nèi)容創(chuàng)作階段,通過(guò)各種抄襲拼湊而生成文章,最后呈現(xiàn)給用戶結(jié)果雖然很多,但毫無(wú)價(jià)值,也提升了用戶的檢索成本。
相信大家在日常使用中,也有同感,當(dāng)我們?nèi)ニ阉飨胍男畔r(shí),往往會(huì)出來(lái)一大堆,信息過(guò)于分散,也不成體系。
我們需要有一種平臺(tái),可以給我們提供相對(duì)比較純凈、權(quán)威的信息。我們的生活需要高品質(zhì),不論是物質(zhì)生活還是精神生活。信息是我們精神生活的重要組成部分,同樣我們也需要有成體系的、有深度的內(nèi)容出現(xiàn)。
三、目前現(xiàn)狀
目前內(nèi)容類的應(yīng)用很多。幾乎每個(gè)領(lǐng)域都有每個(gè)領(lǐng)域的核心內(nèi)容供應(yīng)商。比如自己查看產(chǎn)品相關(guān)文章,幾乎不會(huì)去使用搜索引擎檢索文章,而是到相應(yīng)的產(chǎn)品網(wǎng)站去查看或檢索內(nèi)容。主要是一種信任感。所以平臺(tái)內(nèi)容的品質(zhì)很重要。
通常內(nèi)容創(chuàng)造,主要分為:OGC(Occupationally Generated Content, 職業(yè)生產(chǎn)內(nèi)容)、PGC(Professionally Generated Content,專業(yè)人士輸出內(nèi)容)和UGC(User Generated Content,用戶輸出內(nèi)容)。一般OGC和PGC生成的內(nèi)容品質(zhì)較高,但畢竟人力有限,依賴UGC可以短時(shí)間內(nèi)產(chǎn)生大量?jī)?nèi)容,但內(nèi)容的品質(zhì)不能保證,過(guò)多的垃圾內(nèi)容,反而會(huì)降低內(nèi)容平臺(tái)的權(quán)威性。
如何能提高內(nèi)容數(shù)量的同時(shí),又不影響內(nèi)容的品質(zhì),這是內(nèi)容類產(chǎn)品必然要考慮的一個(gè)問(wèn)題。
四、知識(shí)圖譜如何應(yīng)用于內(nèi)容類產(chǎn)品
對(duì)于內(nèi)容類產(chǎn)品,如果你是內(nèi)容類產(chǎn)品的產(chǎn)品經(jīng)理,需要制定一個(gè)關(guān)于你所負(fù)責(zé)的內(nèi)容類產(chǎn)品的“北極星”指標(biāo),你會(huì)怎么制定?
是產(chǎn)品的DAU(Daily Active User,日活躍用戶)、MAU(Monthly Active User,月活躍用戶)還是ARPPU(Average Revenue Per Paying User,平均每付費(fèi)用戶貢獻(xiàn)的收入)?
這些指標(biāo)其實(shí)都可以人為去干預(yù)。就像是公交車總公司要求提升乘客上座率,結(jié)果公交車分公司為了提升上座率,減少了公交車的座位數(shù),指標(biāo)是達(dá)到了,但沒(méi)解決本質(zhì)問(wèn)題。
好的產(chǎn)品一定不是通過(guò)指標(biāo)制定出來(lái)的。而是去發(fā)現(xiàn)本質(zhì)的問(wèn)題,解決最核心的問(wèn)題。對(duì)于內(nèi)容類產(chǎn)品而言,你的內(nèi)容質(zhì)量提升了,用戶在第一時(shí)間很方便找出他們需要的信息,覺(jué)得產(chǎn)品整個(gè)使用過(guò)程簡(jiǎn)潔流暢,這就可以了。
所以內(nèi)容類產(chǎn)品的“北極星”指標(biāo)應(yīng)該設(shè)定為:提升內(nèi)容品質(zhì),增加優(yōu)質(zhì)內(nèi)容數(shù)量。
內(nèi)容品質(zhì)上去了,瀏覽量自然就上來(lái)了。
如何提升內(nèi)容類產(chǎn)品的品質(zhì)?
結(jié)合個(gè)人多年實(shí)際工作經(jīng)驗(yàn),我認(rèn)為最主要有三點(diǎn):
- 平臺(tái)的內(nèi)容不能有重復(fù)。很明顯,用戶到一個(gè)平臺(tái)中,看到的都是一些重復(fù)的內(nèi)容,肯定對(duì)這個(gè)平臺(tái)印象很差,就很難產(chǎn)生信任,就更不必說(shuō)去推薦給其他人了。
- 平臺(tái)的內(nèi)容不能有明顯的錯(cuò)誤。內(nèi)容類產(chǎn)品內(nèi)容是其產(chǎn)品最為核心的競(jìng)爭(zhēng)力。內(nèi)容要確保其權(quán)威性,當(dāng)用戶需要某些信息時(shí),可以很自信地說(shuō),來(lái)源于XX平臺(tái)。這就要求平臺(tái)上的內(nèi)容要很精準(zhǔn)。
- 平臺(tái)的內(nèi)容要方便獲取。用戶需要某些信息時(shí),平臺(tái)可以很快速地響應(yīng)用戶的訴求,節(jié)省用戶信息檢索成本。如何通過(guò)知識(shí)圖譜實(shí)現(xiàn)上述目標(biāo)?
如上圖所示。我們可以按上圖所描述的框架進(jìn)行內(nèi)容類產(chǎn)品知識(shí)圖譜的構(gòu)建。
我們知道,一般OGC和PGC的內(nèi)容會(huì)有專門的人員進(jìn)行校對(duì)和審核,而UGC的內(nèi)容,平臺(tái)往往沒(méi)有非常多的人力去做這個(gè)事情。
目前內(nèi)容類平臺(tái),基于AI(Artificial Intelligence,人工智能)技術(shù),主要是NLP技術(shù),對(duì)于內(nèi)容類的應(yīng)用,主要是用于對(duì)非法內(nèi)容的審核。而對(duì)于內(nèi)容品質(zhì)的管理——不冗余、準(zhǔn)確且易獲取,就需要用到上述的知識(shí)圖譜框架來(lái)進(jìn)行實(shí)現(xiàn)。
首先,我們對(duì)用戶發(fā)表的內(nèi)容進(jìn)行數(shù)據(jù)轉(zhuǎn)換與統(tǒng)一,因?yàn)橛脩糨斎氲膬?nèi)容,可能是文字、聲音或是視頻。根據(jù)不同結(jié)構(gòu)的數(shù)據(jù)統(tǒng)一轉(zhuǎn)換成結(jié)構(gòu)化數(shù)據(jù)。
其次,我們對(duì)轉(zhuǎn)換與統(tǒng)一好的數(shù)據(jù)進(jìn)行數(shù)據(jù)建模,并進(jìn)行知識(shí)抽取。生成基本的知識(shí)體系。為后續(xù)的知識(shí)融合與計(jì)算奠定基礎(chǔ)。
再次,我們進(jìn)行知識(shí)融合與計(jì)算。這一步是知識(shí)圖譜在內(nèi)容類產(chǎn)品中的應(yīng)用關(guān)鍵。在這個(gè)步驟中,我們可以發(fā)現(xiàn)平臺(tái)內(nèi)冗余的內(nèi)容信息。
例如,某一個(gè)用戶發(fā)表的內(nèi)容在介紹月球,有如下知識(shí)圖譜信息(使用JSON表示):
{“實(shí)體名稱”:”月球”,”實(shí)體信息”:[{“英文名稱”:”moon”},{“分類”:”衛(wèi)星”},{“公轉(zhuǎn)周期”:”約27.32天”},]}
如果另一個(gè)用戶發(fā)表的內(nèi)容,抽象出來(lái)的圖譜信息和上一個(gè)用戶的知識(shí)圖譜內(nèi)容是一樣的,基本我們可以判斷是一個(gè)冗余信息。只不過(guò)我們可以通過(guò)設(shè)定圖譜的權(quán)重進(jìn)一步為內(nèi)容進(jìn)行打分。
正常情況下,用戶檢索內(nèi)容的時(shí)候,更多的是希望獲得答案,比如提問(wèn)“月亮的公轉(zhuǎn)周期是多少?”,我們只需要給用戶提供結(jié)果“約27.32天”就可以。
另外,在這個(gè)知識(shí)融合的過(guò)程,通過(guò)知識(shí)圖譜可以發(fā)現(xiàn)異常與錯(cuò)誤的內(nèi)容。
例如,圖譜中,我們已經(jīng)定義地球是圓的,突然出來(lái)用戶的文章,說(shuō)地球是方的。兩個(gè)內(nèi)容,抽象出的“地球-形狀-圓形”與“地球-形狀-方形”,有明顯的不一致。就可以快速發(fā)現(xiàn)異常信息。經(jīng)過(guò)人工與是計(jì)算機(jī)AI進(jìn)一步進(jìn)行對(duì)內(nèi)容的處理,將優(yōu)質(zhì)的信息上浮,使劣質(zhì)的信息下沉或消亡。
最后,就是知識(shí)圖譜的最終呈現(xiàn)。
用戶希望在平臺(tái)獲得某些內(nèi)容時(shí),我們除了直接為用戶提供其需要的答案外,我們還可以通過(guò)知識(shí)圖譜將結(jié)果內(nèi)容進(jìn)行關(guān)聯(lián)化展示,使用戶清晰地了解到內(nèi)容以及答案的來(lái)龍去脈與因果關(guān)系,在內(nèi)容的廣度和深度上服務(wù)于用戶。
五、小結(jié)
未來(lái)的互聯(lián)網(wǎng)會(huì)向著元宇宙(Metaverse)方向發(fā)展。在這里,就像是電影《黑客帝國(guó)》中所描述的場(chǎng)景,我們會(huì)通過(guò)腦機(jī)接口,在一個(gè)浩瀚的虛擬的時(shí)空中進(jìn)行集合。在這個(gè)時(shí)空里,人將會(huì)同計(jì)算機(jī)無(wú)縫整合,AI也會(huì)達(dá)到前所未有的高度。
內(nèi)容,本身就是一個(gè)虛擬世界。內(nèi)容平臺(tái),本身也是一個(gè)元宇宙的平臺(tái)。虛擬的世界,也是世界。內(nèi)容平臺(tái)的內(nèi)容,本身也會(huì)像是宇宙一樣,浩瀚無(wú)邊。
雖然說(shuō)互聯(lián)網(wǎng)是開(kāi)放的,但是我們與不能因?yàn)殚_(kāi)放,而放棄對(duì)高品質(zhì)內(nèi)容的追求。正是因?yàn)殚_(kāi)放,我們更要有一種機(jī)制來(lái)維護(hù)這個(gè)社區(qū)的健康有序發(fā)展。
而知識(shí)圖譜,將會(huì)是內(nèi)容平臺(tái)中的一種隱形的規(guī)則,確保在內(nèi)容平臺(tái)中,每個(gè)參與者所提供內(nèi)容的嚴(yán)肅與高品質(zhì)。這也是未來(lái)元宇宙健康蓬勃發(fā)展的關(guān)鍵。
#專欄作家#
王佳亮,微信公眾號(hào):佳佳原創(chuàng),人人都是產(chǎn)品經(jīng)理專欄作家。中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)會(huì)員,專注于互聯(lián)網(wǎng)產(chǎn)品設(shè)計(jì)理念分享。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于CC0協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!