揭秘算法推薦:統(tǒng)計、分類與分發(fā)織成信息牢籠

3 評論 6086 瀏覽 30 收藏 13 分鐘

編輯導語:在信息傳播過程中,算法推薦具有壟斷性與不穩(wěn)定性,極易對普通用戶造成信息牢籠。對待千人千面的算法推薦,不同的人有不同的態(tài)度,有人歡喜,有人愁。算法推薦未來會走向何方呢?一起來看看吧!

“讓人類永遠保持理智,確實是一種奢求”。《流浪地球》中MOSS直到毀滅,也沒弄明白航天員劉培強為什么甘愿赴死。

揭秘算法推薦:統(tǒng)計、分類與分發(fā)織成信息牢籠!

MOSS是人類已經(jīng)能夠制造出推動地球航行的行星發(fā)動機,科技來到新高度下的高級人工智能,但與007這樣具有自主智慧的人工智能還相距甚遠,本質(zhì)上與現(xiàn)在通過數(shù)據(jù)層、算法層、應用層給用戶帶來最優(yōu)解的算法推薦是一樣的。

01 什么是算法推薦

談及算法推薦,大部分人腦子可能閃過的第一個詞就是“今日頭條”。的確,字節(jié)跳動旗下的今日頭條、抖音等產(chǎn)品在推薦算法的賦能下,給大眾留下了千人千面的深刻印象。

其實,除字節(jié)跳動外,阿里巴巴在天貓、淘寶,網(wǎng)易在網(wǎng)易云音樂,B站在視頻推薦流中都有廣泛使用推薦算法??梢院敛豢鋸埖恼f,互聯(lián)網(wǎng)行業(yè)中只要不是用戶主動尋找的直接信息,甚至是廣告背后都有推薦算法的身影。

1994年,美國美國明尼蘇達大學GroupLens研究組推出第一個自動化推薦系統(tǒng) GroupLens,提出了將協(xié)同過濾作為推薦系統(tǒng)的重要技術(shù),也是最早的自動化協(xié)同過濾推薦系統(tǒng)之一。

4年后(1998年),亞馬遜上線了基于物品的協(xié)同過濾算法,這便是算法推薦的最早商用案例,后面Facebook、Netflix,乃至中國的字節(jié)跳動、阿里巴巴等企業(yè)都廣泛應用了算法推薦。其實算法推薦并不復雜,總結(jié)起來就是信息的“統(tǒng)計、分類、分發(fā)”6個字。

通俗的來講,算法推薦就是APP利用大數(shù)據(jù)科學的給用戶“算命”。

首先,后端系統(tǒng)會通過應用層的注冊信息、用戶點擊行為收集統(tǒng)計所有信息;然后再通過策略層的相關(guān)算法對信息進行分類,勾畫用戶畫像;最后策略層再對平臺上的其他信息與用戶畫像相匹配,把結(jié)果在應用層呈現(xiàn)到用戶眼中。

這個過程就好比算命,你把生辰八字告訴算命先生,然后算命先生根據(jù)生辰八字和相關(guān)法則給出你想要的答案。

揭秘算法推薦:統(tǒng)計、分類與分發(fā)織成信息牢籠!

數(shù)據(jù)來源:amazon按觸發(fā)條件不同,算法推薦系統(tǒng)目前大致有兩類:

  1. 一類是被動觸發(fā)的,需要用戶圈定一定限制條件后,系統(tǒng)給你推薦最優(yōu)解;
  2. 另一類是主動觸發(fā),你只要打開APP后系統(tǒng)就會自動給你推薦內(nèi)容,無需用戶設置條件。

被動觸發(fā)的算法推薦中,58同城可當成一個經(jīng)典案例。

58同城是一個集房產(chǎn)、招聘、汽車、家政、本地服務于一體的綜合性網(wǎng)站,這就造成了用戶行為目的的不確定性,僅前面列舉的5項功能就有21種可能,如進入里面的子項其組合可能將會成指數(shù)級增長,因此算法推薦對于他們而言的目的是幫助用戶更快找到合適的信息。

例如租房時,58同城會根據(jù)用戶的選購條件,例如價格、區(qū)位、戶型等在數(shù)據(jù)層做出統(tǒng)計,然后策略層通過對房源特征分類,將每個特征賦予一個權(quán)重,再然后通過用戶數(shù)據(jù)與房源特征組合形成召回數(shù)據(jù),最終召回數(shù)據(jù)在應用層優(yōu)先推薦權(quán)重高的召回數(shù)據(jù),直至與用戶要求完全相違背。

揭秘算法推薦:統(tǒng)計、分類與分發(fā)織成信息牢籠!

數(shù)據(jù)來源:《58同城智能推薦系統(tǒng)的演進與實踐》主動觸發(fā)類的算法推薦,頭條系的抖音必須擁有姓名。

抖音與58同城的多品類、多層級的復雜信息流不同,抖音的宗旨就是讓信息找人,人就是平臺的流量池。

因此抖音會率先先對用戶上傳的視頻進行統(tǒng)計,然后通過關(guān)鍵詞對視頻分類歸入內(nèi)容流量池,與此同時進行的是系統(tǒng)后臺會對用戶的行為關(guān)鍵詞進行統(tǒng)計、分類,勾畫用戶畫像,然后將用戶畫像與視頻流量池的內(nèi)容相匹配,最終給用戶分發(fā)用戶更感興趣的內(nèi)容,在這個過程中幾乎不需要用戶主動篩選。

揭秘算法推薦:統(tǒng)計、分類與分發(fā)織成信息牢籠!

02 算法推薦為何易造成信息牢籠

《老子》第五十八章言:禍兮,福之所倚;福兮,禍之所伏。前面提到,無論是被動觸發(fā)類的算法推薦還是主動觸發(fā)類的算法推薦,其主要目的就是減少用戶獲取信息的效率。

例如之前我們看長視頻,要么是按電影、電視劇、綜藝等分類找視頻看,要么就是直接搜索劇名直接觀看,反正要早一個符合自己口味的視頻很是麻煩。而在算法推薦主導的短視頻時代,一直刷一直看已經(jīng)成為常態(tài)。

但算法推薦帶來信息獲取效率提升的同時,也給我們帶入了信息牢籠中。

2017年10月10日,又是一個忙碌的周一,《華盛頓郵報》報道了一則讓美國人民無比憤怒的消息,F(xiàn)acebook在美國總統(tǒng)大選期間投放的數(shù)千個廣告影響了選舉,甚至還扒出了“通俄門”。

據(jù)報道,獲取Facebook 5000萬用戶數(shù)據(jù)的劍橋數(shù)據(jù),利用性格五力模型制作廣告,再通過Facebook的算法推薦最終實現(xiàn)了影響美國大選目的,算法推薦成為了幫兇。

一方面,算法推薦在信息傳播中占據(jù)主導地位。

公元前135年,本該在漢使面前宣揚國威的夜郎國國王,且因與漢王朝比大成為千古笑柄,而其原因不僅是因為國王深居宮內(nèi)信息閉塞,更因為周邊大臣長期推薦“夜郎天下第一”的信息讓國王深信不疑。

從知網(wǎng)《推薦系統(tǒng)》的信息可以直觀的看出,算法推薦就是夜郎國王身邊的大臣,雖然個個都是人才,說話又好聽,但其傳達的信息十分有限,且傳達的信息比較單一,例如你喜歡看搞笑視頻,算法推薦就會在10個視頻中給你推薦7個,剩下的才會拓展其他視頻,這也是為何Facebook會影響總統(tǒng)大選的原因。

揭秘算法推薦:統(tǒng)計、分類與分發(fā)織成信息牢籠!

另一方面,算法推薦在信息傳播時還具有不穩(wěn)定性。

算法推薦系統(tǒng)是由程序員設計的一套信息分發(fā)系統(tǒng),說到底還是未逃離機器分發(fā)的范疇,就以當前人工智能的發(fā)展水平來說,要想鉆算法推薦的空子還是較為容易的。

這樣一來,那些掌握了平臺算法規(guī)則的第三方投遞更多挾帶私貨,人們豈不是每天都在垃圾信息的海洋中沖浪?

畢竟,現(xiàn)在只要在搜索引擎中輸入某某平臺和算法推薦關(guān)鍵詞,就會出現(xiàn)上千萬相關(guān)信息助你鉆算法推薦的空子。

揭秘算法推薦:統(tǒng)計、分類與分發(fā)織成信息牢籠!

03 算法推薦該走向何方

一千位讀者心中就有一千位哈姆雷特,對待千人千面的算法推薦不同的人也有不同的態(tài)度,算法推薦面前,有人吃到紅利對其推崇,有人沉迷其中,還有因幸存者故事將其神化,迷信算法推薦正成為互聯(lián)網(wǎng)行業(yè)的普遍現(xiàn)象。

但前面提到,算法推薦在信息傳播過程中具有壟斷性與不穩(wěn)定性,極易對普通用戶造成信息牢籠,那么這樣一個不完美的算法推薦未來會走向何方呢?

其一,算法推薦并行化

并行與串行是數(shù)據(jù)通訊傳輸?shù)膬煞N不同方式,據(jù)大數(shù)據(jù)期刊的《信息過載的大數(shù)據(jù)時代,大數(shù)據(jù)推薦系統(tǒng)如何搭建,趨勢何方》報告顯示,傳統(tǒng)的算法推薦系統(tǒng)大多采取串行的傳輸方式,這種傳輸方式的好處是適合長距離傳輸,但單次只能傳輸一個數(shù)據(jù)單元,所以就限制了算法推薦在獲取用戶數(shù)據(jù)與反饋信息給用戶的數(shù)據(jù)量,深化了信息牢籠的可能性。

而算法推薦并行化,可以利用并行單次可傳輸多個數(shù)據(jù)單元的特征,獲取更多信息勾畫更精準的用戶畫像,同時還能反饋更多信息,以足夠的信息降低算法推薦形成信息牢籠的可能性。

揭秘算法推薦:統(tǒng)計、分類與分發(fā)織成信息牢籠!

其二,算法推薦逐步引入人文社科等新參數(shù)。

前面提到,由于機器沒有人的生物性和思想性,當前算法推薦面臨不良信息鉆空子的局面,而造成這種局面的主要原因是因為機器缺少人文情感判定標準。

因此算法推薦未來需要在推薦系統(tǒng)的神經(jīng)元里要植入“思無邪”和“己所不欲,勿施于人”的節(jié)點,協(xié)同過濾,最后將更優(yōu)質(zhì)的信息反饋給用戶。

打個比方,當用戶在某視頻網(wǎng)站上無意見看到了通過鉆空子進入流量池的“虐貓視頻”,那么沒有人文社科作為新參數(shù)的算法推薦則會在流量池中繼續(xù)挖掘虐待小動物的視頻,所以除在點擊率、內(nèi)容標簽、收藏等數(shù)學參數(shù)外,還因加入人文社科參數(shù)。

其實無論算法推薦如何發(fā)展,都只是輔助人類獲取信息的調(diào)味品,切不要迷信與神話算法推薦,我可不想30年自己成為機器的附庸。

 

本文由人人都是產(chǎn)品經(jīng)理合作媒體 @社區(qū)營銷研究院 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自 Unsplash,基于 CC0 協(xié)議。

來源公眾號:社區(qū)營銷研究院(ID:Community_Marketing),洞察社區(qū)消費

本文由 人人都是產(chǎn)品經(jīng)理合作媒體 @社區(qū)營銷研究院 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 算法永遠只是算法,人類的感情它根本算不清,人對待事物會有喜怒親疏,算法永遠只有算法

    來自云南 回復
  2. 時刻保持理智,永遠不會感情用事的,不是人類,而是機器人,人類并不需要永遠理智

    來自陜西 回復
  3. 無論算法推薦如何發(fā)展,都只是輔助人類獲取信息的調(diào)味品,切不要迷信與神話算法推薦

    來自吉林 回復