揭秘算法推薦:統(tǒng)計(jì)、分類與分發(fā)織成信息牢籠
編輯導(dǎo)語(yǔ):在信息傳播過(guò)程中,算法推薦具有壟斷性與不穩(wěn)定性,極易對(duì)普通用戶造成信息牢籠。對(duì)待千人千面的算法推薦,不同的人有不同的態(tài)度,有人歡喜,有人愁。算法推薦未來(lái)會(huì)走向何方呢?一起來(lái)看看吧!
“讓人類永遠(yuǎn)保持理智,確實(shí)是一種奢求”。《流浪地球》中MOSS直到毀滅,也沒弄明白航天員劉培強(qiáng)為什么甘愿赴死。
MOSS是人類已經(jīng)能夠制造出推動(dòng)地球航行的行星發(fā)動(dòng)機(jī),科技來(lái)到新高度下的高級(jí)人工智能,但與007這樣具有自主智慧的人工智能還相距甚遠(yuǎn),本質(zhì)上與現(xiàn)在通過(guò)數(shù)據(jù)層、算法層、應(yīng)用層給用戶帶來(lái)最優(yōu)解的算法推薦是一樣的。
01 什么是算法推薦
談及算法推薦,大部分人腦子可能閃過(guò)的第一個(gè)詞就是“今日頭條”。的確,字節(jié)跳動(dòng)旗下的今日頭條、抖音等產(chǎn)品在推薦算法的賦能下,給大眾留下了千人千面的深刻印象。
其實(shí),除字節(jié)跳動(dòng)外,阿里巴巴在天貓、淘寶,網(wǎng)易在網(wǎng)易云音樂,B站在視頻推薦流中都有廣泛使用推薦算法。可以毫不夸張的說(shuō),互聯(lián)網(wǎng)行業(yè)中只要不是用戶主動(dòng)尋找的直接信息,甚至是廣告背后都有推薦算法的身影。
1994年,美國(guó)美國(guó)明尼蘇達(dá)大學(xué)GroupLens研究組推出第一個(gè)自動(dòng)化推薦系統(tǒng) GroupLens,提出了將協(xié)同過(guò)濾作為推薦系統(tǒng)的重要技術(shù),也是最早的自動(dòng)化協(xié)同過(guò)濾推薦系統(tǒng)之一。
4年后(1998年),亞馬遜上線了基于物品的協(xié)同過(guò)濾算法,這便是算法推薦的最早商用案例,后面Facebook、Netflix,乃至中國(guó)的字節(jié)跳動(dòng)、阿里巴巴等企業(yè)都廣泛應(yīng)用了算法推薦。其實(shí)算法推薦并不復(fù)雜,總結(jié)起來(lái)就是信息的“統(tǒng)計(jì)、分類、分發(fā)”6個(gè)字。
通俗的來(lái)講,算法推薦就是APP利用大數(shù)據(jù)科學(xué)的給用戶“算命”。
首先,后端系統(tǒng)會(huì)通過(guò)應(yīng)用層的注冊(cè)信息、用戶點(diǎn)擊行為收集統(tǒng)計(jì)所有信息;然后再通過(guò)策略層的相關(guān)算法對(duì)信息進(jìn)行分類,勾畫用戶畫像;最后策略層再對(duì)平臺(tái)上的其他信息與用戶畫像相匹配,把結(jié)果在應(yīng)用層呈現(xiàn)到用戶眼中。
這個(gè)過(guò)程就好比算命,你把生辰八字告訴算命先生,然后算命先生根據(jù)生辰八字和相關(guān)法則給出你想要的答案。
數(shù)據(jù)來(lái)源:amazon按觸發(fā)條件不同,算法推薦系統(tǒng)目前大致有兩類:
- 一類是被動(dòng)觸發(fā)的,需要用戶圈定一定限制條件后,系統(tǒng)給你推薦最優(yōu)解;
- 另一類是主動(dòng)觸發(fā),你只要打開APP后系統(tǒng)就會(huì)自動(dòng)給你推薦內(nèi)容,無(wú)需用戶設(shè)置條件。
被動(dòng)觸發(fā)的算法推薦中,58同城可當(dāng)成一個(gè)經(jīng)典案例。
58同城是一個(gè)集房產(chǎn)、招聘、汽車、家政、本地服務(wù)于一體的綜合性網(wǎng)站,這就造成了用戶行為目的的不確定性,僅前面列舉的5項(xiàng)功能就有21種可能,如進(jìn)入里面的子項(xiàng)其組合可能將會(huì)成指數(shù)級(jí)增長(zhǎng),因此算法推薦對(duì)于他們而言的目的是幫助用戶更快找到合適的信息。
例如租房時(shí),58同城會(huì)根據(jù)用戶的選購(gòu)條件,例如價(jià)格、區(qū)位、戶型等在數(shù)據(jù)層做出統(tǒng)計(jì),然后策略層通過(guò)對(duì)房源特征分類,將每個(gè)特征賦予一個(gè)權(quán)重,再然后通過(guò)用戶數(shù)據(jù)與房源特征組合形成召回?cái)?shù)據(jù),最終召回?cái)?shù)據(jù)在應(yīng)用層優(yōu)先推薦權(quán)重高的召回?cái)?shù)據(jù),直至與用戶要求完全相違背。
數(shù)據(jù)來(lái)源:《58同城智能推薦系統(tǒng)的演進(jìn)與實(shí)踐》主動(dòng)觸發(fā)類的算法推薦,頭條系的抖音必須擁有姓名。
抖音與58同城的多品類、多層級(jí)的復(fù)雜信息流不同,抖音的宗旨就是讓信息找人,人就是平臺(tái)的流量池。
因此抖音會(huì)率先先對(duì)用戶上傳的視頻進(jìn)行統(tǒng)計(jì),然后通過(guò)關(guān)鍵詞對(duì)視頻分類歸入內(nèi)容流量池,與此同時(shí)進(jìn)行的是系統(tǒng)后臺(tái)會(huì)對(duì)用戶的行為關(guān)鍵詞進(jìn)行統(tǒng)計(jì)、分類,勾畫用戶畫像,然后將用戶畫像與視頻流量池的內(nèi)容相匹配,最終給用戶分發(fā)用戶更感興趣的內(nèi)容,在這個(gè)過(guò)程中幾乎不需要用戶主動(dòng)篩選。
02 算法推薦為何易造成信息牢籠
《老子》第五十八章言:禍兮,福之所倚;福兮,禍之所伏。前面提到,無(wú)論是被動(dòng)觸發(fā)類的算法推薦還是主動(dòng)觸發(fā)類的算法推薦,其主要目的就是減少用戶獲取信息的效率。
例如之前我們看長(zhǎng)視頻,要么是按電影、電視劇、綜藝等分類找視頻看,要么就是直接搜索劇名直接觀看,反正要早一個(gè)符合自己口味的視頻很是麻煩。而在算法推薦主導(dǎo)的短視頻時(shí)代,一直刷一直看已經(jīng)成為常態(tài)。
但算法推薦帶來(lái)信息獲取效率提升的同時(shí),也給我們帶入了信息牢籠中。
2017年10月10日,又是一個(gè)忙碌的周一,《華盛頓郵報(bào)》報(bào)道了一則讓美國(guó)人民無(wú)比憤怒的消息,F(xiàn)acebook在美國(guó)總統(tǒng)大選期間投放的數(shù)千個(gè)廣告影響了選舉,甚至還扒出了“通俄門”。
據(jù)報(bào)道,獲取Facebook 5000萬(wàn)用戶數(shù)據(jù)的劍橋數(shù)據(jù),利用性格五力模型制作廣告,再通過(guò)Facebook的算法推薦最終實(shí)現(xiàn)了影響美國(guó)大選目的,算法推薦成為了幫兇。
一方面,算法推薦在信息傳播中占據(jù)主導(dǎo)地位。
公元前135年,本該在漢使面前宣揚(yáng)國(guó)威的夜郎國(guó)國(guó)王,且因與漢王朝比大成為千古笑柄,而其原因不僅是因?yàn)閲?guó)王深居宮內(nèi)信息閉塞,更因?yàn)橹苓叴蟪奸L(zhǎng)期推薦“夜郎天下第一”的信息讓國(guó)王深信不疑。
從知網(wǎng)《推薦系統(tǒng)》的信息可以直觀的看出,算法推薦就是夜郎國(guó)王身邊的大臣,雖然個(gè)個(gè)都是人才,說(shuō)話又好聽,但其傳達(dá)的信息十分有限,且傳達(dá)的信息比較單一,例如你喜歡看搞笑視頻,算法推薦就會(huì)在10個(gè)視頻中給你推薦7個(gè),剩下的才會(huì)拓展其他視頻,這也是為何Facebook會(huì)影響總統(tǒng)大選的原因。
另一方面,算法推薦在信息傳播時(shí)還具有不穩(wěn)定性。
算法推薦系統(tǒng)是由程序員設(shè)計(jì)的一套信息分發(fā)系統(tǒng),說(shuō)到底還是未逃離機(jī)器分發(fā)的范疇,就以當(dāng)前人工智能的發(fā)展水平來(lái)說(shuō),要想鉆算法推薦的空子還是較為容易的。
這樣一來(lái),那些掌握了平臺(tái)算法規(guī)則的第三方投遞更多挾帶私貨,人們豈不是每天都在垃圾信息的海洋中沖浪?
畢竟,現(xiàn)在只要在搜索引擎中輸入某某平臺(tái)和算法推薦關(guān)鍵詞,就會(huì)出現(xiàn)上千萬(wàn)相關(guān)信息助你鉆算法推薦的空子。
03 算法推薦該走向何方
一千位讀者心中就有一千位哈姆雷特,對(duì)待千人千面的算法推薦不同的人也有不同的態(tài)度,算法推薦面前,有人吃到紅利對(duì)其推崇,有人沉迷其中,還有因幸存者故事將其神化,迷信算法推薦正成為互聯(lián)網(wǎng)行業(yè)的普遍現(xiàn)象。
但前面提到,算法推薦在信息傳播過(guò)程中具有壟斷性與不穩(wěn)定性,極易對(duì)普通用戶造成信息牢籠,那么這樣一個(gè)不完美的算法推薦未來(lái)會(huì)走向何方呢?
其一,算法推薦并行化
并行與串行是數(shù)據(jù)通訊傳輸?shù)膬煞N不同方式,據(jù)大數(shù)據(jù)期刊的《信息過(guò)載的大數(shù)據(jù)時(shí)代,大數(shù)據(jù)推薦系統(tǒng)如何搭建,趨勢(shì)何方》報(bào)告顯示,傳統(tǒng)的算法推薦系統(tǒng)大多采取串行的傳輸方式,這種傳輸方式的好處是適合長(zhǎng)距離傳輸,但單次只能傳輸一個(gè)數(shù)據(jù)單元,所以就限制了算法推薦在獲取用戶數(shù)據(jù)與反饋信息給用戶的數(shù)據(jù)量,深化了信息牢籠的可能性。
而算法推薦并行化,可以利用并行單次可傳輸多個(gè)數(shù)據(jù)單元的特征,獲取更多信息勾畫更精準(zhǔn)的用戶畫像,同時(shí)還能反饋更多信息,以足夠的信息降低算法推薦形成信息牢籠的可能性。
其二,算法推薦逐步引入人文社科等新參數(shù)。
前面提到,由于機(jī)器沒有人的生物性和思想性,當(dāng)前算法推薦面臨不良信息鉆空子的局面,而造成這種局面的主要原因是因?yàn)闄C(jī)器缺少人文情感判定標(biāo)準(zhǔn)。
因此算法推薦未來(lái)需要在推薦系統(tǒng)的神經(jīng)元里要植入“思無(wú)邪”和“己所不欲,勿施于人”的節(jié)點(diǎn),協(xié)同過(guò)濾,最后將更優(yōu)質(zhì)的信息反饋給用戶。
打個(gè)比方,當(dāng)用戶在某視頻網(wǎng)站上無(wú)意見看到了通過(guò)鉆空子進(jìn)入流量池的“虐貓視頻”,那么沒有人文社科作為新參數(shù)的算法推薦則會(huì)在流量池中繼續(xù)挖掘虐待小動(dòng)物的視頻,所以除在點(diǎn)擊率、內(nèi)容標(biāo)簽、收藏等數(shù)學(xué)參數(shù)外,還因加入人文社科參數(shù)。
其實(shí)無(wú)論算法推薦如何發(fā)展,都只是輔助人類獲取信息的調(diào)味品,切不要迷信與神話算法推薦,我可不想30年自己成為機(jī)器的附庸。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @社區(qū)營(yíng)銷研究院 授權(quán)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Unsplash,基于 CC0 協(xié)議。
來(lái)源公眾號(hào):社區(qū)營(yíng)銷研究院(ID:Community_Marketing),洞察社區(qū)消費(fèi)
本文由 人人都是產(chǎn)品經(jīng)理合作媒體 @社區(qū)營(yíng)銷研究院 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
算法永遠(yuǎn)只是算法,人類的感情它根本算不清,人對(duì)待事物會(huì)有喜怒親疏,算法永遠(yuǎn)只有算法
時(shí)刻保持理智,永遠(yuǎn)不會(huì)感情用事的,不是人類,而是機(jī)器人,人類并不需要永遠(yuǎn)理智
無(wú)論算法推薦如何發(fā)展,都只是輔助人類獲取信息的調(diào)味品,切不要迷信與神話算法推薦