沒(méi)了新鮮感之后,社交網(wǎng)絡(luò)如何維系用戶(hù)長(zhǎng)期活躍?
本文主要圍繞“社交網(wǎng)絡(luò)如何從小長(zhǎng)大,如何維持網(wǎng)絡(luò)上用戶(hù)的長(zhǎng)期活躍”這些話(huà)題,從仿真建模的角度,對(duì)網(wǎng)絡(luò)的增長(zhǎng)和節(jié)點(diǎn)活躍狀態(tài)聯(lián)動(dòng)的建模過(guò)程做了一個(gè)介紹,并進(jìn)行了一個(gè)階段性的探索。
微信在社交領(lǐng)域無(wú)論從覆蓋度、用戶(hù)粘性、口碑、創(chuàng)新上都占據(jù)了高點(diǎn)。但是社交戰(zhàn)場(chǎng)始終沒(méi)有人打算放棄,才有了試圖從短視頻切入社交的抖音、主打?qū)崟r(shí)語(yǔ)音輸入體驗(yàn)的子彈短信,這些社交領(lǐng)域的挑戰(zhàn)者們依然有機(jī)會(huì)創(chuàng)造了一個(gè)個(gè)新的爆點(diǎn)。
建立社交王國(guó)不僅僅是打磨一個(gè)新的APP,事實(shí)上,影響一個(gè)社交網(wǎng)絡(luò)由小變大乃至保持活躍的內(nèi)部因素非常之多,每個(gè)不起眼的因素都可能對(duì)社交網(wǎng)絡(luò)中的局部乃至整體帶來(lái)潛移默化、甚至突發(fā)強(qiáng)烈的作用;更不用提難以捉摸的外部環(huán)境影響。
在這篇文章里,本期騰研識(shí)者試圖將社交網(wǎng)絡(luò)從紛繁復(fù)雜的具體場(chǎng)景、細(xì)節(jié)條件中剝離出來(lái),單單從個(gè)體間連接的類(lèi)型這一角度,對(duì)維持整個(gè)社交網(wǎng)絡(luò)的長(zhǎng)期活躍給出了他的回答。雖然脫離了真實(shí)世界的研究有些抽象,但作者相信這些抽象模型的背后可能蘊(yùn)含著人們可以理解的虛擬世界里的運(yùn)行法則。
正如作者所言:“拋磚引玉,與諸君共勉?!?/p>
文章要點(diǎn):
- 如何抽象刻畫(huà)一個(gè)社交網(wǎng)絡(luò)?
- 社交網(wǎng)絡(luò)怎樣從小到大?
- 網(wǎng)絡(luò)上個(gè)體狀態(tài)的連鎖反應(yīng)(級(jí)聯(lián)反應(yīng))
- 增長(zhǎng)中的網(wǎng)絡(luò)伴隨用戶(hù)行為狀態(tài)的級(jí)聯(lián)反應(yīng),帶來(lái)可預(yù)見(jiàn)的多樣開(kāi)局
引言
去日本奈良旅游,不得不提的是“東大寺”。千百年來(lái),東大寺經(jīng)歷了無(wú)數(shù)的腥風(fēng)血雨,曾多次在戰(zhàn)火或天災(zāi)中遭受重創(chuàng),卻每每在數(shù)百年中又得到重大翻修重整,因而屹立至今,成為既存在于史書(shū)中又存在現(xiàn)實(shí)中的文化遺產(chǎn)之一,可以讓今人設(shè)身處地的一睹千年前古人的勞動(dòng)和智慧。
值得一提的是,在日本各地建立國(guó)分寺和國(guó)分尼寺的做法,被認(rèn)為是效仿中國(guó)隋唐時(shí)代在各地興建的國(guó)立寺院。例如武則天時(shí)期著名的大云寺,以為國(guó)祈福。而在武則天時(shí)期曾經(jīng)遍布全國(guó)的大云寺,因?yàn)闄?quán)力交接、天災(zāi)人禍,遭受了近乎全面的毀滅……
圖1 日本東大寺
歷史上耗時(shí)數(shù)十年、數(shù)代人參與的大型工程還很多,例如埃及金字塔、中國(guó)的萬(wàn)里長(zhǎng)城、鐵路修建、電力鋪設(shè)等等。而小到一個(gè)家族的興衰,大到一個(gè)大型的企業(yè)組織、一個(gè)城市、一個(gè)王朝的變遷,亦蘊(yùn)含著一些人群匯聚的獨(dú)特魅力。
是什么樣的魔力將原本獨(dú)立自由的個(gè)體匯集起來(lái),形成一個(gè)個(gè)的小組、團(tuán)隊(duì)直至大型的組織?匯聚而成的團(tuán)體,又將如何進(jìn)一步經(jīng)營(yíng)壯大,尋求在團(tuán)隊(duì)凝聚力、成員活躍度、協(xié)同作戰(zhàn)能力等方面尋求突破?
社團(tuán)、群體的延續(xù)性、可持續(xù)性的問(wèn)題,本身既抽象又開(kāi)放,在時(shí)間和空間的長(zhǎng)河中普遍存在,也許根本不存在完美的解答。
在這篇文章里,我們?cè)噲D將社交關(guān)系構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu)從紛繁復(fù)雜的具體場(chǎng)景、細(xì)節(jié)條件中剝離出來(lái),單單從個(gè)體間連接的類(lèi)型這一角度,對(duì)整個(gè)網(wǎng)絡(luò)的持久活躍能力給出了一個(gè)回答——即便對(duì)于同樣的一群個(gè)體,具有明確的個(gè)體屬性(例如,個(gè)體的流行度popularity,可理解為個(gè)體成為大V用戶(hù)的內(nèi)因,潛力值)和個(gè)體間的相似性(例如興趣愛(ài)好、觀(guān)點(diǎn)論調(diào)、行為習(xí)慣,個(gè)體信息上的同質(zhì)程度,如:喜歡同一個(gè)話(huà)題、同一個(gè)東西、同一個(gè)人、生活環(huán)境類(lèi)似、地理位置類(lèi)似等等),并且他們具有一樣的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),由于連接類(lèi)型上的屬性差異,由這群個(gè)體形成的社交圈子也可能在維持用戶(hù)活躍度上具有截然不同的能力。并且,以個(gè)體間的相似度為基礎(chǔ),適當(dāng)偏向高流行度個(gè)體的網(wǎng)絡(luò)增長(zhǎng)的方式,可以讓網(wǎng)絡(luò)達(dá)到極高的持久活躍能力。
(注:在這里,我們假定用戶(hù)的吸引力主要來(lái)自于兩個(gè)方面,一個(gè)是用戶(hù)本身的流行度,成為大V的潛質(zhì);一個(gè)是用戶(hù)和其他用戶(hù)之間的相似度,二者的共同作用,決定了用戶(hù)之間連接關(guān)系的形成。實(shí)際上,流行度也可以不局限在個(gè)人的層面,也可以是一個(gè)社會(huì)熱點(diǎn)問(wèn)題、一條熱點(diǎn)新聞、一個(gè)爆款視頻、一篇10萬(wàn)+的文章、一個(gè)營(yíng)銷(xiāo)策劃的方案,這些都是個(gè)體內(nèi)在的流行度帶來(lái)的顯性的外在結(jié)果。)
這一回應(yīng)距離“正確答案”、“標(biāo)準(zhǔn)答案”可能謬以千里,但不妨作為一塊上好的磚塊拋出,希望可以吸引、甚至激發(fā)大片美玉的出現(xiàn)。
問(wèn)題の抽象
影響一個(gè)社交群體活躍程度的內(nèi)部因素非常之多,每個(gè)不起眼的因素都可能對(duì)社交網(wǎng)絡(luò)中的局部乃至整體帶來(lái)潛移默化、甚至突發(fā)強(qiáng)烈的作用;更不用提難以捉摸的外部環(huán)境影響。于是,本文嘗試將這個(gè)問(wèn)題向某個(gè)方面逐漸化簡(jiǎn)、抽象。
圖2 運(yùn)營(yíng)用戶(hù)生命周期的示意圖
拋開(kāi)外部環(huán)境的影響,也拋開(kāi)具體場(chǎng)景細(xì)節(jié)的考量,一個(gè)長(zhǎng)遠(yuǎn)運(yùn)營(yíng)的社區(qū)可能會(huì)經(jīng)歷以下的周期:從吸引不同個(gè)體加入進(jìn)來(lái),到用戶(hù)對(duì)社區(qū)的熟悉、活躍、沉淀,到用戶(hù)穩(wěn)定留存下來(lái),再到用戶(hù)對(duì)社區(qū)逐漸失去興趣,再到用戶(hù)淡出社區(qū)。
社交網(wǎng)絡(luò)用戶(hù)活躍的問(wèn)題可以被抽象提煉成一個(gè)純粹由節(jié)點(diǎn)(node)和邊(edge)構(gòu)成的社交關(guān)系圖上的問(wèn)題。進(jìn)一步的,社交關(guān)系中節(jié)點(diǎn)與連邊的數(shù)目和狀態(tài)一直處于一種動(dòng)態(tài)變化中;社交網(wǎng)絡(luò)整體活躍程度的問(wèn)題也轉(zhuǎn)化成——如何讓網(wǎng)絡(luò)中的大量節(jié)點(diǎn)維持更長(zhǎng)期的活躍?這一問(wèn)題對(duì)復(fù)雜網(wǎng)絡(luò)的理論研究以及社交群體實(shí)際的運(yùn)營(yíng)而言,無(wú)疑是一件有趣且有意義的事。
問(wèn)題的進(jìn)一步思考:
當(dāng)我們將這個(gè)問(wèn)題抽象化簡(jiǎn)之后,那么一連串的問(wèn)題又雙叒叕來(lái)了:
- 人們的社交關(guān)系如何抽象刻畫(huà)?
- 節(jié)點(diǎn)的活躍狀態(tài)如何刻畫(huà)?
- 連邊的形成、斷開(kāi)、重連等如何刻畫(huà)?
- 這個(gè)社交網(wǎng)絡(luò)上面各種狀態(tài)的變化如何刻畫(huà)?
- ……
還有最要命的,如此抽象化了的模型已經(jīng)跟現(xiàn)實(shí)世界半毛錢(qián)關(guān)系都沒(méi)有了,那這個(gè)抽象模型的存在還有什么意義呢?在簡(jiǎn)化抽象結(jié)果上得出來(lái)的結(jié)論,可能對(duì)現(xiàn)實(shí)世界而言然并卵。
是的,這么講沒(méi)毛病。就像在電子游戲里地球上存在過(guò)的某個(gè)生命體,對(duì)于現(xiàn)實(shí)世界里地球上幾十億年的演化而言,好像也沒(méi)什么卵用。不過(guò)至少,在抽象后虛擬的時(shí)空里,這些抽象模型里可能蘊(yùn)含著這個(gè)虛擬世界里的運(yùn)行法則。而這些虛擬的時(shí)空,可以看做高維的現(xiàn)實(shí)在某種低維時(shí)空下的一個(gè)投影。
注:關(guān)于社交網(wǎng)絡(luò)生成過(guò)程的模型抽象,本身非常有趣也很神奇,不過(guò)這并不是本文想要探討的重點(diǎn)。有額外興趣的朋友可以移步騰訊研究院之前的發(fā)文《社交網(wǎng)絡(luò)中的冪律分布:為什么有的人微信好友5000而你只有500?》。那篇文章沒(méi)有提供一個(gè)完美解答,但可以讓你有更進(jìn)一步的了解。
先前學(xué)界的工作通常在預(yù)先生成或給定的網(wǎng)絡(luò)結(jié)構(gòu)上考慮個(gè)體的持久活躍問(wèn)題;然而,社交網(wǎng)絡(luò)的發(fā)展,是網(wǎng)絡(luò)在增長(zhǎng)的同時(shí)伴隨著已加入個(gè)體的活躍狀態(tài)的級(jí)聯(lián)反應(yīng)(cascading effect,可以理解為連鎖反應(yīng),連帶作用)。
↓插個(gè)圖,靈魂畫(huà)手作品↓
(看不懂沒(méi)關(guān)系,我又用電腦重新畫(huà)了一張)
圖3
- (a) 網(wǎng)絡(luò)中節(jié)點(diǎn)由少變多、連邊也由少變多,可以有微量的邊減少之類(lèi)的;
- (b) 一個(gè)社交群體因?yàn)閭€(gè)別節(jié)點(diǎn)的不活躍而死寂。
真實(shí)的社交網(wǎng)絡(luò)具備一些特征,每個(gè)特征都可能影響到個(gè)體的活躍度。接下來(lái),我們就對(duì)網(wǎng)絡(luò)增長(zhǎng)的過(guò)程(多樣的網(wǎng)絡(luò)增長(zhǎng)模式),節(jié)點(diǎn)活躍狀態(tài)改變的過(guò)程(社交網(wǎng)絡(luò)中個(gè)體的活躍狀態(tài)也具有級(jí)聯(lián)反應(yīng))還有二者的協(xié)同(社交網(wǎng)絡(luò)的增長(zhǎng)+節(jié)點(diǎn)活躍狀態(tài)的聯(lián)動(dòng) → 一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)與節(jié)點(diǎn)狀態(tài)協(xié)同演化的過(guò)程),做一個(gè)簡(jiǎn)單介紹。
多樣的網(wǎng)絡(luò)增長(zhǎng)模式
社交網(wǎng)絡(luò)怎樣由小長(zhǎng)大?它們的增長(zhǎng)模式是復(fù)雜多變的。
例如早期新浪微博的策略是綁大V,邀請(qǐng)各路明星名人加入微博,然后這些名人帶動(dòng)粉絲加入,這是一種個(gè)體流行度優(yōu)先(popularity-first)的增長(zhǎng)模式。還有一些網(wǎng)上的興趣社區(qū),是用戶(hù)根據(jù)興趣愛(ài)好聯(lián)系起來(lái),這類(lèi)網(wǎng)絡(luò)的增長(zhǎng)模式是個(gè)體間相似度優(yōu)先(similarity-first)。
此外,人人網(wǎng)或稱(chēng)校內(nèi)網(wǎng)抓住的是高三畢業(yè)大一新生的需求,學(xué)生需要跟高中同學(xué)保持聯(lián)系,同時(shí)在大學(xué)結(jié)交新朋友,還有用戶(hù)是想看同年級(jí)中的美女帥哥、學(xué)霸、社交達(dá)人等,這里糅合了同學(xué)關(guān)系、熟人關(guān)系、線(xiàn)下朋友關(guān)系等等多重關(guān)系的作用;與之類(lèi)似,微信也是糅合了QQ好友、通訊錄好友等線(xiàn)上好友、線(xiàn)下熟人等等關(guān)系的作用。
還有一些不太成功的社交網(wǎng)站,沒(méi)有明確的增長(zhǎng)方式,可看做是自由生長(zhǎng)、放養(yǎng)型的維護(hù)方式,也可以理解成一種沒(méi)有人為干預(yù)的自組織的增長(zhǎng)方式。
正如上文中提到的,對(duì)于個(gè)體間的社交吸引力,雖然我們提煉出了個(gè)體的流行度(popularity)、個(gè)體間的相似度(similarity)這樣簡(jiǎn)單純粹的元素,但是對(duì)于其他一些復(fù)雜的線(xiàn)下關(guān)系、熟人關(guān)系、通訊錄關(guān)系,在本文中并沒(méi)有提煉出一些明確的、可以刻畫(huà)的屬性。而且,即便是流行度、相似度在不同的具體場(chǎng)景下,也存在不同性質(zhì)、不同維度的具體體現(xiàn)。
個(gè)體本身的屬性差異,以及個(gè)體之間鏈接類(lèi)型的差異使得即便是相同的網(wǎng)絡(luò)結(jié)構(gòu)、相同的一群個(gè)體,在不同的網(wǎng)絡(luò)增長(zhǎng)模式下,依然可能帶來(lái)不同的網(wǎng)絡(luò)持久性。
社交網(wǎng)絡(luò)中個(gè)體的活躍狀態(tài),也具有級(jí)聯(lián)反應(yīng)
在高壓電網(wǎng)中級(jí)聯(lián)失效(cascading failure)、連鎖反應(yīng)是一個(gè)常見(jiàn)的事故,當(dāng)電力系統(tǒng)滿(mǎn)載或者輕微過(guò)載時(shí),某個(gè)節(jié)點(diǎn)的錯(cuò)誤有可能導(dǎo)致大范圍電力系統(tǒng)的癱瘓,一夜回到解放前。這一現(xiàn)象至今非常普遍,06年歐洲大斷電和12年印度大斷電波及幾百萬(wàn)、幾億人口的生活。
又如,在生態(tài)系統(tǒng)中,食物網(wǎng)的持久性體現(xiàn)在初始物種在受到干擾之后存活下來(lái)的比例。一個(gè)營(yíng)養(yǎng)學(xué)物種的消亡有可能威脅食物網(wǎng)的平衡;更別提各國(guó)政府不約而同聞之色變的物種入侵問(wèn)題。
類(lèi)似的,在社交網(wǎng)絡(luò)中,維持個(gè)體的活躍度是促進(jìn)整個(gè)社區(qū)穩(wěn)定、發(fā)展、繁榮的關(guān)鍵一步。一些關(guān)鍵人物的狀態(tài)改變,也可能導(dǎo)致整個(gè)社交圈子的性質(zhì)發(fā)生變化,例如:小到一個(gè)家庭里某個(gè)家人的健康與疾患,大到公司、國(guó)家領(lǐng)導(dǎo)人的交接。
這些來(lái)自不同領(lǐng)域的高壓電網(wǎng)、食物網(wǎng)、社交網(wǎng)絡(luò),在網(wǎng)絡(luò)結(jié)構(gòu)上形成的“連鎖反應(yīng)”、“級(jí)聯(lián)效應(yīng)”,都可以抽象成一個(gè)幾何圖形上的結(jié)構(gòu)和狀態(tài)變化。在圖論中,k-core 與 k-core 分解的概念就被用來(lái)理解網(wǎng)絡(luò)結(jié)構(gòu)對(duì)級(jí)聯(lián)反應(yīng)的作用。
什么是core的概念?一個(gè)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中,節(jié)點(diǎn)的重要性是可以排序、打分的。按照不同的指標(biāo)、不同的角度,都可以給出一套給節(jié)點(diǎn)打分排序的方法。Core的概念認(rèn)為一些節(jié)點(diǎn)在構(gòu)成該網(wǎng)絡(luò)結(jié)構(gòu)時(shí)位于更高的“內(nèi)核之中”,具有更高的core值;越是處于核心的節(jié)點(diǎn),對(duì)于網(wǎng)絡(luò)結(jié)構(gòu)的穩(wěn)定、網(wǎng)絡(luò)上的傳播等等,可能比其他節(jié)點(diǎn)扮演更加重要的角色。
這里需注意的是,節(jié)點(diǎn)的“重要性”可以體現(xiàn)在很多層面上。例如:節(jié)點(diǎn)的度數(shù)可以衡量節(jié)點(diǎn)的潛在影響力、可觸達(dá)的用戶(hù)數(shù)量,是最為常用的衡量指標(biāo)之一。擁有大量粉絲的大V用戶(hù)被認(rèn)為具有更大的影響力和號(hào)召力。在營(yíng)銷(xiāo)學(xué)中,使用KOL(關(guān)鍵意見(jiàn)領(lǐng)袖Key Opinion Leader)的概念來(lái)分析諸如節(jié)點(diǎn)度數(shù)、core值等等不同指標(biāo)下,衡量節(jié)點(diǎn)對(duì)營(yíng)銷(xiāo)內(nèi)容的傳播和擴(kuò)散起到的作用。
當(dāng)然,節(jié)點(diǎn)/連邊的重要性還可以體現(xiàn)在關(guān)鍵的節(jié)點(diǎn)或者關(guān)鍵的邊對(duì)于維持網(wǎng)絡(luò)局部結(jié)構(gòu)的穩(wěn)定程度所起的作用等等其他方面上,并不局限于KOL和營(yíng)銷(xiāo)問(wèn)題。
這里舉一個(gè)實(shí)例:如下圖,如果我們稱(chēng)一個(gè)子圖(一個(gè)網(wǎng)絡(luò)圖的一部分稱(chēng)為子圖)是3-core或者3-degeneracy,那么圖中每個(gè)節(jié)點(diǎn)最少具有3個(gè)鄰居是屬于3-core 或更高層的core。
圖4? 一個(gè)典型的 k-core 分解示意圖
對(duì) k=3,3-core 這一層而言,每個(gè)節(jié)點(diǎn)至少有 3 個(gè)鄰居也屬于 3-core(或者更高層的 core)。K=1,2時(shí)也類(lèi)似。計(jì)算core值時(shí),從0-core, 1-core開(kāi)始,像剝洋蔥一樣,一層一層將網(wǎng)絡(luò)剝離成幾個(gè)互不重疊的core層。
對(duì)3-core的計(jì)算過(guò)程依賴(lài)于先要獲得0-core,1-core,2-core對(duì)應(yīng)的節(jié)點(diǎn),像剝洋蔥一樣,一層一層的撥開(kāi)。0-core就是孤立的節(jié)點(diǎn)。1-core要求節(jié)點(diǎn)最少與1個(gè)不低于1-core的鄰居相連,由此得到core值為1的節(jié)點(diǎn)集合,并將這些節(jié)點(diǎn)從原圖中剝離開(kāi)。
此時(shí),原先度數(shù)為2的一些節(jié)點(diǎn),也可能度數(shù)降為1了(因?yàn)猷従颖粍冸x出去),這些節(jié)點(diǎn)也屬于1-core,并被繼續(xù)剝離。直到所有滿(mǎn)足1-core條件的節(jié)點(diǎn)都被剝離殆盡,網(wǎng)絡(luò)中只剩下高于1-core值的節(jié)點(diǎn)群體時(shí),第一層的分解才算完成。由此,進(jìn)入2-core分解的階段,以此類(lèi)推。
K-core 可以幫助人們理解圖的稀疏程度、連接密度等[1];此外,core值越高的節(jié)點(diǎn),在純粹的拓?fù)浣Y(jié)構(gòu)上具有更加重要的連接地位。
K-core是建立在靜態(tài)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)上的一種結(jié)構(gòu)指標(biāo)。不過(guò),k-core本身對(duì)于網(wǎng)絡(luò)上節(jié)點(diǎn)動(dòng)態(tài)傳播能力也具有一定的衡量?jī)r(jià)值。在這里,受到k-core定義的啟發(fā),我們也可以引申出一個(gè)活躍鄰居閾值的概念:當(dāng)節(jié)點(diǎn)具有不少于c個(gè)活躍鄰居時(shí),節(jié)點(diǎn)可以繼續(xù)保持活躍。
這里需要說(shuō)明的是,對(duì)每個(gè)人來(lái)說(shuō),這個(gè)閾值很可能存在,但不一定是同一個(gè)。而且,很可能還跟軟件應(yīng)用本身的設(shè)計(jì),或者非泛泛的鄰居有關(guān)。
社交網(wǎng)絡(luò)的增長(zhǎng)+節(jié)點(diǎn)活躍狀態(tài)的聯(lián)動(dòng) →?一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)與節(jié)點(diǎn)狀態(tài)協(xié)同演化的過(guò)程
社交網(wǎng)絡(luò)的增長(zhǎng)大趨勢(shì),伴隨著個(gè)體活躍狀態(tài)的級(jí)聯(lián),這兩個(gè)過(guò)程是協(xié)同發(fā)生的,不是相互孤立的。這一協(xié)同過(guò)程對(duì)網(wǎng)絡(luò)持久活躍的影響,還缺乏探討。
不同的社交網(wǎng)站具備不同的增長(zhǎng)模式,這些多樣的增長(zhǎng)模式到底對(duì)網(wǎng)絡(luò)中個(gè)體的持久活躍意味著什么?這個(gè)問(wèn)題更深一層的是:不同的社交關(guān)系,不同的鏈接類(lèi)型對(duì)網(wǎng)絡(luò)持久性有什么樣的影響?
考慮到通過(guò)獲取各類(lèi)社交網(wǎng)站長(zhǎng)期的真實(shí)數(shù)據(jù)來(lái)促成這項(xiàng)研究有較大的實(shí)施難度。我們選擇從網(wǎng)絡(luò)建模仿真的角度來(lái)探討這個(gè)問(wèn)題,對(duì)前文提到的社交網(wǎng)絡(luò)的增長(zhǎng)過(guò)程與節(jié)點(diǎn)活躍狀態(tài)的變化聯(lián)動(dòng),分別建模并結(jié)合起來(lái)。這個(gè)工作建立在 Papadopoulos 的網(wǎng)絡(luò)增長(zhǎng)模型和受k-core啟發(fā)的節(jié)點(diǎn)狀態(tài)級(jí)聯(lián)模型基礎(chǔ)上。
Papadopoulos 的工作提供了一個(gè)迄今最為強(qiáng)大的網(wǎng)絡(luò)增長(zhǎng)模型[2]。先前網(wǎng)絡(luò)的增長(zhǎng)模型是以節(jié)點(diǎn)的流行度為核心,高流行度的節(jié)點(diǎn)更容易具備較高的連接度數(shù)(更廣的人脈),而高度數(shù)的節(jié)點(diǎn)有更大概率優(yōu)先與新加入的節(jié)點(diǎn)鏈接。
Papadopoulos 認(rèn)為,節(jié)點(diǎn)之間的相似度也是吸引其他節(jié)點(diǎn)與之相連的因素。他們的模型將多種真實(shí)世界中的網(wǎng)絡(luò)(技術(shù)網(wǎng)絡(luò)、生物網(wǎng)絡(luò)和社交網(wǎng)絡(luò))映射到由節(jié)點(diǎn)的流行度和相似度構(gòu)成的極坐標(biāo)中,并引入流行度和相似度所在雙曲空間中的雙曲距離作為優(yōu)先鏈接的評(píng)判標(biāo)準(zhǔn)。
這項(xiàng)工作的意義是,這個(gè)改進(jìn)的優(yōu)先鏈接模型,不但可以復(fù)現(xiàn)先前優(yōu)先鏈接模型實(shí)現(xiàn)的節(jié)點(diǎn)度數(shù)在統(tǒng)計(jì)學(xué)上的冪律分布(類(lèi)似于經(jīng)濟(jì)學(xué)里的馬太效應(yīng),度數(shù)高節(jié)點(diǎn)度數(shù)越來(lái)越高,度數(shù)低的節(jié)點(diǎn)度數(shù)很低而且數(shù)量眾多);而且,由該模型生成的網(wǎng)絡(luò)可以很好的模擬多種真實(shí)世界的網(wǎng)絡(luò)在雙曲距離上的鏈接概率。
注:讀者如對(duì)Papadopoulos模型的深入理解感興趣,可點(diǎn)擊閱讀原文參閱公眾號(hào)文章《從社交網(wǎng)絡(luò)到量子糾纏:我們?nèi)绾卫斫饪臻g?》
不過(guò),Papadopoulos 的工作只考慮了網(wǎng)絡(luò)的增長(zhǎng),不涉及節(jié)點(diǎn)狀態(tài)動(dòng)態(tài)改變的這些問(wèn)題;此外,在其模型中,節(jié)點(diǎn)的流行度與節(jié)點(diǎn)加入網(wǎng)絡(luò)的時(shí)間是綁定的,這與真實(shí)世界中多樣的網(wǎng)絡(luò)增長(zhǎng)模式不符。
我們提出基于節(jié)點(diǎn)的流行度優(yōu)先(popularity-first)、相似度優(yōu)先(similarity-first)和隨機(jī)加入(random)三種社交網(wǎng)絡(luò)的增長(zhǎng)模式,解綁了節(jié)點(diǎn)的流行度和加入時(shí)間,同時(shí)保留了基于雙曲距離的優(yōu)先鏈接機(jī)制[3]。然后,我們?cè)谠鲩L(zhǎng)網(wǎng)絡(luò)基礎(chǔ)上引入了級(jí)聯(lián)過(guò)程,可以描述網(wǎng)絡(luò)增長(zhǎng)與節(jié)點(diǎn)狀態(tài)級(jí)聯(lián)的協(xié)同演化。
這里需說(shuō)明的是,我們這里提出的隨機(jī)增長(zhǎng)是空白試驗(yàn),完全不考慮節(jié)點(diǎn)的相關(guān)性,就隨機(jī)的加入網(wǎng)絡(luò);這跟真實(shí)世界中一些自由增長(zhǎng)的網(wǎng)絡(luò)還是有點(diǎn)區(qū)別的。
圖5
三種不同增長(zhǎng)模式下社交網(wǎng)絡(luò)演化過(guò)程示意。在極坐標(biāo)系下,每個(gè)節(jié)點(diǎn)具有兩個(gè)屬性,極徑r和極角θ。極徑可看做節(jié)點(diǎn)的流行度的大小,極徑越小,流行度越高;而兩個(gè)節(jié)點(diǎn)的夾角代表它們的相似度。
流行度優(yōu)先就是節(jié)點(diǎn)按照極徑由小到大加入網(wǎng)絡(luò);相似度優(yōu)先就是按照夾角的大?。ɡ鐝?度開(kāi)始),由小到大加入網(wǎng)絡(luò);隨機(jī)模式則是充分隨意的加入節(jié)點(diǎn)。節(jié)點(diǎn)是否鏈接由雙曲距離的大小等參數(shù)決定,節(jié)點(diǎn)再經(jīng)過(guò)自發(fā)活躍度之后,由活躍鄰居閾值決定是否繼續(xù)活躍。
在考慮節(jié)點(diǎn)活躍狀態(tài)的變化時(shí)??紤]到當(dāng)新用戶(hù)加入網(wǎng)絡(luò)時(shí),本身會(huì)具有一個(gè)自發(fā)活躍(spontaneous activity)的時(shí)期,這時(shí)個(gè)體對(duì)網(wǎng)絡(luò)充滿(mǎn)新鮮感,它的活躍主要依靠自身的好奇心和探索的需求驅(qū)動(dòng),不受其他用戶(hù)的影響。當(dāng)新鮮感過(guò)了之后,如果個(gè)體還有一定的活躍鄰居,那個(gè)體還可以繼續(xù)保持活躍,否則就會(huì)變成不活躍。
這個(gè)活躍鄰居閾值(active neighbour threshold)可以追溯到上文提到的k-core。如果每個(gè)節(jié)點(diǎn)要具有3個(gè)活躍鄰居才能保持活躍,那最終這些活躍節(jié)點(diǎn)構(gòu)成的圖可以看做是動(dòng)態(tài)網(wǎng)絡(luò)下的3-core 退化圖。這里早期“新鮮感自驅(qū)動(dòng)”和后期靠“活躍鄰居維持”的考慮,從廣義上講對(duì)應(yīng)社會(huì)心理學(xué)家常提到的“探索”與“習(xí)慣”。
圖5是仿真模型基于三種網(wǎng)絡(luò)增長(zhǎng)模式的演化過(guò)程示意。節(jié)點(diǎn)都具有流行度以及與其他節(jié)點(diǎn)的相似度。即便是相同的一批節(jié)點(diǎn),遵從相同的規(guī)則來(lái)建立鏈接和保持活躍,但是因?yàn)榧尤刖W(wǎng)絡(luò)的順序不同,網(wǎng)絡(luò)增長(zhǎng)的模式不同,最終網(wǎng)絡(luò)中活躍節(jié)點(diǎn)的比重也會(huì)截然不同。
如圖例中所言,針對(duì)五個(gè)節(jié)點(diǎn)的示意圖,即便是相同的一批節(jié)點(diǎn)集合,節(jié)點(diǎn)之間基于相同的鏈接規(guī)則,節(jié)點(diǎn)的活躍狀態(tài)也基于相同的規(guī)則,唯一改變了節(jié)點(diǎn)加入網(wǎng)絡(luò)的順序,同樣會(huì)造成節(jié)點(diǎn)的鏈接類(lèi)型、生成的網(wǎng)絡(luò)結(jié)構(gòu)不同,繼而節(jié)點(diǎn)的活躍狀態(tài)也呈現(xiàn)出明顯的差異。
請(qǐng)注意,這里僅僅著眼于社交網(wǎng)絡(luò)發(fā)展壯大的早期,尚沒(méi)有觸及其他階段、其他因素的作用。并且,這種網(wǎng)絡(luò)結(jié)構(gòu)的差異、節(jié)點(diǎn)活躍狀態(tài)的差異,并不是一次兩次隨機(jī)偶然的事件。當(dāng)進(jìn)行大量重復(fù)的仿真過(guò)程之后,一些明確的現(xiàn)象和規(guī)律已呼之欲出……
啟示&展望
這篇科普文,主要圍繞“社交網(wǎng)絡(luò)如何從小長(zhǎng)大,如何維持網(wǎng)絡(luò)上用戶(hù)的長(zhǎng)期活躍”這些話(huà)題,從仿真建模的角度,對(duì)網(wǎng)絡(luò)的增長(zhǎng)和節(jié)點(diǎn)活躍狀態(tài)聯(lián)動(dòng)的建模過(guò)程做了一個(gè)介紹,并進(jìn)行了一個(gè)階段性的探索。這一小探索已然表明:節(jié)點(diǎn)活躍程度的演化不僅取決于網(wǎng)絡(luò)拓?fù)?,而且與節(jié)點(diǎn)間的鏈接類(lèi)型有關(guān);節(jié)點(diǎn)間的鏈接類(lèi)型又蘊(yùn)含在網(wǎng)絡(luò)的增長(zhǎng)和節(jié)點(diǎn)活躍狀態(tài)變化的協(xié)同過(guò)程之中。
依據(jù)這一模型[3],我們發(fā)現(xiàn):即便是對(duì)于同樣的一群個(gè)體,具有明確的個(gè)體流行度和個(gè)體間的相似度,由于連接類(lèi)型的差異,這群個(gè)體形成的社交結(jié)構(gòu)也可能具有截然不同的維持用戶(hù)活躍的能力;并且,以個(gè)體間的相似度為基礎(chǔ),適當(dāng)偏向高流行度個(gè)體的方式,可以讓網(wǎng)絡(luò)達(dá)到極高的持久活躍能力。
本文中考慮的節(jié)點(diǎn)的流行度、相似度,節(jié)點(diǎn)自發(fā)活躍等內(nèi)容是對(duì)真實(shí)世界的抽象。在涉及具體的社區(qū)類(lèi)產(chǎn)品的運(yùn)營(yíng)時(shí),這些內(nèi)容對(duì)運(yùn)維策略和產(chǎn)品設(shè)計(jì)也有啟發(fā)。因?yàn)樽髡吣壳皩?duì)企業(yè)運(yùn)營(yíng)的具體實(shí)踐認(rèn)知不夠,不敢妄加揣測(cè),這里僅拋出來(lái)一些點(diǎn),希望能給讀者一點(diǎn)啟發(fā),可能業(yè)內(nèi)專(zhuān)業(yè)人士能給出更好的解答。
進(jìn)一步的文獻(xiàn)資料可參閱:
[1] “Degeneracy (graph theory),” Wikipedia. 19-Sep-2018.
[2] F. Papadopoulos, M. Kitsak, M. á. Serrano, M. Bogu?á, and D. Krioukov, “Popularity versus similarity in growing networks,” Nature, vol. 489, no. 7417, pp. 537–540, Sep. 2012.
[3] X. Jin, C. Jin, J. Huang, and Y. Min, “Coupling effect of nodes popularity and similarity on social network persistence,” Sci. Rep., vol. 7, p. 42956, Feb. 2017.
*本文部分圖片來(lái)源于網(wǎng)絡(luò),版權(quán)歸原作者所有。
作者:金誠(chéng),騰訊游戲數(shù)據(jù)挖掘應(yīng)用中心研究員,微信公眾號(hào):騰訊研究院(ID:cyberlawrc)
本文由 @金誠(chéng) 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自 Pexels,基于 CC0 協(xié)議
- 目前還沒(méi)評(píng)論,等你發(fā)揮!