互聯(lián)網(wǎng)潛規(guī)則:作弊與反作弊
本文將闡述什么是互聯(lián)網(wǎng)作弊,并以百度和淘寶看如何反作弊的行為。
互聯(lián)網(wǎng)作弊是什么?
互聯(lián)網(wǎng)作弊是一種很普遍的行為,就拿我們最熟悉的來說,有電商和O2O的刷單刷信譽(yù)行為、廣告作弊等,具體分類如下圖:
廣告作弊與反作弊
1.背景:互聯(lián)網(wǎng)廣告成為主流
(1)數(shù)字營銷(互聯(lián)網(wǎng)廣告)分兩類:
- 品牌廣告:以品牌宣傳為主,多以千次曝光的形式計費(fèi),廣告主追求的是長期的品牌溢價;
- 效果廣告:多以單次點(diǎn)擊或單次行為的形式計費(fèi),更關(guān)注短期轉(zhuǎn)化和收益。
(2)投放方式:CPA、CPC、CPM每千人成本、CPP每購買成本等
2.現(xiàn)象:數(shù)據(jù)作弊
2016年上半年, AdMaster推出的《廣告反欺詐白皮書》顯示:2016上半年,AdMaster的廣告反欺詐監(jiān)測系統(tǒng)平均每天識別出高達(dá) 28% 的虛假流量。的確,中國的數(shù)字營銷生態(tài)環(huán)境也正遭受著虛假流量的侵蝕。
3.作弊類型
- 曝光作弊:可能把廣告展現(xiàn)在一些完全沒有商業(yè)價值的垃圾流量上。
- 點(diǎn)擊作弊:利用機(jī)器、人工或誘導(dǎo)用戶點(diǎn)擊,例如把廣告換成一個美女圖片,吸引完全不符合廣告意圖的點(diǎn)擊。另外,競爭對手還可能進(jìn)行惡意點(diǎn)擊。
- 轉(zhuǎn)化作弊:在注冊、激活、下單等不同場景下通過自動化程序的模擬真人行為。
4.如何鑒別廣告作弊
(1)初級作弊辨別:發(fā)現(xiàn)數(shù)據(jù)異常點(diǎn)。例如:
- 異常峰值
- 出現(xiàn)峰值時轉(zhuǎn)化數(shù)據(jù)并沒有增長
- 出現(xiàn)峰值時到站跳出率增長
- 投放的媒體屬性和點(diǎn)擊的地域?qū)傩圆环?/li>
(2)中級作弊辨別:真人點(diǎn)擊和機(jī)器模擬點(diǎn)擊。例如:
- 點(diǎn)擊請求的Headers異常
- 點(diǎn)擊行為分析:機(jī)器點(diǎn)擊具有一定的連續(xù)性,可以通過判斷同IP同設(shè)備的連續(xù)點(diǎn)擊、同IP段的大量點(diǎn)擊、同IP連續(xù)點(diǎn)擊間隔時間等進(jìn)行判斷。
——作者:豈安科技;出處:艾媒網(wǎng)(3)轉(zhuǎn)化作弊辨別。例如:
- 行為頻率、次數(shù)異常;
- 注冊者的URL訪問軌跡:機(jī)器只訪問注冊URL頻繁注冊;
- 注冊者是否查看了頁面上的靜態(tài)資源:機(jī)器注冊在訪問時只關(guān)心網(wǎng)頁上的文字;
- 不同賬號同密碼注冊;
- 注冊者從到站到注冊間的時間間隔:真人在注冊前會有較長時間的瀏覽過程,而機(jī)器行為則直奔主題。
以上整理自:http://www.gupowang.com/app/187.html,作者:姑婆;
5.如何反作弊?
- 目的:無限壓縮作弊行為在正常商業(yè)行為中的比例,而非絕對根除。
- 最好的實現(xiàn)方法在于讓作弊成本劇增。
- 思路:砌墻(不斷的加限制條件);拆臺(使作弊行為的獲利大幅度減少)
(1)排重:添加監(jiān)測鏈接,通過Cookie、設(shè)備號或IP排重,如大量出現(xiàn)218.175.11.x這種相同C段的IP號。
(2)頻度控制、SDK加密防護(hù)、人工介入監(jiān)控
(3)點(diǎn)擊有效期:限制點(diǎn)擊的有效期,在有效期內(nèi),后續(xù)轉(zhuǎn)化歸屬相應(yīng)平臺,如超時則不予計算。
(4)異常數(shù)據(jù)黑名單:對點(diǎn)擊記錄超過一定范圍標(biāo)記為黑名單,長期過濾。
(5)歸因時間差監(jiān)控:歸因時間差即指從點(diǎn)擊到下載激活的時間。一般作弊時,偽造點(diǎn)擊與激活是并存的,所以往往在時間邏輯上是錯誤的。
(6)增加行為操作的復(fù)雜度,但可能傷害用戶。
SEO反作弊——以百度為例
1.搜索引擎優(yōu)化——SEO
具體來說,就是通過站內(nèi)優(yōu)化比如網(wǎng)站結(jié)構(gòu)調(diào)整、內(nèi)容建設(shè)、代碼優(yōu)化等,以及站外優(yōu)化比如網(wǎng)站站外推廣、品牌建設(shè)等,使網(wǎng)站滿足搜索引擎收錄排名需求,在搜索引擎中提高關(guān)鍵詞排名,從而吸引精準(zhǔn)用戶進(jìn)入網(wǎng)站,獲得免費(fèi)流量,產(chǎn)生直接銷售或品牌推廣。
2.百度怎么反作弊?
(1)綠蘿算法:2013年2月上線的搜索引擎反作弊算法,主要打擊超鏈中介、出賣鏈接、購買鏈接等超鏈作弊行為。通過綜合外鏈內(nèi)容的相關(guān)性、A及B網(wǎng)站頁面內(nèi)容品質(zhì)、更新頻率、違規(guī)歷史記錄、總權(quán)重值,從而判斷外鏈的權(quán)重傳遞是否有效。
(2)石榴算法:針對低質(zhì)量網(wǎng)站的進(jìn)一步打擊的升級版,將重點(diǎn)整頓含有大量妨礙用戶正常瀏覽的惡劣廣告的頁面,尤其以彈出大量低質(zhì)彈窗廣告、混淆頁面主體內(nèi)容的垃圾廣告頁面為代表。
電商反作弊——以淘寶為例
淘寶搜索反作弊系統(tǒng)不僅監(jiān)控賣家行為,同時也監(jiān)控買家行為,并且通過對買家ID的行為監(jiān)控可倒推反證賣家作弊。而且,該算法還可以作為推薦算法使用。反作弊手段大致劃分為以下3種:信任傳播模型、不信任傳播模型和異常發(fā)現(xiàn)模型。
(以下來源于淘寶搜索技術(shù)內(nèi)參,由薄言整理http://www.tao-sou.com/809.html)
1.信任傳播模型
在海量的寶貝網(wǎng)頁數(shù)據(jù)中,通過一定手段,篩選出絕不會作弊的店鋪、寶貝和ID(即白名單)。算法以這些白名單內(nèi)的頁面作為出發(fā)點(diǎn),賦予白名單內(nèi)的頁面節(jié)點(diǎn)較高的信任度分值,其他寶貝、買家、賣家是否作弊,要根據(jù)其和白名單內(nèi)節(jié)點(diǎn)店鋪或?qū)氊惖某山魂P(guān)系來確定。白名單內(nèi)節(jié)點(diǎn)通過成交關(guān)系將信任度分值向外擴(kuò)散傳播,如果某個節(jié)點(diǎn)最后得到的信任度分值低于這一閥值,那么該寶貝網(wǎng)頁、買家或賣家則會被認(rèn)為是有作弊嫌疑。
2.不信任傳播模型
從大的技術(shù)框架上來講,其和信任傳播模型是相似的,最大的區(qū)別在于初始的頁面子集合不是值得信任的店鋪或?qū)氊愴撁婀?jié)點(diǎn),而是確認(rèn)存在作弊行為的頁面或ID集合(即黑名單)。賦予黑名單內(nèi)頁面節(jié)點(diǎn)不信任分值,通過成交關(guān)系將這種不信任關(guān)系傳播出去,如果最后頁面節(jié)點(diǎn)的不信任分值大于設(shè)定的閥值,則會被認(rèn)為是作弊網(wǎng)頁或有作弊嫌疑。
3.異常發(fā)現(xiàn)模型
先找到一些作弊或非作弊的集合,分析出其絕對特征有哪些,然后利用這些特征來識別作弊行為。具體來說,一種是直接從作弊行為包含的獨(dú)特特征來構(gòu)建算法;另一種是通過統(tǒng)計等手段分析正常的店鋪、寶貝和ID應(yīng)該具備哪些特征,如果不具備則被認(rèn)為是作弊。這幾種都是通過分析行為之間、物品之間的相似度或區(qū)別度,故也可以用來用于用戶的個性化推薦,比如我們常見的“猜你喜歡”、“向你推薦”等。這是我了解的最有趣的一點(diǎn)。
作者:小喬,微信公眾號:蕎麥長長(qiaomaihexiaoqiao)
本文由 @小喬 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
說的太籠統(tǒng)了??戳烁鷽]看一樣
閾值 不是閥值
感謝每一個打賞的人,感謝收藏和點(diǎn)贊,這些無形中的鼓勵讓我更有動力~~拖延癥治療良藥。 ??