網(wǎng)站是如何「看到」用戶的:獨立IP與cookie
用戶在訪問網(wǎng)站的時候,如何通過技術(shù)手段識別每一個用戶?
不知道大家在訪問網(wǎng)站的時候,會不會疑惑為什么我的所有信息都會被網(wǎng)站“看到”呢?比如說我上網(wǎng)的地理位置、點擊了哪個頁面、在網(wǎng)站停留了多長時間、花了多少錢等等。
其實我們的所有操作都會被網(wǎng)站“看到”,也就是被統(tǒng)計起來;網(wǎng)站統(tǒng)計之后的數(shù)據(jù)就是大家常常聽到的 UV、PV、Session 等等之類的網(wǎng)絡(luò)術(shù)語(之后我會展開闡述各個概念)。
但是作為一名求知欲旺盛的少年,怎么能止步于 What 層面,我們還要知道 Why and How。
網(wǎng)站是如何看到用戶的問題,其實專業(yè)來講,是用戶識別的問題。接下來,我們一一來展開分析:
一般而言,我們會使用 MAC Address、IP、Cookie、User Agent、Mobile Number、User ID、SIM ID、Email 作為識別用戶身份的手段。這些方法都有各自的優(yōu)劣,比如,移動端常用 Mobile Number、SIM ID 等來識別用戶,網(wǎng)站常用 Cookie 來識別用戶。而在此,我們也關(guān)注 IP 和 Cookie,重點闡述下兩者的概念和優(yōu)劣。
因此,特將常用網(wǎng)站數(shù)據(jù)分析方面的概念整理出來,分享給大家。
IP,Internet Protocol,獨立IP
IP 為計算機網(wǎng)絡(luò)相互連接進行通信而設(shè)計的協(xié)議,是連接到網(wǎng)上的所有計算機網(wǎng)絡(luò)實現(xiàn)相互通信的一套規(guī)則,我們每臺可以上網(wǎng)的電腦都有一個 IP,且在全世界范圍內(nèi)是唯一的。因此 IP 的唯一性被用來作為網(wǎng)站表現(xiàn)的一個指標(biāo)。
插播插播:在向具體說明IP和Cookie的使用之前,先向大家介紹一個實用的工具 GA,知道 GA 是什么的小伙伴兒可以直接略過這段了。
GA,即 Google ?Analytics,是 Google 提供的一個統(tǒng)計網(wǎng)站、App 等互聯(lián)網(wǎng)產(chǎn)品數(shù)據(jù)的數(shù)據(jù)分析工具,可以對用戶的年齡、性別、地理位置,PV、UV、訪問時長、訪問頁面、跳出率、等指標(biāo)進行統(tǒng)計,對分析網(wǎng)站或是 App 有很好的幫助作用。
如果還是比較抽象的話,可以理解成國外的百度統(tǒng)計——當(dāng)然百度統(tǒng)計要比 GA 開發(fā)的晚得多了。
之前做過網(wǎng)站站長或是App運營的人可能使用過這個工具,但由于 Google 如今退出中國,可能有很多小伙伴兒們不太清楚 GA 是什么,因此插播此段。
GA 不使用 IP 地址來識別訪問者的身份,但是會追蹤每個訪問者的 IP 地址信息,且整個追蹤過程是在 Google 服務(wù)器端完成的,不會在 GA 的返回數(shù)據(jù)中看到。
那么 GA 統(tǒng)計 IP 地址的意義僅是用來識別訪問者的地理位置信息。這個地理位置信息會以地圖的方式展現(xiàn)給我們,告訴我們用戶活躍的大致位置。
Cookie,瀏覽器緩存
Cookie refers to an HTTP cookie, which is a small piece of data sent from a website and stored on the user’s computer by the user’s web browser
while the user is browsing. At the same time, it also called a web cookie, Internet cookie, browser cookie, or simply cookie.
網(wǎng)站為了辨別用戶身份,追蹤 session 等數(shù)據(jù)跟蹤而預(yù)先儲存在用戶本地終端上的通常經(jīng)過加密的數(shù)據(jù)。Cookie 是網(wǎng)站以一小段文本的形式存放在用戶本地終端的信息,以便網(wǎng)站之后的讀取,基本能夠唯一對應(yīng)到用戶的訪問終端,但要預(yù)先寫入訪問終端,同時還是在用戶允許使用 Cookie 的前提下。
聽起來 Cookie 也有劣勢,那為什么我們要放棄使用 IP 的統(tǒng)計而轉(zhuǎn)向使用 cookie 的方式呢?
當(dāng)用戶使用客戶端第一次訪問某個網(wǎng)站服務(wù)器時,比如 Baidu.com,那么 Baidu.con 的網(wǎng)站服務(wù)器就會預(yù)先寫入一段 Cookie 到客戶端上。GA 通過隨機數(shù)和時間戳來生成字符串來唯一標(biāo)識用戶,且還會記錄一些訪問信息,比如訪問的頁面、訪問的時間等,而當(dāng)我們再次訪問 Baidu.com 的時候,服務(wù)器會直接找到 Cookie 信息,更新一些訪問信息,但是并不會更改唯一表示的用戶信息。
之后也會使用 Cookie 對用戶的 session、UV、PV 等數(shù)均進行統(tǒng)計,也就是生成了大家平日里常見的數(shù)據(jù)指標(biāo)了。顯而易見,Cookie 比 IP 更準(zhǔn)確,這也就是為什么網(wǎng)站現(xiàn)在都使用 Cookie 來識別用戶了。
那么問題來了,網(wǎng)站是如何通過 Cookie 來識別用戶身份的呢?
作者:產(chǎn)品美景,公眾號:產(chǎn)品美景,帶你領(lǐng)略產(chǎn)品的美~
本文由?@產(chǎn)品美景 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自 Unsplash ,基于 CC0 協(xié)議
那么移動端是根據(jù)什么呢,因為手機好像是沒有IP的吧?
寫的挺好的學(xué)習(xí)一下,但是貌似你沒有寫Cookie 有效期這個問題哦。