正態(tài)分布在用戶等級劃分的應(yīng)用
為了便于描述和應(yīng)用,常將一般正態(tài)分布轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布。通過查標(biāo)準(zhǔn)正態(tài)分布表,就可以直接計(jì)算出原正態(tài)分布的概率值。
- 問題:根據(jù)用戶播放時長,劃分若干等級。目前可使用的數(shù)據(jù)為日人均播放時長。等級從低到高,要求達(dá)到的時間越來越長。
- 理論:日人均播放時長符合正態(tài)分布,可通過繪制QQ圖驗(yàn)證。
正態(tài)分布圖如下:
可知,3σ原則為:
- 數(shù)值分布在(μ-σ,μ+σ)中的概率為0.6827
- 數(shù)值分布在(μ-2σ,μ+2σ)中的概率為0.9545
- 數(shù)值分布在(μ-3σ,μ+3σ)中的概率為0.9973
即x≥μ-σ的發(fā)生概率約84%,x≥μ發(fā)生概率約50%,x≥μ+σ發(fā)生概率約16%,x≥μ+2σ發(fā)生概率約為3%。
實(shí)踐:
本例中要求劃分為4個等級:
- 第一步,取某足夠長時間的播放數(shù)據(jù);
- 第二步,計(jì)算日人均播放時長(分);
- 第三步,計(jì)算日人均播放時長的平均值μ=62和標(biāo)準(zhǔn)方差σ=12.5;
- 第四步,計(jì)算3σ分布。
- 第五步,得出各點(diǎn)的概率。
- 第六步,計(jì)算最終時間,單位:分鐘。
解釋:
理論上來講:
- 84%的人一周后獲得第一個等級;
- 50%的人一個月后獲得第二個等級;
- 16%的人6個月后獲得第三等級;
- 3%的人12個月后獲得第四個等級。
小結(jié):
- 第一個等級350分鐘——即5.8小時;
- 第二個等級1860分鐘——即31小時;
- 第三個等級13500分鐘——即9.4天;
- 第四個等級31755分鐘——即22天。
展望:
由于一般的正態(tài)總體其圖像不一定關(guān)于y軸對稱,對于任一正態(tài)總體,其取值小于x的概率,只要會用它求正態(tài)總體在某個特定區(qū)間的概率即可。
為了便于描述和應(yīng)用,常將一般正態(tài)分布轉(zhuǎn)化成標(biāo)準(zhǔn)正態(tài)分布。通過查標(biāo)準(zhǔn)正態(tài)分布表,就可以直接計(jì)算出原正態(tài)分布的概率值。
根據(jù)該理論可以實(shí)現(xiàn)任意等級的劃分,只需將正態(tài)分布轉(zhuǎn)為標(biāo)準(zhǔn)正態(tài)分布,根據(jù)每個等級可達(dá)到的概率進(jìn)行查表獲得相應(yīng)的分界點(diǎn)。
本文由 @Vector 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
評論
“84%的人一周后獲得第一個等級;50%的人一個月后獲得第二個等級;16%的人6個月后獲得第三等級;3%的人12個月后獲得第四個等級?!?br /> 請問一周、一個月、6個月、12個月這個的依據(jù)是?求科普
依據(jù)是你希望多少人達(dá)到的。
為什么簡單的一個分層講這么復(fù)雜
簡單背后有依據(jù)