數(shù)據(jù)分析誤區(qū)系列(二):數(shù)據(jù)揭示的謊言
在做數(shù)據(jù)分析時,常常會陷入一些自己都不知道的陷阱,從而得出一些錯誤的結論。本文就分享了其中一個案例:誤解或誤用數(shù)據(jù)。如何解決,且看作者的分析。
叮叮當叮叮當鈴兒響叮當… 圣誕節(jié)來臨,公司旗下銷售同種類型禮品直播間銷售數(shù)據(jù)如下:
僅從人數(shù)與單量考量,A、B兩個直播間的人均銷量均為1500÷600 = 2.5件。那么,我們是否就能判定這兩個直播間經(jīng)營水平相當、不存在差異呢?答案顯然是否定的。
我們能夠清晰地發(fā)現(xiàn),A地區(qū)的高頻客戶(近一個月消費3次及以上)在人數(shù)方面要遠勝B地區(qū),這一優(yōu)勢不僅體現(xiàn)在購買人數(shù)上,還體現(xiàn)在人均購買數(shù)量上。而且,A地區(qū)的拉新數(shù)據(jù)(480)也明顯優(yōu)于B地區(qū)(380);不過,在中頻用戶方面,B直播間則占據(jù)著顯著的優(yōu)勢。
基于不同層級客群消費情況的對比,運營團隊的同學們后續(xù)會針對這兩個直播間制定具有針對性的運營策略。從這個案例當中,我們也獲得了一個啟示:在進行對比時,不能僅僅由于兩者的平均值相近,就貿(mào)然得出兩者運營狀況相近的結論,而是要展開進一步的具體分析。
其實在現(xiàn)實生活中我們經(jīng)常會掉進一個陷阱,那就是誤解或誤用數(shù)據(jù)。那么如何避免誤區(qū)呢?一種方法是通過學習“安斯庫姆四重奏”,一種由英國統(tǒng)計師弗朗西斯·安斯庫姆創(chuàng)造的,表面上完全不同但有著相同統(tǒng)計特性的四組數(shù)據(jù)集。這些數(shù)據(jù)集揭示了我們在處理數(shù)據(jù)時候的一些常見誤區(qū)。本文將從實際案例中闡述這些誤區(qū)并解釋如何規(guī)避它們。
“安斯庫姆四重奏”指的是四組兩個變量的數(shù)據(jù)集,這四組數(shù)據(jù)的統(tǒng)計性質(zhì)幾乎完全相同,例如都具有相同的平均值、方差和相關性等。然而,當我們繪制出這四組數(shù)據(jù)的散點圖時,我們可以清楚地看到,每組數(shù)據(jù)的分布形狀完全不同;其中一組是線性關系,第二組是曲線關系,第三組是由一個離群值引起的線性關系,以及最后一組是完全隨機的關系。
這四組具有相似統(tǒng)計特性但展現(xiàn)不同分布形態(tài)的數(shù)據(jù)集,揭示了單純依賴數(shù)據(jù)的統(tǒng)計特性來進行決策可能帶來的風險。當對數(shù)據(jù)集進行分析時,我們不能只看統(tǒng)計指標,這些指標可能掩蓋了數(shù)據(jù)集中的實際模式或趨勢。我們需要通過可視化工具進行直觀的觀察,才能獲得全面正確的信息。
總的來說,安斯庫姆四重奏向我們展示了數(shù)據(jù)可能給出的誤導。雖然統(tǒng)計分析和方法仍然是我們?nèi)粘Q策中的重要工具,但我們不能只是簡單地以數(shù)字的形式來理解數(shù)據(jù),為了防止落入“數(shù)據(jù)誤區(qū)”,我們需要更深入地去理解數(shù)據(jù)。此外,我們需要充分認識到數(shù)據(jù)可視化的重要性,并將其運用于我們對數(shù)據(jù)的理解和解讀中。
本文由 @佑佑和博博~ 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務。
- 目前還沒評論,等你發(fā)揮!