什么是TGI指數(shù)?
TGI是英文Target Group Index的縮寫,直譯為“目標(biāo)群體指數(shù)”,即我們觀察的這部分群體,是否更多(或更少)分布在該維度上。本文作者對TGI指數(shù)進(jìn)行了分析,一起來看一下吧。
某出行平臺(tái)曾經(jīng)發(fā)布過一份數(shù)據(jù)分析報(bào)告,指出“凱迪拉克車主最愛去洗浴中心”,一時(shí)引來多方熱議。
我們今天討論的TGI概念,就與這個(gè)小故事有關(guān)。凱迪拉克車主是不是“更愛去洗浴中心”呢?這個(gè)問題,等我們了解了TGI之后再討論。
一、TGI是什么?
TGI是英文Target Group Index的縮寫,直譯為“目標(biāo)群體指數(shù)”。計(jì)算方法非常簡單:
TGI = [目標(biāo)群體中具有某一特征 的群體所占比例/總體中具有相同特征的群體所占比例]*100
在前司上班那會(huì),我們在給客戶(廣告主)提供的消費(fèi)者洞察分析報(bào)告中,頻繁的使用這個(gè)概念,以至于我們總監(jiān)曾經(jīng)專門組織過一次討論:該怎么更科學(xué)、更簡單地向客戶介紹TGI是什么,以及怎么理解它。
在向客戶解讀我的消費(fèi)者報(bào)告時(shí),我將TGI稱為目標(biāo)群體的傾向性指數(shù)。即,我們觀察的這部分群體,是否更多(或更少)分布在該維度上。
舉個(gè)簡單的例子。我在讀大學(xué)時(shí),我們專業(yè)的男女比為1:3,即女生所占比例為75%。顯然,這是一個(gè)讓其他理工科專業(yè)男生十分羨慕的男女比,因?yàn)槲覀兺?000多人中,女生占比約為50%。
在這種情況下,我們專業(yè)女生性別TGI = 75%/50%*100 = 150。而TGI大于100,則說明我們專業(yè)中女生占比更高。
但是大家再考慮一種狀況:如果我們專業(yè)歸屬在女校之中(假設(shè)我們專業(yè)比較特殊,允許招收男生),那么大家還會(huì)覺得我們專業(yè)的女生更多嗎?
顯然不會(huì)。因?yàn)殄^定的群體中,女生占比接近100%(因?yàn)檫€有我們幾個(gè)男生在,分子略小于分母),而我們專業(yè)中的女生比例只有75%,少于大盤。
讓我們回到一開始的小故事中。如果60%凱迪拉克車主都愛去洗浴中心,而整個(gè)豪車群體只有30%的車主愛去,那么凱迪拉克車主在“愛去洗浴中心”的TGI指數(shù)為60%/30%*100=200,遠(yuǎn)高于100,那么可以說凱迪拉克車主“更”愛去。
需要注意的是:如果只看60%這一單一的數(shù)字,我們無法是無法“更愛去”這個(gè)結(jié)論的,頂多說他們“愛去”。如果中國車主60%去洗浴中心,那么凱迪拉克車主并未表現(xiàn)出明顯的偏好性,只是符合一般規(guī)律而已。
所以,我們不能孤立地看待一個(gè)數(shù)據(jù),它只是一個(gè)冷冰冰的數(shù)字而已。我們必須將它帶入到具體的情景當(dāng)中,我們才能判斷這個(gè)數(shù)字是高還是低、是大還是小。
其中我們可以帶入的場景之一就是它所屬的群體里,即它的一個(gè)超集之中。
二、大數(shù)定律與品牌的同質(zhì)人群假設(shè)
我們上初中時(shí)就知道:當(dāng)擲硬幣的次數(shù)越多,正面出現(xiàn)的概率越來越趨近于0.5。
將大數(shù)定律延伸到我們的人群畫像中也類似、我們觀察的某個(gè)群體數(shù)量越多,其在某個(gè)特征的分布,應(yīng)該越來越趨近于整體大盤的分布水平。
考慮到大眾汽車銷量很高,并且在中國汽車市場上有較大的保有量,我們可以假設(shè)大眾車主的男女比例、省份分布,跟中國4.39億汽車車主的男女比例、省份分布應(yīng)該是類似的。即,子集在某個(gè)維度上的分布,應(yīng)該與大盤相同。
但是,我們經(jīng)常會(huì)發(fā)現(xiàn),子集在某個(gè)維度上的分布,比大盤要高或者低。那到底是什么因素導(dǎo)致的呢?
實(shí)際上,我們市場營銷理論的基石是“同質(zhì)人假說”——某個(gè)品牌的目標(biāo)消費(fèi)者(Target Audience),是一群有著相似年齡、性別、地域、消費(fèi)能力、價(jià)值觀的群體。比如,很多品牌官網(wǎng)上可能會(huì)明確介紹:我們品牌和產(chǎn)品,主要面向25-30歲的白領(lǐng)女性,她們居住在一線和新一線,追求新鮮的事物,等等。
同質(zhì)人假設(shè)有其合理性:一方面品牌可以更明確找到符合其特征的目標(biāo)消費(fèi)者,可以有針對性地開發(fā)特定產(chǎn)品,并利用特定媒體渠道進(jìn)行廣告觸達(dá),即品牌更希望找到某一類人;另外一方面,從消費(fèi)者的視角看,可以通過這些品牌定位和理念,來快速找到適合自己的產(chǎn)品和品牌,即某一類人也會(huì)找到適合自己的品牌。
同質(zhì)性假說造成的結(jié)果則是某個(gè)相似群體在某個(gè)品牌下的高度聚集。比如提到奔馳車主,我們就覺得這是一個(gè)有錢人的群體。
所以,如果我們觀察的群體,在某個(gè)維度上的分布,跟大盤相比出現(xiàn)了較大的異常(過高/過低),我們可以假設(shè)是品牌造成的這種差異(畢竟在真實(shí)社會(huì)中,要準(zhǔn)確計(jì)算某個(gè)因素的解釋力非常困難),而這往往可以評估品牌建立的有效性。
比如品牌A希望吸引25-30歲的一線白領(lǐng)女性,通過CRM數(shù)據(jù)分析發(fā)現(xiàn):該品牌符合這些條件的消費(fèi)者占比是20%,比例與大盤中符合上述條件的人群占比一樣。我們可以認(rèn)為品牌形象并未成功建立;換句話說,即使品牌什么都不做,來消費(fèi)者的中白領(lǐng)女性比例跟現(xiàn)在也沒什么差別。
我們在分析數(shù)據(jù)的時(shí)候,遇到TGI指數(shù)過高或者過低的維度,往往是一個(gè)突破口,我們可以在這個(gè)維度上繼續(xù)深挖。
三、咖啡與混淆變量
我是一個(gè)咖啡成癮者,每天午覺起來比都要來一杯咖啡,所以格外關(guān)注咖啡對健康的影響。事實(shí)上,咖啡對健康的研究經(jīng)常見之于媒體。
一份研究表明:
研究結(jié)果表明,喝咖啡的人平均每天要喝兩杯咖啡,包括脫咖啡因咖啡或速溶咖啡或研磨咖啡。他們患慢性肝病的風(fēng)險(xiǎn)比不喝咖啡的人低21%,患慢性肝病或脂肪肝的風(fēng)險(xiǎn)低20%。他們死于慢性肝病的可能性也降低了49%。
有趣的是,也有一些研究表明:“與完全不喝咖啡的人比較,一天喝1~5杯咖啡的人患心肌梗死的概率高1.34倍?!?/p>
作為咖啡愛好者,我當(dāng)然說服自己相信第一個(gè)研究的結(jié)論。
可是為什么這些研究的結(jié)論竟然會(huì)如此大相徑庭,甚至截然相反呢?
我對此的解釋是“混淆變量”。
第一份研究使用的數(shù)據(jù)是英國的Biobank 英國生物樣本庫。根據(jù)《維基百科》的介紹:該生物樣本庫始于2006年,對40~69 年齡段的500,000 名志愿者的各項(xiàng)生理指標(biāo)持續(xù)進(jìn)行觀測;抽樣人群主要來自生物樣本庫研究中心周邊10-20英里范圍內(nèi)的居民,“以城市人口居多”。
然而,年齡與經(jīng)濟(jì)水平也會(huì)直接影響“肝病”。因?yàn)橐泊嬖谶@樣一種可能性:收入越高的人,越有可能每天消費(fèi)咖啡;同時(shí),他們也能享受到更好的醫(yī)療服務(wù),獲得科學(xué)的飲食和鍛煉建議,這些因素可能也會(huì)影響慢性疾病的發(fā)病。因此,高咖啡消費(fèi)與低慢性疾病發(fā)病率的相關(guān),可能也只是一種簡單的相關(guān)表象,背后的共同推手是“高收入”。
而認(rèn)為咖啡有害的研究中,除了咖啡導(dǎo)致心肌梗死這一種因果解釋之外,我們也可以假設(shè):需要經(jīng)常熬夜加班這一變量,是讓二者存在相關(guān)的共同推手——由于需要經(jīng)常熬夜加班,才會(huì)需要大量咖啡因的攝入來保持清醒;與此同時(shí),熬夜加班也加大了心肌梗死的風(fēng)險(xiǎn)。
這就是背后的“混淆變量”,簡單來說:Z導(dǎo)致了X,Z也導(dǎo)致了Y;乍看起來,X、Y存在因果或者相關(guān),因?yàn)樗鼈兘?jīng)常相伴相生。
而這跟TGI又有什么關(guān)系呢?
如果你看到一個(gè)數(shù)據(jù):未患脂肪肝的人群中,70%的人都是咖啡愛好者,TGI指數(shù)是170;而患有脂肪肝的人,35%是咖啡愛好者,TGI指數(shù)是85。
這是否意味著喝咖啡能減少得脂肪肝的可能性呢?
通過上面混淆變量的分析,你會(huì)堅(jiān)定地否定這一想法。
TGI指數(shù)也只是一個(gè)數(shù)字,我們可以通過過高或者過低的TGI去尋求進(jìn)一步的人群的洞察,但是不意味著這個(gè)維度就能對群體的形成具有解釋力。
專欄作家
簡寫2019,人人都是產(chǎn)品經(jīng)理專欄作家。理性派,思考本質(zhì)問題。堅(jiān)定地用數(shù)據(jù)和結(jié)構(gòu)化解決一切問題。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
某個(gè)群體的特質(zhì)并不代表這一類群體,總體的選擇范圍不同,得出的結(jié)果也就不同
學(xué)到了,某個(gè)群體的用戶特征并不代表這一類群體。
學(xué)到了,通過各種定義指數(shù)確實(shí)能夠在一定范圍內(nèi)對用戶行為做出判斷和研究,但也并不是全部,指數(shù)不能完全性依賴。