這篇文章把數(shù)據(jù)講透了(二):數(shù)據(jù)采集

2 評(píng)論 11578 瀏覽 49 收藏 9 分鐘
🔗 产品经理的不可取代的价值是能够准确发现和满足用户需求,把需求转化为产品,并协调资源推动产品落地,创造商业价值。

編輯導(dǎo)讀:隨著“數(shù)智化”時(shí)代的到來(lái),我們生活中的方方面面都離不開(kāi)數(shù)據(jù),而你真的了解數(shù)據(jù)嗎?本文將為你重新解讀數(shù)據(jù)的概念和價(jià)值,以及數(shù)據(jù)的價(jià)值是如何在“數(shù)智化”時(shí)代下一步一步得到運(yùn)用與升華的;因內(nèi)容頗多,筆者將分幾期為大家進(jìn)行講解。

一、前言

上一期文章中,我們已經(jīng)了解到“數(shù)據(jù)”是一個(gè)龐大的體系(如下圖所示)這篇文章把數(shù)據(jù)講透了(一):數(shù)據(jù)來(lái)源;并用了菜市場(chǎng)的例子,為大家講解數(shù)據(jù)來(lái)源的含義;而今天小陳主要給大家到了指定“菜市場(chǎng)”后,我們?cè)鯓印百I(mǎi)菜”,即數(shù)據(jù)采集的過(guò)程。

二、數(shù)據(jù)采集(買(mǎi)菜)

首先,我們先對(duì)數(shù)據(jù)采集的方式進(jìn)行一個(gè)簡(jiǎn)單的分類(lèi)介紹,后面分別介紹每一種數(shù)據(jù)采集形式需要注意的要點(diǎn)。

1. 按數(shù)據(jù)采集方式

線下(問(wèn)卷、實(shí)地調(diào)研)——注意要點(diǎn):遵循5大要素!

5個(gè)要素:

1)緊緊圍繞研究主題和目的

評(píng)價(jià)一份問(wèn)卷調(diào)查優(yōu)劣程度的準(zhǔn)則中很重要的一點(diǎn)就是,問(wèn)卷內(nèi)容是否貼合研究主題,就算一份問(wèn)卷設(shè)計(jì)得再精妙,如果與主題無(wú)關(guān),也是毫無(wú)價(jià)值的,因?yàn)槲覀冮_(kāi)展問(wèn)卷調(diào)查的本質(zhì)目的也是調(diào)查相關(guān)要素和調(diào)研群體背后千絲萬(wàn)縷的聯(lián)系。

例如,調(diào)查用戶(hù)滿(mǎn)意度,一般涉及到產(chǎn)品本身(價(jià)格、包裝等)和受眾特點(diǎn)(年齡、地域、心理滿(mǎn)足等)兩個(gè)維度。

2)題目易讀、易理解、且具有一般性

問(wèn)卷分發(fā)后,是需要受眾進(jìn)行填寫(xiě)的,所以問(wèn)卷的易理解程度也最終決定者問(wèn)卷的質(zhì)量。

問(wèn)卷并不是學(xué)術(shù)論文,不需要為了彰顯專(zhuān)業(yè)素養(yǎng)而涉及很多專(zhuān)業(yè)、晦澀難懂的詞匯,讓調(diào)查者能夠真的看懂才是關(guān)鍵。

而一般性則指的是這個(gè)問(wèn)題的設(shè)置是否對(duì)所有受眾都具普遍意義。例如,調(diào)查居民出行方式的問(wèn)卷中,你認(rèn)為最安全的交通工具是,A火車(chē) B飛機(jī) C寶馬小轎車(chē) D電動(dòng)車(chē),我們可以看到C選項(xiàng)不具有普遍意義,且和A、B、D不是一個(gè)維度的選項(xiàng)。

3)充分考慮被調(diào)者特點(diǎn)

在使用問(wèn)卷調(diào)查方式時(shí),要充分結(jié)合被調(diào)群體的特色,來(lái)進(jìn)行問(wèn)卷的設(shè)置;例如針對(duì)學(xué)齡前兒童和老年人,則不宜采取書(shū)面問(wèn)卷調(diào)研的形式,要充分考慮到他們的語(yǔ)言偏好(有些老人可能普通話不標(biāo)準(zhǔn),但方言流利)、對(duì)內(nèi)容的理解能力,再派出訪談?wù){(diào)研小組進(jìn)行調(diào)研。

4)充分考慮問(wèn)題排序(循序漸進(jìn))

問(wèn)卷問(wèn)題的設(shè)置除了考慮每個(gè)問(wèn)題的規(guī)范性、合理性外,還需要考慮到問(wèn)題與問(wèn)題之間的邏輯性和連貫性,避免時(shí)間、空間、人稱(chēng)等維度的頻繁跳躍。

5)充分考慮統(tǒng)計(jì)便利性

除了考慮問(wèn)卷調(diào)查的受眾外,問(wèn)卷設(shè)置還需要充分考慮后期問(wèn)卷回收后的統(tǒng)計(jì)分析;盡可能減少后期工作壓力,變量不宜設(shè)置太多,應(yīng)該用盡量少的變量高效獲取標(biāo)簽信息,幫助后期研究定性。

線上(按數(shù)據(jù)采集端口細(xì)分為APP端和網(wǎng)頁(yè)端)

APP端(主)——數(shù)據(jù)埋點(diǎn)獲得相關(guān)數(shù)據(jù):

首先,先和大家科普一下,數(shù)據(jù)埋點(diǎn)到底是什么?以及APP端為何要特別重視數(shù)據(jù)埋點(diǎn)。

其實(shí),所謂埋點(diǎn)就是在用戶(hù)使用APP的過(guò)程中,對(duì)他們的一系列行為數(shù)據(jù)進(jìn)行收集,以?xún)?yōu)化產(chǎn)品和運(yùn)營(yíng);而大多APP自帶服務(wù)和盈利性質(zhì)(如淘寶、得到等),那么想要實(shí)現(xiàn)轉(zhuǎn)化,引導(dǎo)購(gòu)買(mǎi)就需要將“點(diǎn)”埋到具體的交互組件上(例如,點(diǎn)擊跳轉(zhuǎn)鏈接、購(gòu)買(mǎi)按鈕等),然后對(duì)PV、UV;停留時(shí)間、跳出率、購(gòu)買(mǎi)率等指標(biāo)進(jìn)行量化。

就埋點(diǎn)的形式而言,主要分為以下三種:

代碼埋點(diǎn):控件操作發(fā)生時(shí)通過(guò)預(yù)先寫(xiě)好的代碼來(lái)發(fā)送數(shù)據(jù),目前百度統(tǒng)計(jì)、友盟都提供這一服務(wù)。

下面舉一個(gè)例子,例如,我們想統(tǒng)計(jì)淘寶APP里面加入購(gòu)物車(chē)這個(gè)按鈕的點(diǎn)擊次數(shù),則在其被點(diǎn)擊時(shí),可以在這個(gè)按鈕對(duì)應(yīng)的 OnClick 函數(shù)里面調(diào)用SDK提供的數(shù)據(jù)發(fā)送接口來(lái)發(fā)送數(shù)據(jù)。

優(yōu)點(diǎn):控制發(fā)送數(shù)據(jù)時(shí)間,事件自定義屬性詳細(xì)記錄;缺點(diǎn):時(shí)間、人力成本大,數(shù)據(jù)傳輸?shù)臅r(shí)效性。

可視化埋點(diǎn):利用可視化交互手段,通過(guò)可視化界面配置控件操作與事件操作發(fā)生關(guān)系,通過(guò)后臺(tái)截屏的方式采集數(shù)據(jù);例如,當(dāng)用戶(hù)產(chǎn)生多次刷新這一行動(dòng)時(shí),結(jié)合大數(shù)據(jù)算法,推算出用戶(hù)的喜好并切換推送內(nèi)容、產(chǎn)品,再通過(guò)可視化埋點(diǎn),自動(dòng)切換到對(duì)應(yīng)的個(gè)性化推薦內(nèi)容頁(yè)面。

優(yōu)點(diǎn):成本低,速度快,產(chǎn)品、市場(chǎng)等各部門(mén)均能參與;缺點(diǎn):行為記錄信息少,支持的分析方式少,減輕開(kāi)發(fā)負(fù)擔(dān)。

無(wú)埋點(diǎn):用戶(hù)展現(xiàn)UI界面元素時(shí),平臺(tái)會(huì)通過(guò)控件綁定觸發(fā)事件,事件被觸發(fā)的時(shí)候系統(tǒng)會(huì)有相應(yīng)的接口讓開(kāi)發(fā)者處理這些行為;上傳UI界面后,系統(tǒng)能夠自動(dòng)識(shí)別生成控件的唯一ID,ID是在程序內(nèi)部生成,只需保證在不同的手機(jī)上面這些ID是一樣的,就能實(shí)現(xiàn)用戶(hù)端的無(wú)埋點(diǎn)數(shù)據(jù)獲取。

優(yōu)點(diǎn):無(wú)需埋點(diǎn),方便快捷;缺點(diǎn):行為記錄信息少,傳輸壓力大。

網(wǎng)頁(yè)端——網(wǎng)頁(yè)爬蟲(chóng)(python,C…):

就具體語(yǔ)法而言,因?yàn)槭褂霉ぞ卟煌?,并不能就具體語(yǔ)法提供指導(dǎo)(大家根據(jù)自己使用的語(yǔ)言,在CSDN上進(jìn)行搜索),但其總體方法論是一致的。

方法論:人工確定爬取信息的維度→分析目標(biāo)網(wǎng)站URL構(gòu)成→確認(rèn)爬取工具→編寫(xiě)程序語(yǔ)言→獲取數(shù)據(jù)→保存于本地→后續(xù)進(jìn)行數(shù)據(jù)挖掘。

三、結(jié)語(yǔ)

本期,筆者通過(guò)一個(gè)“買(mǎi)菜”的例子,帶著大家了解了數(shù)據(jù)采集的幾種方式,相信大家有所收獲!

下期,筆者講在數(shù)據(jù)采集的基礎(chǔ)上,為大家講解如何利用常用工具進(jìn)行數(shù)據(jù)清洗和數(shù)據(jù)清洗的幾個(gè)維度!

 

本文由 @小陳同學(xué)ing. 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)作者許可,禁止轉(zhuǎn)載。

題圖來(lái)自Unsplash,基于CC0協(xié)議。

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 第二部分零零散散….有1,就沒(méi)然后了

    來(lái)自上海 回復(fù)
  2. 后面啥時(shí)候可以更新?

    回復(fù)
专题
12483人已学习16篇文章
栅格系统在页面排版布局、尺寸设定方面给了设计者直观的参考,它让页面设计变得有规律,从而减少了设计决策成本。本专题的文章分享了浅析栅格系统。
专题
13467人已学习13篇文章
对企业而言,计费管理系统是相对基础和重要的一个系统,那么,怎么搭建计费管理系统呢?你了解计费系统的主要功能吗?本专题的文章分享了计费系统设计指南。
专题
12290人已学习12篇文章
精细化运营、抓住老用户、提升用户复购,则将是品牌需要着重留意的地方。本专题的文章分享了提升复购率的N种方法。
专题
13513人已学习13篇文章
增长模型是产品增长的通用思维框架。本专题的文章分享了如何构建增长模型。
专题
16264人已学习16篇文章
企业服务(2B)公司的创业有8个阶段,所有SaaS公司或2B公司不可能跳过这些阶段,每个阶段都有明确的任务。本专题的文章分享了SaaS创业路线图。