夢(mèng)想與前行:一名數(shù)據(jù)人的自白(上)

2 評(píng)論 5669 瀏覽 48 收藏 15 分鐘

離上次寫(xiě)文已過(guò)去五年,回想起那會(huì)最開(kāi)心的事就是在微博上跟同行百舸爭(zhēng)流,恰大數(shù)據(jù)正熱,年少氣盛,懷揣憧憬,樂(lè)此不疲。然而,任何一個(gè)概念的發(fā)展都是經(jīng)歷了從興起,到炒作,再到回落的循環(huán),能否再次崛起,得看“財(cái)報(bào)業(yè)績(jī)”的檢驗(yàn)—數(shù)據(jù)的價(jià)值是被高估還是低估。在踐行數(shù)據(jù)價(jià)值的這條道路上,每個(gè)數(shù)據(jù)人都在用自己的方式積極備考,所以覺(jué)得有必要再來(lái)寫(xiě)點(diǎn)什么,向各位同仁展開(kāi)我的考卷,不為他,只為對(duì)數(shù)據(jù)的夢(mèng)想與情懷。

這篇文章的動(dòng)因——分享一下個(gè)人的數(shù)據(jù)從業(yè)歷程,有些主觀,但不失真實(shí),拋磚引玉,期待交流。

前段時(shí)間看微博話題討論有些迷茫,有些已經(jīng)被同行確認(rèn)無(wú)疑的觀點(diǎn)竟被反復(fù)強(qiáng)調(diào),比如”數(shù)據(jù)挖掘/分析要懂業(yè)務(wù)”、”產(chǎn)品是數(shù)據(jù)價(jià)值變現(xiàn)的一條有效渠道”,觀點(diǎn)沒(méi)錯(cuò),但聽(tīng)多了的感覺(jué)就好比一些健康養(yǎng)生專(zhuān)家在闡述吃飯對(duì)于健康的重要性,有些會(huì)質(zhì)疑自己的認(rèn)識(shí),難道別人一直都不是在吃飯?還是說(shuō)難道自己一直是個(gè)另類(lèi)?

任何觀點(diǎn)與認(rèn)識(shí)都是來(lái)自個(gè)體的經(jīng)歷,經(jīng)歷是前因,觀點(diǎn)是后果,后果不重要,了解前因才是關(guān)鍵,只有知道前因,才能更好的對(duì)觀點(diǎn) 進(jìn)行學(xué)習(xí)、轉(zhuǎn)化與吸收。

一、不懂商業(yè),技術(shù)就僅僅只是技術(shù)

正如微博名“@數(shù)據(jù)挖掘_PHP”所示,在沒(méi)進(jìn)入數(shù)據(jù)行業(yè)之前,我是一名標(biāo)準(zhǔn)的PHPer,在一家公關(guān)公司從事?tīng)I(yíng)銷(xiāo)傳播的技術(shù)支持工作。

有一次項(xiàng)目是網(wǎng)站 建設(shè),在進(jìn)行類(lèi)目規(guī)劃時(shí),發(fā)現(xiàn)竟然還有數(shù)據(jù)監(jiān)測(cè)和咨詢(xún)公司,不明覺(jué)厲:數(shù)據(jù)監(jiān)測(cè)?咨詢(xún)?西服領(lǐng)帶?空中飛人?哇~高端大氣上檔次!

從那以后,開(kāi)始對(duì)數(shù)據(jù)公司的關(guān)注。

一個(gè)月后進(jìn)入到一家輿情咨詢(xún)公司A,開(kāi)始了數(shù)據(jù)之旅。

需要提及的是:

在公關(guān)公司我的認(rèn)識(shí)是:不懂商業(yè),技術(shù)就僅僅只是技術(shù)。

商業(yè)是什么?商業(yè)是別人有某種愿意付費(fèi)交換的需求,如果只停留在后端,你永遠(yuǎn)聆聽(tīng)不到這種需求,再大的金礦此刻也只是一朵浮云。

有一個(gè)深刻的經(jīng)歷:

當(dāng)時(shí)為了豐富網(wǎng)站,需要采集百度內(nèi)容,不停的拼接模擬關(guān)鍵詞結(jié)果URL,無(wú)意發(fā)現(xiàn)可以更改搜索框的下拉聯(lián)想——然后就沒(méi)有然后了,僅是知道這么個(gè)事而已。

后來(lái)在與客戶閑聊的過(guò)程中得知,他們一直在付費(fèi)尋找這種操作方式,通過(guò)改變下拉聯(lián)想來(lái)增大品牌曝光(變相廣告)或者減小品牌曝光(危機(jī)處理)。

從這個(gè)例子來(lái)看,技術(shù)的高深與價(jià)值的大小不是正比關(guān)系,需求是技術(shù)轉(zhuǎn)變?yōu)閮r(jià)值的催化劑。

試想下如果沒(méi)有聽(tīng)到這個(gè)需求,這個(gè)信息可能就駐留在我的腦海,直至遺忘。

當(dāng)然,在技術(shù)人眼里,這件事確實(shí)沒(méi)啥可傲嬌的技術(shù)難度。作為一名程序員,為了所謂的性能、封裝、代碼潔癖,在技術(shù)海洋里深鉆,或許可以成為 一代大牛,同時(shí)也會(huì)被大公司綁架——畢竟不是所有IT公司都有大流量并發(fā)的。這種帶有上吊性色彩的自我感動(dòng),使得碼農(nóng)一邊在拼命各種學(xué)習(xí),然后一邊在吶喊“難道我的未來(lái)就是coding么?不,我不要這樣!”

二、不懂包裝,數(shù)據(jù)就僅僅只是數(shù)據(jù)

在A公司主要負(fù)責(zé)輿情數(shù)據(jù)的采集工作,通過(guò)關(guān)鍵詞的定制匯集各大網(wǎng)站的信息進(jìn)行匯總、統(tǒng)計(jì),進(jìn)而提供給分析師撰寫(xiě)報(bào)告。說(shuō)的直白點(diǎn),通過(guò)網(wǎng)絡(luò)上的公開(kāi)信息,進(jìn)行搜集、整理、二次包裝出新的內(nèi)容閱讀物并進(jìn)行售賣(mài),一套商業(yè)流程結(jié)束。

也就是說(shuō):在輿情產(chǎn)品的生產(chǎn)體系里,原材料是免費(fèi)的,產(chǎn)品是付費(fèi)的,如何提高籌碼就是中間的搜集、整理環(huán)節(jié)。

于是便學(xué)會(huì)了商業(yè)包裝、學(xué)會(huì)了產(chǎn)品設(shè)計(jì)、知道了方法論。

  • 商業(yè)包裝:從源數(shù)據(jù)到售賣(mài)產(chǎn)品,中間還有很多步驟;如何讓報(bào)告更充實(shí),顯得對(duì)得起它的標(biāo)價(jià),商務(wù)流程、外觀美化、話語(yǔ)話術(shù)起碼得專(zhuān)業(yè);
  • 產(chǎn)品設(shè)計(jì):數(shù)據(jù)是公開(kāi)的,用戶是感性的。不同的用戶群有不同的認(rèn)知與使用習(xí)慣,得像市場(chǎng)小販一樣,看人給菜,原料就那么點(diǎn)數(shù),需要變出不同的組合維度,以供饗享;
  • 方法論:不是隨隨便便在搜索引擎上搜到幾篇企業(yè)的負(fù)面信息就得提醒企業(yè)去做危機(jī)預(yù)警的,預(yù)警的多了就不叫預(yù)警,一定得有方法、有科學(xué)依據(jù),同時(shí)還得給出具體的危機(jī)公關(guān)建議;

就這樣,按照碼農(nóng)的自我畫(huà)像:一天不coding,蛋蛋碎到疼,時(shí)間長(zhǎng)了,就有些不安。

同時(shí)自認(rèn)為對(duì)輿情的商業(yè)了解比較深刻:

  1. 輿情監(jiān)測(cè)只能告訴你有病,無(wú)法做到我有藥
  2. 如果體檢能掙1份錢(qián),治療能掙6份錢(qián),國(guó)人更喜歡有病求醫(yī),常態(tài)體檢是達(dá)官貴人(上市公司)的寵物,體檢與治療不能一起抓,否則公正性受質(zhì)疑
  3. 輿情監(jiān)測(cè)不是技術(shù)派的玩物,商業(yè)環(huán)節(jié)是主要瓶頸。隨后去了一家第三方互聯(lián)網(wǎng)數(shù)據(jù)服務(wù)公司B,負(fù)責(zé)網(wǎng)站分析產(chǎn)品的開(kāi)發(fā)和設(shè)計(jì)。

三、不懂執(zhí)行,策略就僅僅只是策略

網(wǎng)站數(shù)據(jù)不同于輿情數(shù)據(jù),在原材料獲取上有一定的競(jìng)爭(zhēng)優(yōu)勢(shì):

通過(guò)在各大媒體網(wǎng)站上的JS布碼,收集到用戶的網(wǎng)站瀏覽數(shù)據(jù),從而進(jìn)行網(wǎng)站分析產(chǎn)品、營(yíng)銷(xiāo)策略、流量認(rèn)證、網(wǎng)站優(yōu)化、廣告效果等業(yè)務(wù)產(chǎn)品輸出。

在這里,編碼能力得到進(jìn)一步提高——以前是用PHP進(jìn)行web開(kāi)發(fā),這里是用PHP+shell+AWK 進(jìn)行日志文件的統(tǒng)計(jì)計(jì)算;數(shù)據(jù)更大了,對(duì)性能要求也更高了。

更重要的是:我的知識(shí)體系里又多了一個(gè)分支——網(wǎng)站數(shù)據(jù)。

由于性格上的某些緣故,同時(shí)還被安排了產(chǎn)品經(jīng)理和售前的工作任務(wù),直接對(duì)接客戶了解需求、設(shè)計(jì)指標(biāo)、規(guī)劃產(chǎn)品。

其中,個(gè)人最有成就感的是負(fù)責(zé)某網(wǎng)站的音視頻評(píng)估項(xiàng)目。

指標(biāo)不多:

  • 有效播放次數(shù)(播放時(shí)間超過(guò)3分鐘的為一次有效播放)
  • 播放時(shí)長(zhǎng)
  • 獨(dú)立IP數(shù)
  • 獨(dú)立用戶數(shù)和來(lái)源
  • 時(shí)間維度分為刻、時(shí)、日、周、月

考核對(duì)象為節(jié)目、欄目和分發(fā)渠道。

網(wǎng)站下分多個(gè)欄目,每個(gè)欄目有自制內(nèi)容節(jié)目,這些內(nèi)容節(jié)目在網(wǎng)站上有直播、點(diǎn)播和視頻播放三種分發(fā)渠道,在手機(jī)APP上也有分發(fā)渠道,該項(xiàng)目就是通過(guò)收集這些節(jié)目在分發(fā)渠道上的用戶行為反饋數(shù)據(jù),來(lái)給網(wǎng)站考核欄目組、各欄目組考核節(jié)目組使用。

這里有幾個(gè)難點(diǎn):

  1. 播放時(shí)間超過(guò)3分鐘的為一次有效播放,因此需要改寫(xiě)收碼JS,在播放狀態(tài)時(shí)每一分鐘回傳一次心跳數(shù)據(jù),用來(lái)判斷播放時(shí)間是否超過(guò)3分鐘;
  2. 數(shù)據(jù)可以累加,大范圍=小范圍之和,某欄目的某月有效播放次數(shù)等于該月該欄目下的所有節(jié)目在各分發(fā)渠道的有效播放次數(shù)之和;
  3. 臨界值處理,如果某個(gè)有效播放跨時(shí)間臨界值了,9:58-10:02,播放時(shí)長(zhǎng)4分鐘,算做一次有效播放,但在時(shí)報(bào)里,9點(diǎn)時(shí)段的播放時(shí)長(zhǎng)為兩分鐘,10點(diǎn)時(shí)段的播放時(shí)長(zhǎng)也為兩分鐘,各自都不計(jì)為有效播放次數(shù);
  4. 移動(dòng)終端的回傳碼定制;

畢竟考核涉及到利益,因此在指標(biāo)計(jì)算以及數(shù)據(jù)的公平性上要求更加嚴(yán)格;數(shù)據(jù)上的多1少1,影響的是客戶對(duì)數(shù)據(jù)公正上的存疑,容不得半點(diǎn)馬虎,每月最頭疼的事就是檢查各種維度的交叉對(duì)比,看看是否一致。

這個(gè)項(xiàng)目教會(huì)了我對(duì)數(shù)據(jù)的敬畏。

類(lèi)似的項(xiàng)目做多了,困擾也來(lái)了。

按理說(shuō)數(shù)據(jù)產(chǎn)品是要跟客戶做價(jià)值交換的,客戶購(gòu)買(mǎi)炒股軟件是想要掙錢(qián)的、購(gòu)買(mǎi)網(wǎng)站分析產(chǎn)品是想提高(購(gòu)買(mǎi))轉(zhuǎn)化的,但是邏輯不通,如果真能達(dá)到目的那數(shù)據(jù)公司還賣(mài)產(chǎn)品做什么?直接做電商就是嘍。

包括最近一些線下交流,不少同行也同樣為此困惑:自己辛勤付出的分析報(bào)告到底能為公司/客戶帶來(lái)多少的價(jià)值收益??jī)?nèi)心自我認(rèn)可,可現(xiàn)實(shí)無(wú)法評(píng)估,只能繼續(xù)重復(fù)。

我的感受:數(shù)據(jù)分析是指將隱沒(méi)在數(shù)據(jù)中的信息,進(jìn)行集中、清洗、提煉并發(fā)現(xiàn)策略的過(guò)程,產(chǎn)出是策略,策略是否有效,需要檢驗(yàn),在給出策略的同時(shí)給出執(zhí)行建議過(guò)程,并協(xié)商好按照這樣的執(zhí)行過(guò)程最后達(dá)到什么狀態(tài)則意為策略有效。有了這樣的生產(chǎn)和檢驗(yàn)流程,數(shù)據(jù)究竟是不是馬后炮也就顯而易見(jiàn)了。

不懂執(zhí)行,策略就僅僅只是策略。

也許有人會(huì)問(wèn):如果分析人員比執(zhí)行人員更懂執(zhí)行,還需要分析人員干嘛?

我這里有個(gè)比較掃興的看法:數(shù)據(jù)分析本非難事,實(shí)質(zhì)是思維邏輯方法,理想的情況下是應(yīng)當(dāng)被融入到產(chǎn)品、運(yùn)營(yíng)、開(kāi)發(fā)、財(cái)務(wù)、老總等一系列職業(yè)角色之內(nèi),只是因?yàn)閿?shù)據(jù)收集、整理比較費(fèi)時(shí)費(fèi)力,那就招一個(gè)人負(fù)責(zé)數(shù)據(jù)收集和整理吧,邊緣與博弈,于是就發(fā)展到現(xiàn)在這樣一個(gè)尷尬的局面。

四、不懂人文,機(jī)器就僅僅只是機(jī)器

現(xiàn)在,我在一家微博數(shù)據(jù)創(chuàng)業(yè)公司,拿網(wǎng)站數(shù)據(jù)、輿情數(shù)據(jù)和微博數(shù)據(jù)做下對(duì)比,如果說(shuō)輿情數(shù)據(jù)側(cè)重信息,網(wǎng)站數(shù)據(jù)側(cè)重用戶(行為),微博數(shù)據(jù)則是信息與用戶的統(tǒng)一體。

更重要的是:這里的分析維度偏重社科人文。

舉個(gè)例子:

網(wǎng)站數(shù)據(jù)是以用戶的瀏覽行為來(lái)定義cookie的興趣;微博數(shù)據(jù)則是以用戶的關(guān)注對(duì)象、微博內(nèi)容、互動(dòng)行為來(lái)定義興趣。微博用戶關(guān)注了什么人,看到了什么內(nèi)容,因此發(fā)了一條怎樣的感慨,被他的小伙伴們進(jìn)行互動(dòng)影響又變成了怎樣的認(rèn)識(shí),他關(guān)注的人為何發(fā)布這樣的信息?是否也經(jīng)歷了這樣的影響過(guò)程?

這,絕不是簡(jiǎn)單的線性思考方式,更多了一些復(fù)雜人性的味道。

不懂人文,機(jī)器就僅僅只是機(jī)器。

社交網(wǎng)絡(luò)還有很多答案沒(méi)有解決,包括分析維度和產(chǎn)品模式,也這是因?yàn)榇?,憑添了許多探索與樂(lè)趣。

五、總結(jié)

回顧一下:

我的數(shù)據(jù)從業(yè)歷程是從輿情咨詢(xún)公司切入,那里有稍微學(xué)術(shù)點(diǎn)的指標(biāo)體系和方法論;然后在數(shù)據(jù)服務(wù)公司提升,那里有落地的技術(shù)實(shí)現(xiàn)方法;最后在微博數(shù)據(jù)創(chuàng)業(yè)公司回爐,將之前的知識(shí)體系進(jìn)行應(yīng)用和整合;一直靠近商業(yè)交易環(huán)節(jié),所以更能深刻體會(huì)業(yè)務(wù)和產(chǎn)品對(duì)于數(shù)據(jù)變現(xiàn)的重要性。

大數(shù)據(jù)變化的只是數(shù)據(jù)的存儲(chǔ)和技術(shù)處理環(huán)節(jié),對(duì)于商業(yè),最終比拼的還是產(chǎn)品創(chuàng)新和商務(wù)運(yùn)營(yíng)能力,如何讓數(shù)據(jù)實(shí)打?qū)嵉漠a(chǎn)生價(jià)值,簡(jiǎn)單粗暴回饋商業(yè),愿與各位一同探索,迎接數(shù)據(jù)行業(yè)真正的春天。

就在快收尾的時(shí)候,看到Q群有人分享了這樣 一句話:

“人生是一場(chǎng)艱難的考試,很多人沒(méi)考好是因?yàn)樗麄円恢痹诔瓌e人的答案,卻沒(méi)注意到每個(gè)人的卷子都不一樣…

本文的目的就是展開(kāi)我的考卷,也期待您的考卷!

相關(guān)閱讀

夢(mèng)想與前行:一名數(shù)據(jù)人的自白(下)

 

本文由 @老七 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash ,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 不懂是我比較困,還是什么,沒(méi)看懂 ??

    來(lái)自福建 回復(fù)