大數(shù)據(jù)預測:4個特征,11個典型行業(yè)

易卿
0 評論 22269 瀏覽 15 收藏 16 分鐘
🔗 B端产品经理需要更多地关注客户的商业需求、痛点、预算、决策流程等,而C端产品经理需要更多地关注用户的个人需求

本文作者羅超 編輯 reMake

世界杯期間各家科技巨頭利用大數(shù)據(jù)預測比賽結(jié)果,再現(xiàn)“章魚保羅”雄風。世界杯結(jié)束了但大數(shù)據(jù)預測還會繼續(xù)。從夜觀天象到氣象預報,從童話里的水晶球到今日的科技預言家,從地震云的傳說再到科學家猛攻的地震預測,人類一直希望能夠更早突破局限看穿未來。隨著信息革命的深入,大數(shù)據(jù)時代的預測更加容易,人類的生活正在被大數(shù)據(jù)預測深刻改變。

預測是大數(shù)據(jù)核心價值

人們在談論大數(shù)據(jù)的采集、存儲和挖掘時,最常見的應用案例便是“預測股市”“預測流感”“預測消費者行為”,預測性分析是大數(shù)據(jù)最核心的功能。

大數(shù)據(jù)還擁有數(shù)據(jù)可視化和大數(shù)據(jù)挖掘的功能,對已發(fā)生的信息價值進行挖掘并輔助決策。傳統(tǒng)的數(shù)據(jù)分析挖掘在做相似的事情,只不過效率會低一些或者說挖掘的深度、廣度和精度不夠。大數(shù)據(jù)預測則是基于大數(shù)據(jù)和預測模型去預測未來某件事情的概率。讓分析從“面向已經(jīng)發(fā)生的過去”轉(zhuǎn)向“面向即將發(fā)生的未來”是大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)分析的最大不同。

大數(shù)據(jù)預測的邏輯基礎是,每一種非常規(guī)的變化事前一定有征兆,每一件事情都有跡可循,如果找到了征兆與變化之間的規(guī)律,就可以進行預測。大數(shù)據(jù)預測無法確定某件事情必然會發(fā)生,它更多是給出一個概率。

從天氣預報看大數(shù)據(jù)預測的四個條件

在互聯(lián)網(wǎng)之前便已經(jīng)有基于大數(shù)據(jù)的預測分析了:天氣預報。因為互聯(lián)網(wǎng),天氣預報為代表的大數(shù)據(jù)預測的以下幾個特征在更多領域得到體現(xiàn)。

1、大數(shù)據(jù)預測的時效性。天氣預報粒度從天縮短到小時,有嚴苛的時效要求,基于海量數(shù)據(jù)通過傳統(tǒng)方式進行計算,得出結(jié)論時明天早已到來,預測并無價值。其他領域的大數(shù)據(jù)預測應用特征對“時效性”有更高要求,譬如股市、實時定價,而云計算、分布式計算和超級計算機的發(fā)展則提供了這樣的高速計算能力。

2、大數(shù)據(jù)預測的數(shù)據(jù)源。天氣預報需要收集海量氣象數(shù)據(jù),氣象衛(wèi)星、氣象站臺負責收集,但整套系統(tǒng)的部署和運維耗資巨大。在互聯(lián)網(wǎng)之前鮮有領域具備這樣的數(shù)據(jù)收集能力。WEB1.0為中心化信息產(chǎn)生、WEB2.0為社會化創(chuàng)造、移動互聯(lián)網(wǎng)則是隨時隨地、社會化和多設備的數(shù)據(jù)上傳,每一次演化數(shù)據(jù)收集的成本都大幅降低,范圍和規(guī)模則大幅擴大。大數(shù)據(jù)被引爆的同時,大數(shù)據(jù)預測所需數(shù)據(jù)源不再是問題。

3、大數(shù)據(jù)預測的動態(tài)性。不同時點的計算因子動態(tài)變化,任何變量都會引發(fā)整個系統(tǒng)變化,甚至產(chǎn)生蝴蝶效應。如果某個變量對結(jié)果起決定性作用且難以捕捉,預測難上加難,譬如人為因素。大數(shù)據(jù)預測的應用場景大都是極不穩(wěn)定的領域但有固定規(guī)律,譬如天氣、股市、疾病。這需要預測系統(tǒng)對每一個變量數(shù)據(jù)的精準捕捉,并接近實時地調(diào)整預測。發(fā)達的傳感器網(wǎng)絡外加大數(shù)據(jù)計算能力讓上述兩點更加容易。

4、大數(shù)據(jù)預測的規(guī)律性。大數(shù)據(jù)預測與傳統(tǒng)的基于抽樣的預測不同之處在于,其基于海量歷史數(shù)據(jù)和實時動態(tài)數(shù)據(jù),發(fā)現(xiàn)數(shù)據(jù)與結(jié)果之間的規(guī)律,并假設此規(guī)律會延續(xù),捕捉到變量之后進行預測。一個領域本身便有相對穩(wěn)定的規(guī)律,大數(shù)據(jù)預測才有機會得到應用。古人夜觀天象就說明天氣是由規(guī)律可循的,因此氣象預報最早得到應用。反面案例則是規(guī)律難以捉摸,數(shù)據(jù)源收集困難的地震預測,還有雙色球彩票。

大數(shù)據(jù)預測的典型應用領域

互聯(lián)網(wǎng)給大數(shù)據(jù)預測應用的普及帶來了便利條件。天氣預報之外,還有哪些領域正在或者可能被大數(shù)據(jù)預測所改變呢?結(jié)合國內(nèi)外案例來看,以下11個領域是最有機會的大數(shù)據(jù)預測應用領域。

1、體育賽事預測

世界杯期間,谷歌、百度、微軟和高盛等公司都推出了比賽結(jié)果預測平臺。百度預測結(jié)果最為亮眼,預測全程 64 場比賽,準確率為 67%,進入淘汰賽后準確率為 94%?,F(xiàn)在互聯(lián)網(wǎng)公司取代章魚保羅試水賽事預測也意味著未來的體育賽事會被大數(shù)據(jù)預測所掌控。

Google 世界杯預測基于 Opta Sports 的海量賽事數(shù)據(jù)來構(gòu)建其最終的預測模型。百度則是搜索過去 5 年內(nèi)全世界 987 支球隊(含國家隊和俱樂部隊)的 3.7 萬場比賽數(shù)據(jù),同時與中國彩票網(wǎng)站樂彩網(wǎng)、歐洲必發(fā)指數(shù)數(shù)據(jù)供應商 Spdex 進行數(shù)據(jù)合作,導入博彩市場的預測數(shù)據(jù),建立了一個囊括 199972 名球員和 1.12 億條數(shù)據(jù)的預測模型,并在此基礎上進行結(jié)果預測。

從互聯(lián)網(wǎng)公司的成功經(jīng)驗來看,只要有體育賽事歷史數(shù)據(jù),并且與指數(shù)公司進行合作,便可以進行其他賽事的預測,譬如歐冠、NBA等賽事。

2、股票市場預測

去年英國華威商學院和美國波士頓大學物理系的研究發(fā)現(xiàn),用戶通過谷歌搜索的金融關鍵詞或許可以金融市場的走向,相應的投資戰(zhàn)略收益高達 326%。此前則有專家嘗試通過 Twitter 博文情緒來預測股市波動。

理論上來講股市預測更加適合美國。中國股票市場無法做到雙向盈利,只有股票漲才能盈利,這會吸引一些游資利用信息不對稱等情況人為改變股票市場規(guī)律,因此中國股市沒有相對穩(wěn)定的規(guī)律則很難被預測,且一些對結(jié)果產(chǎn)生決定性影響的變量數(shù)據(jù)根本無法被監(jiān)控。

3、市場物價預測

CPI 表征已經(jīng)發(fā)生的物價浮動情況,但統(tǒng)計局數(shù)據(jù)并不權(quán)威。但大數(shù)據(jù)則可能幫助人們了解未來物價走向,提前預知通貨膨脹或經(jīng)濟危機。最典型的案例莫過于馬云通過阿里 B2B 大數(shù)據(jù)提前知曉亞洲金融危機,當然這是阿里數(shù)據(jù)團隊的功勞。

單個商品的價格預測更加容易,尤其是機票這樣的標準化產(chǎn)品,去哪兒提供的“機票日歷”就是價格預測,告知你幾個月后機票的大概價位。商品的生產(chǎn)、渠道成本和大概毛利在充分競爭的市場中是相對穩(wěn)定的,與價格相關的變量相對固定,商品的供需關系在電子商務平臺可實時監(jiān)控,因此價格可以預測,基于預測結(jié)果可提供購買時間建議,或者指導商家進行動態(tài)價格調(diào)整和營銷活動以利益最大化。

5、用戶行為預測

基于用戶搜索行為、瀏覽行為、評論歷史和個人資料等數(shù)據(jù),互聯(lián)網(wǎng)業(yè)務可以洞察消費者的整體需求,進而進行針對性的產(chǎn)品生產(chǎn)、改進和營銷。《紙牌屋》選擇演員和劇情、百度基于用戶喜好進行精準廣告營銷、阿里根據(jù)天貓用戶特征包下生產(chǎn)線定制產(chǎn)品、亞馬遜預測用戶點擊行為提前發(fā)貨均是受益于互聯(lián)網(wǎng)用戶行為預測。

受益于傳感器技術(shù)和物聯(lián)網(wǎng)的發(fā)展,線下的用戶行為洞察正在醞釀。免費商用WIFI、ibeacon技術(shù)、攝像頭影像監(jiān)控、室內(nèi)定位技術(shù)、NFC 傳感器網(wǎng)絡、排隊叫號系統(tǒng),可以探知用戶線下的移動、停留、出行規(guī)律等數(shù)據(jù),進行精準營銷或者產(chǎn)品定制。

6、人體健康預測

中醫(yī)可以通過望聞問切手段發(fā)現(xiàn)一些人體內(nèi)隱藏的慢性病,甚至看體質(zhì)便可知曉一個人將來可能會出現(xiàn)什么癥狀。人體體征變化有一定規(guī)律,而慢性病發(fā)生前人體已經(jīng)會有一些持續(xù)性異常。理論上來說,如果大數(shù)據(jù)掌握了這樣的異常情況,便可以進行慢性病預測。

結(jié)合智能硬件,慢性病的大數(shù)據(jù)預測變?yōu)榭赡堋?纱┐髟O備和智能健康設備幫助網(wǎng)絡收集人體健康數(shù)據(jù),心率、體重、血脂、血糖、運動量、睡眠量等狀況。如果這些數(shù)據(jù)足夠精準且全面,并且有可以形成算法的慢性病預測模式,或許未來你的設備就會提醒你的身體罹患某種慢性病的風險。KickStarter 上的 My Spiroo 便可收集哮喘病人的吐氣數(shù)據(jù)來指導醫(yī)生診斷其未來的病情趨勢。急性病卻很難預測,突變和隨機性特征使之難以預測。

7、疾病疫情預測

基于人們的搜索情況、購物行為預測大面積疫情爆發(fā)的可能性,最經(jīng)典的“流感預測”便屬于此類。如果來自某個區(qū)域的“流感”、“板藍根”搜索需求越來越多,自然可以推測該處有流感趨勢。

繼世界杯、高考、景點和城市預測之后,百度近日推出了疾病預測產(chǎn)品。目前可以就流感、肝炎、肺結(jié)核、性病這四種疾病,對全國每一個省份以及大多數(shù)地級市和區(qū)縣的活躍度、趨勢圖等情況,進行全面的監(jiān)控。未來,百度疾病預測監(jiān)控的疾病種類將從目前的4種擴展到30多種,覆蓋更多的常見病和流行病。用戶可以根據(jù)當?shù)氐念A測結(jié)果進行針對性的預防。

8、災害災難預測

氣象預測是最典型的災難災害預測。地震、洪澇、高溫、暴雨這些自然災害如果可以利用大數(shù)據(jù)能力進行更加提前的預測和告知便有助于減災防災救災賑災。與過往不同的是,過去的數(shù)據(jù)收集方式存在著死角、成本高等問題,物聯(lián)網(wǎng)時代可以借助廉價的傳感器攝像頭和無線通信網(wǎng)絡,進行實時的數(shù)據(jù)監(jiān)控收集,再利用大數(shù)據(jù)預測分析,做到更精準的自然災害預測。

9、環(huán)境變遷預測

除了進行短時間微觀的天氣、災害預測之外,還可以進行更加長期和宏觀的環(huán)境和生態(tài)變遷預測。森林和農(nóng)田面積縮小、野生動物植物瀕危、海岸線上升,溫室效應這些問題是地球面臨的“慢性問題“。如果人類知道越多地球生態(tài)系統(tǒng)以及天氣形態(tài)變化數(shù)據(jù),就越容易模型化未來環(huán)境的變遷,進而阻止不好的轉(zhuǎn)變發(fā)生。而大數(shù)據(jù)幫助人類收集、儲存和挖掘更多的地球數(shù)據(jù),同時還提供了預測的工具。

10、交通行為預測

基于用戶和車輛的 LBS 定位數(shù)據(jù),分析人車出行的個體和群體特征,進行交通行為的預測。交通部門可預測不同時點不同道路的車流量進行智能的車輛調(diào)度,或應用潮汐車道;用戶則可以根據(jù)預測結(jié)果選擇擁堵幾率更低的道路。

百度基于地圖應用的 LBS 預測涵蓋范圍更廣。春運期間預測人們的遷徙趨勢指導火車線路和航線的設置,節(jié)假日預測景點的人流量指導人們的景區(qū)選擇,平時還有百度熱力圖來告訴用戶城市商圈、動物園等地點的人流情況,指導用戶出行選擇和商家的選點選址。

11、能源消耗預測

加州電網(wǎng)系統(tǒng)運營中心管理著加州超過 80% 的電網(wǎng),向 3500 萬用戶每年輸送 2.89 億兆瓦電力,電力線長度超過 25000 英里。該中心采用了 Space-Time Insight 的軟件進行智能管理,綜合分析來自包括天氣、傳感器、計量設備等各種數(shù)據(jù)源的海量數(shù)據(jù),預測各地的能源需求變化,進行智能電能調(diào)度,平衡全網(wǎng)的電力供應和需求,并對潛在危機做出快速響應。中國智能電網(wǎng)業(yè)已在嘗試類似大數(shù)據(jù)預測應用。

對于單個家庭來說則可以通過智能家居設備,記錄家庭成員的起居習慣,感知用戶的舒適度,預測用戶的溫控能耗需求,進行智能的溫控裝置控制,還可結(jié)合階梯電價表來幫助用戶省錢。Nest正式基于大數(shù)據(jù)預測用戶能耗需求的成功產(chǎn)品。

除了上面列舉的 10 多個領域之外,大數(shù)據(jù)預測還可被應用在房地產(chǎn)預測、就業(yè)情況預測、高考分數(shù)線預測、選舉結(jié)果預測、奧斯卡大獎預測、保險投保者風險評估、金融借貸者還款能力評估等等,讓人類具備可量化有說服力可驗證的洞察未來的能力,大數(shù)據(jù)預測的魅力正在釋放出來。

轉(zhuǎn)載自:TECH2IPO創(chuàng)見

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!