數(shù)據(jù)分析實(shí)戰(zhàn)|人人都是產(chǎn)品經(jīng)理網(wǎng)站(上篇):平臺(tái)視角

17 評(píng)論 17010 瀏覽 118 收藏 24 分鐘

干貨滿滿的上篇,不僅僅是一篇數(shù)據(jù)分析,相信你將對(duì)人人都是產(chǎn)品經(jīng)理的網(wǎng)站和發(fā)展會(huì)有新認(rèn)識(shí),歡迎指導(dǎo)交流~

起因

看了幾年的人人都是產(chǎn)品經(jīng)理(以下本文中簡稱人人),從來只是個(gè)看客和學(xué)習(xí)者。最近因?yàn)楸容^閑,也在總結(jié)這幾年來的工作心得。近一個(gè)月前終于有了第一次投稿,如何通過小程序和微信社群來構(gòu)建產(chǎn)品運(yùn)營體系?上過人人的微信頭條,每天都能有幾個(gè)新的訂閱用戶,這些都在告訴在我這一點(diǎn)付出還是能夠幫助到其他人的。

但我一直很好奇它具體在人人的過往文章中到底是個(gè)什么水平,我心里沒有底。所以出于好奇,就有了這次數(shù)據(jù)分析的探索之旅。

內(nèi)容安排

學(xué)過數(shù)據(jù)分析的同學(xué)肯定在最開始都有這樣的體會(huì),手中有了錘子,看什么都像釘子。所以好久沒做數(shù)據(jù)分析,手癢一下子抓取并分析了一大堆數(shù)據(jù),遠(yuǎn)遠(yuǎn)超過了最初的目的。

所以開始構(gòu)思如何寫這篇文章的時(shí)候,做了如下思考:

  1. 人人是由哪些角色構(gòu)成?
  2. 這些角色都想知道些什么?
  3. 能否通過現(xiàn)有的數(shù)據(jù)給出這些答案?

綜合考慮以上問題和文章篇幅后,大致擬出如下圖所示框架:

  • 左邊為人人官方平臺(tái)角度,換位思考,如果我是運(yùn)營,首先會(huì)比較關(guān)系平臺(tái)的內(nèi)容循環(huán)體系是否正常,其次內(nèi)容是否帶來足夠的收益;
  • 右邊為用戶角度,就是普通的網(wǎng)站訪問者,同時(shí)根據(jù)身份又分為讀者和作者,讀者想的是能夠找到自己想要的內(nèi)容,作者是想的是自己的作品是否受到大家的關(guān)注;

這是兩個(gè)角度,三種角色的基本思考,而本篇?jiǎng)t會(huì)由左邊開始,下篇會(huì)講右邊。

數(shù)據(jù)介紹

1. 開發(fā)環(huán)境

基本的數(shù)據(jù)分析工具就如下圖所示:

2. 數(shù)據(jù)獲取

因?yàn)椴皇菍懡坛蹋疫^程也很簡單,這里只是簡單的提一下。使用Python寫一個(gè)For循環(huán)請求網(wǎng)站的一個(gè)分頁加載接口,就能夠獲得所有的網(wǎng)站文章數(shù)據(jù)(Json格式),再將所有的Json數(shù)據(jù)合并整理成相應(yīng)的列表。

其中接口返回的原始數(shù)據(jù)項(xiàng)比較豐富,選取其中比較有價(jià)值和便于分析的,如下表示:

3. 數(shù)據(jù)總覽

在獲得數(shù)據(jù)后,第一時(shí)間就先看看整體的數(shù)據(jù)情況。時(shí)間有限就不去做些漂亮可視畫展示啦,總覽數(shù)據(jù)就如下表所示:

只看以上數(shù)據(jù),我上一篇的數(shù)據(jù)無論是5K的閱讀量還是收藏點(diǎn)贊都還沒有達(dá)到平均值,離好文章都還有一些距離,這組數(shù)據(jù)能解決我的基本困惑。但對(duì)于整體的運(yùn)營情況和前文提出的一些分析目標(biāo)來說還遠(yuǎn)遠(yuǎn)不夠,所以還需要后文的深入分析。

4. 正式開始分析前對(duì)數(shù)據(jù)的一點(diǎn)說明

  1. 數(shù)據(jù)僅采集自首頁文章列表展示數(shù)據(jù),僅用于學(xué)習(xí)和投稿人人的寫作,不做何商業(yè)用途。
  2. 本文數(shù)據(jù)采集自2018年8月16號(hào),一切記錄數(shù)據(jù)以當(dāng)天為準(zhǔn)。
  3. 文章數(shù)據(jù)并不能保證嚴(yán)格正確和全面,比如:9月2號(hào)再次采集時(shí),文章數(shù)量比8月16號(hào)的還少,應(yīng)該是下架了一些文章,但對(duì)于本次分析人人的網(wǎng)站大體情況應(yīng)該是沒有問題的。
  4. 為了不給人人主站造成不必要的網(wǎng)絡(luò)負(fù)擔(dān),如果有需要原始數(shù)據(jù)的同學(xué)可以在后面留言郵箱,或者在我的個(gè)人網(wǎng)站中尋找。

了解以上,讓我們正式開始。

平臺(tái)運(yùn)營淺析

初步分析人人主站的主要業(yè)務(wù)邏輯如下圖所示。

  1. 由作者發(fā)表文章
  2. 吸引用戶產(chǎn)生流量
  3. 部分讀者會(huì)轉(zhuǎn)化成作者、生產(chǎn)獨(dú)家內(nèi)容,以此來構(gòu)成一個(gè)能夠長期、穩(wěn)定的內(nèi)容發(fā)布體系。在此之后的,通過流量發(fā)布廣告,讀者帶來的口碑換取第三方合作、課程轉(zhuǎn)化等,都是在這之上的業(yè)務(wù)邏輯,分支太多,不可能面面俱到,所以點(diǎn)到即止。

再根據(jù)實(shí)際的數(shù)據(jù)情況,并沒有直接的讀者UV數(shù)據(jù),所以僅對(duì)以下兩條業(yè)務(wù)線進(jìn)行分析:

  • 業(yè)務(wù)線1:多少作者產(chǎn)生了多少投稿;
  • 業(yè)務(wù)線2:投稿的文章帶來了多少閱讀量進(jìn)行分析。

投稿來源

相信大家在看數(shù)據(jù)總覽中能看到,投稿作者的身份多達(dá)23種,依次是:站長、運(yùn)營小編、官方、專欄作家、運(yùn)營小哥、運(yùn)營小妹、普通用戶、設(shè)計(jì)小妹、運(yùn)營、合作媒體、編輯、作者、萌妹子、主編、女神、男神2、臨時(shí)工、特邀作者、運(yùn)營哥、美少女、CV工程師、合作出版社、小編妹妹。

是不是眼花繚亂,群魔亂舞?

這里我根據(jù)后面的實(shí)際情況對(duì)相應(yīng)的身份進(jìn)行了些合并。

所以這里需要吐槽和需要改進(jìn)的自然就是平臺(tái)運(yùn)營小編們對(duì)自己的角色定位了,只從命名上看得出來應(yīng)該是后臺(tái)的管理有些混亂,最初來一個(gè)新人就想當(dāng)然的給了自己一個(gè)title?;蛘哒f人人當(dāng)初有自己的培養(yǎng)明細(xì)寫手的打算,所以預(yù)留了一些特殊的職位和身份?

Q1. 各階段的投稿主力是誰?

OK,吐槽完作者身份后,進(jìn)入到第一個(gè)問題。那就是人人上面的文章都是從哪兒來的,或者說是誰投的稿?

在對(duì)作者身份進(jìn)行合并后,如下圖所示的是2012~2018年,投稿數(shù)量分布熱力圖:

這里不僅對(duì)各時(shí)期的投稿主力看得很清楚,甚至可以清晰看到人人的主業(yè)務(wù)搭建過程:

  1. 最初是由站長在2012年完成了大量的投稿(轉(zhuǎn)載),構(gòu)建了網(wǎng)站的基本內(nèi)容(可能是有一些網(wǎng)站的改版,因?yàn)槿巳藢?shí)際從2010年就開始運(yùn)營了);
  2. 在2013年開始,大量團(tuán)隊(duì)成員的加入后,轉(zhuǎn)為團(tuán)隊(duì)運(yùn)營的方式,而站長由此開始退居隱退,并且在網(wǎng)站上投稿的用戶明顯增多;
  3. 之后一年團(tuán)隊(duì)?wèi)?yīng)該過得挺辛苦的,平均每天團(tuán)隊(duì)成員需要投稿15.3篇,只算工作日251天的話,大約27篇,雖然不知道團(tuán)隊(duì)成員多少,但至少在2014.11月拿到融資之前團(tuán)隊(duì)成員應(yīng)該不會(huì)太多。即便轉(zhuǎn)載,也會(huì)有相當(dāng)?shù)亩尉庉嫻ぷ髁浚?/li>
  4. 2015年大約是通過對(duì)普通作者的發(fā)掘,將部分投稿用戶轉(zhuǎn)為了專欄作家,激發(fā)了用戶的投稿積極性,使專欄作家的投稿量有了質(zhì)的飛躍。當(dāng)然,這里有個(gè)問題可能在于用戶在最初投稿時(shí)為普通用戶,但在之后轉(zhuǎn)為專欄作者,將部分原應(yīng)該歸到普通作者的數(shù)據(jù)分到了專欄作家中;
  5. 之后的兩年就相當(dāng)平衡了,更多的普通用戶投稿說明對(duì)平臺(tái)的品牌認(rèn)可,且源源不斷的提供更多的專欄作者,以維持穩(wěn)定的內(nèi)容輸出。

整體來看,之前說的主業(yè)務(wù)體系目前應(yīng)該是比較穩(wěn)定且完整的。2018年的數(shù)據(jù)目前還不好說,但專欄作家的流失的趨勢有點(diǎn)明顯,可能需要一些激勵(lì)計(jì)劃。

Q2. 用戶的投稿次數(shù)分布

從內(nèi)容生產(chǎn)的角度來說,普通用戶和專欄作家投稿屬于UGC內(nèi)容,平臺(tái)運(yùn)營內(nèi)容屬于PGC內(nèi)容。PGC內(nèi)容可以根據(jù)團(tuán)隊(duì)運(yùn)營的情況來調(diào)整,而UGC內(nèi)容則需要通過適當(dāng)?shù)募?lì)手段來保持。

而且之前在數(shù)據(jù)總覽中能看到這樣一組數(shù)據(jù):

  • 作者總數(shù)4138名;
  • 人均投遞11.9篇/人;
  • 投遞偏差值為91.7。

如此大的偏差值,能夠多次投稿的用戶數(shù)量并不多,而實(shí)際的情況也如下圖所示(僅普通用戶和專欄作家):

那么在普通的吃瓜群從中,加了V的專欄作家是否真的有做出比普通用戶更多的投稿呢?

為了接下來的分析和數(shù)據(jù)展示,將對(duì)用戶的投稿數(shù)量做了出以下分組:

再加上投稿作者的身份,結(jié)果如下圖所示:

  1. 絕大部分的的專欄作家完成了至少5篇以上的投稿,且L20的專家用戶完成了相當(dāng)?shù)耐陡辶浚?/li>
  2. 從普通用戶L20中可以看到人人確實(shí)把相當(dāng)一部分用戶轉(zhuǎn)成了專欄作家,而且通過具體數(shù)據(jù)查看,此類剩余未轉(zhuǎn)化的用戶大部分只是轉(zhuǎn)載;
  3. 普通用戶L2到L6之間有道坎,這個(gè)我現(xiàn)在自己寫作也深有體會(huì),對(duì)于用戶來說一時(shí)興起寫一兩篇沒有問題,但難的是如何堅(jiān)持;
  4. 從此數(shù)據(jù)中無法直接得出普通作者轉(zhuǎn)成專欄作家后,能夠持續(xù)投稿,缺乏用戶身份轉(zhuǎn)變的時(shí)間,故不再做進(jìn)一步分析。

雖然有些不完美,但確實(shí)是20%的用戶解決了80%的問題。

Q3. 用戶的投稿偏好

最后我們來看一看用戶喜歡投哪些類型的稿件,普通用戶的投稿一般是興趣始然,或者是來自自己的工作內(nèi)容的總結(jié)、經(jīng)驗(yàn)分享。所以這個(gè)分析將將可能得出產(chǎn)品經(jīng)理們的能力變化和工作變化。

從左往右按年份來看:

  1. 2012~2015可能還是產(chǎn)品經(jīng)理在行業(yè)內(nèi)剛開始冒頭的時(shí)候,所以產(chǎn)品經(jīng)理的主要工作:產(chǎn)品設(shè)計(jì)、產(chǎn)品運(yùn)營、產(chǎn)品經(jīng)理大家都還不太敢寫,或者說能寫的人還很少,主要就是分析行業(yè)和轉(zhuǎn)載報(bào)道當(dāng)前的行業(yè)趨勢;
  2. 2016開始才品類豐富起來,應(yīng)該算是產(chǎn)品經(jīng)理行業(yè)開始變得成熟的一個(gè)分界點(diǎn),在這之后,產(chǎn)品設(shè)計(jì)、產(chǎn)品運(yùn)營、產(chǎn)品經(jīng)理的投稿才變得豐富起來,畢竟有經(jīng)驗(yàn)的開始多了起來;
  3. 營銷推廣、文案策劃、新零售、AI人工智能直到今年才有投稿,應(yīng)該是最初沒有分類造成的,也應(yīng)該是相應(yīng)的內(nèi)容開始集中出現(xiàn)的結(jié)果。

不過這個(gè)分類是人人運(yùn)營自己做的,很明顯還是有些問題。分類來得有些晚,至少熱點(diǎn)已經(jīng)過了,或者因?yàn)闆]有分類可以選就在一些大項(xiàng)里湊合一下,將會(huì)造成文章索引困難,值得優(yōu)化一下。

內(nèi)容收益

網(wǎng)站上有了內(nèi)容,那就需要看看這些內(nèi)容所能夠帶來的收益。與很多實(shí)時(shí)類的新聞不同點(diǎn)在于,人人是個(gè)比較專業(yè)又垂直的網(wǎng)站,里面的內(nèi)容是會(huì)沉淀的,即使是幾年前的文章也會(huì)被用戶找出來進(jìn)行查閱,而且有相當(dāng)多的引導(dǎo)和內(nèi)容聚合,可以將新用戶直接導(dǎo)入到有價(jià)值的老文章上來。

所以需要注意,在接下來的文章收益里的幾個(gè)數(shù)據(jù):閱讀、點(diǎn)贊、收藏和評(píng)論都是一個(gè)累積量,不能當(dāng)做PV和UV來進(jìn)行參考。

Q4. 各時(shí)期的文章對(duì)用戶吸引力

有了之前對(duì)數(shù)據(jù)的說明和理解,這里將要計(jì)算的是各時(shí)間點(diǎn)下,不同分類的文章對(duì)閱讀量的收益是如何分布的。對(duì)于網(wǎng)站來說,歷史內(nèi)容也是可以增加點(diǎn)擊量的,而不時(shí)間的最終閱讀量均值。

如下圖所示:

(1)2018年,除了招聘信息,所有類型的文章的閱讀量都比之前低,有以下幾種可能:

  1. 有經(jīng)驗(yàn)的產(chǎn)品經(jīng)理越來越多,所以大家挑著看;
  2. 產(chǎn)品經(jīng)理的人數(shù)和熱度在減少;
  3. 產(chǎn)品經(jīng)理的崗位也在也在減少;
  4. 優(yōu)質(zhì)的內(nèi)容不如之前的多,所以新用戶會(huì)導(dǎo)入到老文章上來,新文章反而快速的沉沒;

具體是哪種,可能還需要直接從管理后臺(tái)查看日活,月活比較說明問題。

(2)對(duì)于平臺(tái)來說,只要能吸引到用戶和點(diǎn)擊量就是好內(nèi)容,從上圖中顯而易見的:干貨下載和原型設(shè)計(jì)這兩個(gè)入門級(jí)的分類文章始終是最能吸引用戶點(diǎn)擊的,這種歷史內(nèi)容實(shí)際只能通過搜索來反饋,可以更突出一點(diǎn)。

(3)AI人工智能,區(qū)塊鏈這些新技術(shù)的閱讀量都出現(xiàn)了大量的下滑,說明大家對(duì)這些新領(lǐng)域并不看好。而還有很多新的發(fā)展趨勢卻沒有體現(xiàn)出來,有點(diǎn)可惜,這一點(diǎn)之前已經(jīng)提過了。

Q5. 各時(shí)期的投稿質(zhì)量如何

剛剛Q4的分析中,僅是從閱讀量均值來查看。但有經(jīng)驗(yàn)的同學(xué)肯定知道,很多標(biāo)題黨也可以直接收獲不錯(cuò)的點(diǎn)擊。所以接下來這里我們需要更嚴(yán)格一點(diǎn),將閱讀、點(diǎn)贊、收藏、評(píng)論都放在一起進(jìn)行考量。

這里再具體看一下相關(guān)的統(tǒng)計(jì)數(shù)據(jù):

數(shù)值上的差距還是相當(dāng)大,所以這里我們?yōu)榱私y(tǒng)計(jì)和展示方便,做了以下數(shù)據(jù)處理:

  1. 將四項(xiàng)屬性按低于25%的值評(píng)定為Low,高于75%的評(píng)定為High,其余為Mid進(jìn)行分組。反過來說,如果一篇文章的某一項(xiàng)屬性評(píng)定為High,意味著它的這一項(xiàng)屬性是超過75%的文章的。
  2. 然后逐月計(jì)算將相應(yīng)月份里,分別計(jì)算四個(gè)屬性中為High的比例,比如:2017年1月份投稿100篇,得出有20篇閱讀量為High,10篇點(diǎn)贊量為High,那么只記錄相應(yīng)的高閱讀和高點(diǎn)贊比例分別為0.2和0.1。

結(jié)果如下圖所示:其中四條線是取值為[0,1]之間的比例,為了不與下方的投稿量過于干擾進(jìn)行了放大處理,下面的bars則是當(dāng)月的投稿數(shù)量。需要解釋一下的是,因?yàn)楦哔|(zhì)量的文章并沒有統(tǒng)一標(biāo)準(zhǔn),所以這里并沒有對(duì)數(shù)據(jù)進(jìn)行合并,而采取的是人工觀察和感性分析。

最左邊的一條并不是數(shù)據(jù)出錯(cuò)了,而是早期站長批量導(dǎo)入,然后之前一直沒提的就是整體投稿量一直呈現(xiàn)上升趨勢。

高閱讀量卻沒有相應(yīng)的點(diǎn)贊和收藏,所以這里從2015年3月和4月取幾個(gè)標(biāo)題,大家感受一下:

  1. 從汪涵救場看產(chǎn)品經(jīng)理的危機(jī)處理
  2. 滴滴拉屎App,估值100億美金!
  3. 快滴拉屎PK滴滴拉屎,拉屎App的愛恨情仇
  4. 在網(wǎng)易實(shí)習(xí)是種什么體驗(yàn)?

2016年1~3月則是有大量讀者需要的部分,大致邏輯為首頁或者近期沒有用戶需要的,特別是新入門的產(chǎn)品經(jīng)理,會(huì)比較急于想要找到自己想要的,所以會(huì)使用到搜索功能,然后小白的大量相似需求會(huì)推高相應(yīng)的結(jié)果,而且為了之后的閱讀查找,優(yōu)先點(diǎn)擊收藏。

2016年10月的投稿量不多,但似乎文章質(zhì)量普遍很好,如果是取四個(gè)值的均值來看也是全期最高的。之后新文章的數(shù)據(jù)會(huì)受到時(shí)間的影響,但整體文章質(zhì)量趨于穩(wěn)定,高閱讀量的文章會(huì)帶來高贊和收藏,而新讀者從評(píng)論的角度上來說更活躍一些。

Q6. 作者帶來的收益

根據(jù)之前的兩條業(yè)務(wù)線的分析:首先由作者與投稿,其次是投稿與收益之間還能建立一條分析,最后就是作者與收益。

這里限于篇幅就只做一下整體的統(tǒng)計(jì),來查看核心業(yè)務(wù)邏輯是否穩(wěn)定,與之前圖上的單位不同的是,下方的熱力圖的單位是萬。

首先,可以看到,到現(xiàn)在2018年的時(shí)候,UGC內(nèi)容帶來的用戶點(diǎn)擊已經(jīng)遠(yuǎn)遠(yuǎn)超過PGC內(nèi)容,而且歷年所有的UGC內(nèi)容也已經(jīng)超過PGC內(nèi)容,這對(duì)內(nèi)容生產(chǎn)的穩(wěn)定發(fā)展有了基礎(chǔ)。

其次,雖然此頁面上的內(nèi)容并不能直接代表網(wǎng)站流量,但根據(jù)2016~2018年的整體數(shù)據(jù),可以給出以下兩種解釋:

  1. 2018年,相比于用戶水平的普遍上升,文章質(zhì)量是相對(duì)下降了?;蛘呤谴蠹蚁肟吹膬?nèi)容都已經(jīng)在之前都寫完了。但如果結(jié)合Q4表中的業(yè)務(wù)動(dòng)態(tài)也下降了,這種每個(gè)人都可能看一看的情況來說,可能性不大;
  2. 2018年用戶訪問量下降,根據(jù)我自己一篇的投稿經(jīng)驗(yàn),文章發(fā)出去之后七天內(nèi)閱讀量的增長就會(huì)衰減至一個(gè)極小值。所以這里我假定得更嚴(yán)格一點(diǎn),目前的新文章在發(fā)表30天之后就不會(huì)增長。 我之后的一些篩選和統(tǒng)計(jì)也是選擇超過30天的文章來進(jìn)行評(píng)判,這里可以初步得出如此解釋。

總結(jié)

結(jié)論

  • 結(jié)論1:最初假設(shè)的人人內(nèi)容體系是存在且正常運(yùn)行的,而且?guī)Я髁康闹黧w已經(jīng)由平臺(tái)運(yùn)營方在向用戶內(nèi)容生產(chǎn)的方向轉(zhuǎn)化;
  • 結(jié)論2:如果只看今年的數(shù)據(jù)來說,文章的質(zhì)量對(duì)比往年在下降,對(duì)讀者的吸引力也在下降;
  • 結(jié)論3:產(chǎn)品經(jīng)理沒有過去兩年那么熱門了,平臺(tái)可能需要尋找一些新的業(yè)務(wù)和內(nèi)容進(jìn)行填充。

建議

  • 文章編輯推薦:首先這是對(duì)投稿用戶最直接的反饋和正面鼓勵(lì),其次被編輯推薦的文章可以讓讀者過濾掉大量標(biāo)題黨內(nèi)容,提升內(nèi)容品質(zhì)?,F(xiàn)在經(jīng)常在首頁翻了一圈并沒有什么好內(nèi)容,所謂的熱門推薦,有些比較慢熱,內(nèi)容比較長容易掃一眼就直接關(guān)掉了,這個(gè)時(shí)候需要有編輯幫助引導(dǎo)一下;
  • 用戶投稿等級(jí):可以看到用戶的投稿數(shù)量和質(zhì)量還是有很大的差距的,應(yīng)該還是需要更復(fù)雜一點(diǎn)的體系和等級(jí),而不僅僅只有一個(gè)title。另外成為專欄作者后,完成投稿目標(biāo)是否有什么獎(jiǎng)勵(lì)呢?
  • 文章可以打標(biāo)簽:就目前來看,這個(gè)文章分類是不夠細(xì)致的,而且文章分類開得會(huì)比較不及時(shí)。比較好的流程是,作者在上傳時(shí)可以自己選擇多個(gè)文章標(biāo)簽,管理員再可以根據(jù)某一些標(biāo)簽快速的增長再將期轉(zhuǎn)為分類。這樣不僅對(duì)新趨勢能夠有所把握,而且之后建立索引也會(huì)更方便。

下篇預(yù)告

以上便是本次分析的上半場,那么在之后將會(huì)是讀者篇和作者篇,請大家敬請期待。

如果有數(shù)據(jù)分析大神希望可以給一些指點(diǎn)和建議,非常感謝。

相關(guān)閱讀

數(shù)據(jù)分析實(shí)戰(zhàn)|人人都是產(chǎn)品經(jīng)理網(wǎng)站(中篇):讀者視角

 

本文由 @?核桃殼 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Pixabay,基于 CC0 協(xié)議

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請登錄
  1. 平臺(tái)運(yùn)營的文章是不是OGC???

    來自天津 回復(fù)
  2. 好棒??!話說,這里的數(shù)據(jù)應(yīng)該如何獲取呀,好想自己也學(xué)學(xué)數(shù)據(jù)分析的

    回復(fù)
  3. 可以向您要一下原始數(shù)據(jù)嘛^_^?xzhpsp@126.com

    來自廣東 回復(fù)
  4. 文章數(shù)量的標(biāo)準(zhǔn)差怎么比文章數(shù)量的均值要大那么多?難道有負(fù)數(shù)嗎

    來自廣東 回復(fù)
    1. 并沒有,是在做數(shù)據(jù)處理的時(shí)候沒有把建站時(shí)候的大量文章導(dǎo)入所產(chǎn)生的異常祛除。

      來自湖南 回復(fù)
  5. 小白想問..做數(shù)據(jù)分析的時(shí)候都得自己寫代碼去爬數(shù)據(jù)嗎?

    來自天津 回復(fù)
    1. 這個(gè)看情況和公司,公司大了會(huì)有自己的數(shù)據(jù)分析部門

      來自北京 回復(fù)
    2. 所以,是數(shù)據(jù)分析部門做數(shù)據(jù)分析,都得自己寫代碼去爬數(shù)據(jù)?

      來自廣東 回復(fù)
    3. 數(shù)據(jù)分析部門負(fù)責(zé)抓取數(shù)據(jù) 處理數(shù)據(jù) 分析數(shù)據(jù)和運(yùn)營動(dòng)作由業(yè)務(wù)部門來 不懂你的邏輯怎么來的

      回復(fù)
  6. 本系列的相關(guān)代碼可以在http://walnut-shell.com/ipython-notebook/ 中找到

    來自北京 回復(fù)
  7. 請問下如何系統(tǒng)的學(xué)習(xí)數(shù)據(jù)分析,看了Udacity和網(wǎng)易上的數(shù)據(jù)分析課程,感覺都不是很系統(tǒng),求指教~

    來自廣東 回復(fù)
  8. 我很想知道怎么用Python的for獲得數(shù)據(jù),求大神教導(dǎo),以及for程序在哪里可以找開源代碼

    來自廣東 回復(fù)
    1. 哦,這個(gè)只是說獲取數(shù)據(jù)是個(gè)簡單的網(wǎng)絡(luò)請求接口,編程中使用輪詢的方法就可以獲取到所有的數(shù)據(jù)。

      來自北京 回復(fù)
  9. 這兩天剛把人人的文章數(shù)據(jù)爬下來準(zhǔn)備做分析,就看到了你這篇,瞬間覺得不想玩了 ?

    來自北京 回復(fù)
    1. 還請多指教,未必全面

      來自日本 回復(fù)
  10. 羨慕有錘子的技術(shù)帝^O^

    回復(fù)
  11. 拜讀了,期待下篇(??????)??

    來自北京 回復(fù)