2018年,產(chǎn)品人在關(guān)注什么?

4 評(píng)論 11797 瀏覽 105 收藏 15 分鐘

最近放假閑來(lái)無(wú)事,自學(xué)Python爬蟲技術(shù),而又一年即將結(jié)束,便想回顧2018這一年產(chǎn)品人都在關(guān)注什么?于是爬取了人人都是產(chǎn)品經(jīng)理的網(wǎng)站數(shù)據(jù),看看能不能在其中發(fā)現(xiàn)一些有趣的東西。Enjoy~

人人都是產(chǎn)品經(jīng)理網(wǎng)站(以下簡(jiǎn)稱“人人”)是互聯(lián)網(wǎng)產(chǎn)品經(jīng)理和運(yùn)營(yíng)人的學(xué)習(xí)社群,于是選擇爬取人人的網(wǎng)站數(shù)據(jù)用來(lái)分析。筆者爬取了2018年2月到2019年1月的文章發(fā)表和閱讀數(shù)據(jù),從作者和讀者兩個(gè)視角進(jìn)行分析。

一、分析的技術(shù)思路

前期準(zhǔn)備主要是數(shù)據(jù)的爬取和清洗,爬取了文章標(biāo)題、閱讀量、評(píng)論數(shù)、收藏量、評(píng)論數(shù)和發(fā)表時(shí)間等字段。再確定分析的目的來(lái)確定問(wèn)題分析的框架,最后針對(duì)框架中的問(wèn)題進(jìn)行數(shù)據(jù)可視化和撰寫分析報(bào)告。

為了避免爬蟲對(duì)網(wǎng)站服務(wù)器造成負(fù)擔(dān),筆者已經(jīng)在上述鏈接網(wǎng)頁(yè)中已經(jīng)上傳所有爬取的數(shù)據(jù),大家要數(shù)據(jù)的可以直接下載,避免大規(guī)模爬取。

二、分析框架

本次分析的文章時(shí)間是從2018年2月到2019年1月,從作者發(fā)表文章和讀者閱讀兩個(gè)視角進(jìn)行分析。

三、作者視角

1. 作者寫的話題都是什么?

從爬取到的數(shù)據(jù)中選擇文章標(biāo)題字段,按照月份為單位,提取每個(gè)月文章標(biāo)題的關(guān)鍵字,從而得到不同月份的文章話題,也可以從中看看2018年的互聯(lián)網(wǎng)熱點(diǎn)變化。(進(jìn)行分析的數(shù)據(jù)截取了每個(gè)月前10高頻率的關(guān)鍵詞)

關(guān)鍵詞頻率圖,按照顏色深淺(方塊上的數(shù)字是頻數(shù))突出詞頻

從以上的統(tǒng)計(jì)分析圖可以看出文章的話題集中度:

  1. 2018年2月-2019年1月發(fā)表的文章持續(xù)、高頻率出現(xiàn)的關(guān)鍵詞是,“產(chǎn)品經(jīng)理“(產(chǎn)品、經(jīng)理)、“設(shè)計(jì)”、“運(yùn)營(yíng)”、“營(yíng)銷”等?;旧鲜欠先巳硕际钱a(chǎn)品經(jīng)理網(wǎng)站的定位,作為互聯(lián)網(wǎng)產(chǎn)品經(jīng)理和運(yùn)營(yíng)人的學(xué)習(xí)社區(qū),筆者在寫文章的話題方面也都是圍繞著產(chǎn)品設(shè)計(jì)、運(yùn)營(yíng)、營(yíng)銷有關(guān)的內(nèi)容話題。
  2. 在產(chǎn)品經(jīng)理和運(yùn)營(yíng)所需要的技能方面,“axure”、“交互”、“數(shù)據(jù)”、“需求”和“增長(zhǎng)”等關(guān)鍵詞也出現(xiàn)在部分月份前10的高頻率關(guān)鍵詞。這些關(guān)鍵詞基本上是偏干貨類的產(chǎn)品和運(yùn)營(yíng)的核心技能相關(guān)的文章,比如“需求分析”、“交互設(shè)計(jì)”和“數(shù)據(jù)分析”等。
  3. 對(duì)于一些比較突出的關(guān)鍵字,比如“區(qū)塊鏈”,在2018年初區(qū)塊鏈技術(shù)在網(wǎng)絡(luò)上引起了大家廣泛的討論,盡管當(dāng)初區(qū)塊鏈的討論風(fēng)極一時(shí),但是畢竟區(qū)塊鏈的技術(shù)尚在討論之中,未來(lái)如何在實(shí)際產(chǎn)品中的運(yùn)用仍然不明確,之后對(duì)區(qū)塊鏈的討論也少了很多。另外“滴滴”關(guān)鍵詞也出現(xiàn)在2018年4月的高頻詞中,也是因?yàn)榈蔚涡奸_展外賣業(yè)務(wù),開啟和美團(tuán)競(jìng)爭(zhēng)之門。

在人人都是產(chǎn)品經(jīng)理網(wǎng)站的文章中除了有關(guān)產(chǎn)品和運(yùn)營(yíng)相關(guān)內(nèi)容和核心技能的分享和討論外,作者也緊跟互聯(lián)網(wǎng)熱點(diǎn)問(wèn)題展開討論。

2. 大家都在什么時(shí)間發(fā)文章呢?

了解了作者們都在寫什么話題的文章之后,我們?cè)倏纯创蠹叶荚谑裁磿r(shí)候發(fā)文章呢??

(不同顏色的面積代表星期為單位的文章數(shù)量,月份對(duì)應(yīng)的高度代表月份為單位的文章數(shù)量)

在月份方面,除了在2月處于中國(guó)農(nóng)歷春節(jié),文章數(shù)量明顯較少,春節(jié)假期過(guò)后,文章的數(shù)量明顯低提高。上半年一直到8月份,文章數(shù)量在逐步地增加,特別是7、8月份明顯提升,可能是因?yàn)樯习嘧迳习肽甑墓ぷ鲏毫^小,能有更多有空的時(shí)間寫文章,7、8月有可能部分學(xué)生放假后也能有時(shí)間寫文章,這部分因?yàn)闆](méi)有網(wǎng)站的具體用戶畫像,所以沒(méi)有能準(zhǔn)確的數(shù)據(jù)說(shuō)明??赡苁窍掳肽甑墓ぷ鲏毫Ω?,文章的數(shù)量逐漸減少。

在星期方面,看每種顏色的面積,基本上符合正常的規(guī)律,星期六、日的數(shù)量相較于工作日的數(shù)量減少。在工作日中星期一到星期五,文章的數(shù)量逐漸減少。基本上是上班和上學(xué)的作息規(guī)律相同。

3. 大家發(fā)表的文章質(zhì)量如何?

文章質(zhì)量的指數(shù)與閱讀量、收藏?cái)?shù)、點(diǎn)贊量和討論數(shù)息息相關(guān),要稱得上是一篇質(zhì)量好的文章,并不能僅僅從閱讀量一個(gè)維度來(lái)看;為了杜絕出現(xiàn)標(biāo)題黨的可能,我需要重新定義以一個(gè)指數(shù)來(lái)衡量文章的質(zhì)量,暫且稱之為“干貨指數(shù)”。

干貨指數(shù)=(點(diǎn)贊數(shù)+收藏?cái)?shù))/閱讀量

由于“干貨指數(shù)”除出來(lái)的數(shù)值最后很小,為了方便比較和觀察,可視化的時(shí)候同時(shí)將數(shù)據(jù)擴(kuò)大了1000倍。

上圖是所有文章的“干貨指數(shù)”(以下稱指數(shù))分布情況,通常情況下,指數(shù)越高代表的文章質(zhì)量越高。

只有15%的文章指數(shù)大于15,這些文章的有較好的質(zhì)量;一半左右的文章指數(shù)在5-15之間,收藏和點(diǎn)贊數(shù)都比較正常;但是有將近38%的文章指數(shù)在5以下,這里部分文章可能存在標(biāo)題文的情況,需要進(jìn)一步提高網(wǎng)站文章的質(zhì)量。

以下是“干貨指數(shù)”前10的文章列表:

這類文章聚焦于真實(shí)行業(yè)中的產(chǎn)品設(shè)計(jì)方法和產(chǎn)品核心技能,文章的內(nèi)容具有實(shí)際操作意義,成為大家收藏和點(diǎn)贊的對(duì)象。大家也可以搜索一下這些文章用于學(xué)習(xí)提高產(chǎn)品能力。

四、讀者視角

1. 讀者都喜歡看什么文章呢?

上面從作者的視角匯總了作者們關(guān)注的話題、作者發(fā)表文章的時(shí)間和高質(zhì)量文章的情況,下面我們從讀者的視角來(lái)看讀者們偏愛(ài)閱讀哪類文章呢?

(上半部分圖表,高度代表瀏覽量,顏色深淺代表收藏量,寬度代表點(diǎn)贊數(shù);下半部分圖表高度代表文章數(shù)量)

通過(guò)和上下兩個(gè)圖表對(duì)比,我們可以得出:

  1. 在文章數(shù)量方面,業(yè)界動(dòng)態(tài)、產(chǎn)品設(shè)計(jì)、產(chǎn)品運(yùn)營(yíng)和產(chǎn)品經(jīng)理的文章數(shù)量相對(duì)較多,一些更細(xì)分的領(lǐng)域,如區(qū)塊鏈、新零售和AI人工智能這類的文章較少,結(jié)合現(xiàn)在的發(fā)展趨勢(shì),這類文章的還存在很大的需求,對(duì)這些領(lǐng)域有研究的作者可以分享文章;
  2. 在瀏覽量、點(diǎn)贊數(shù)和收藏量指標(biāo)上,分析測(cè)評(píng)、產(chǎn)品經(jīng)理、原型設(shè)計(jì)、產(chǎn)品運(yùn)營(yíng)和數(shù)據(jù)分析類文章的瀏覽量、點(diǎn)贊數(shù)和收藏量相較于其他都很高,特別是原型設(shè)計(jì)和數(shù)據(jù)分析類文章數(shù)量較少,但還是有很高的瀏覽、點(diǎn)贊和收藏量,人們對(duì)這類技術(shù)實(shí)用文章的需求還是很大。
  3. 可以關(guān)注到一些特殊情況,業(yè)界動(dòng)態(tài)類文章相對(duì)于類數(shù)目多很多,但是閱讀、點(diǎn)贊和收藏量卻比較低,筆者回顧網(wǎng)站的文章分類標(biāo)準(zhǔn),發(fā)現(xiàn)業(yè)界動(dòng)態(tài)的文章其實(shí)包含了很多不同的內(nèi)容話題,內(nèi)容比較寬泛,對(duì)話的討論沒(méi)有深入,可能會(huì)導(dǎo)致讀者沒(méi)有欲望讀這類文章。

2. 大家都在什么時(shí)候讀文章呢?

前面我們分析了作者都在什么時(shí)間發(fā)表文章,下面我們來(lái)看看讀者閱讀的時(shí)間段和發(fā)表有沒(méi)有相照應(yīng)呢?

(高度代表閱讀量,顏色深淺表示不同指數(shù))

與作者發(fā)表文章相同,星期六、日相較于閱讀的數(shù)量相較于工作日有明顯減少。在閱讀量方面,星期一的閱讀量最高,一直到星期五數(shù)量一直明顯逐漸下降。收藏量、點(diǎn)贊數(shù)和評(píng)論量的趨勢(shì)與瀏覽量大致相同。在星期一的時(shí)間大家有更多的時(shí)間閱讀,互動(dòng)的欲望也更高。

3. 讀者的閱讀行為偏好

(圖表中的點(diǎn)代表文章,橫軸為文章點(diǎn)贊量,縱軸為收藏量,顏色深淺為閱讀量)

消費(fèi)者的閱讀行為主要從點(diǎn)贊數(shù)、收藏量和討論數(shù)量幾個(gè)指數(shù)來(lái)分析。一般情況下,讀者認(rèn)為文章的干貨足,所講的內(nèi)容更有實(shí)用價(jià)值,就會(huì)收藏文章;對(duì)于一些精彩、輕便和易閱讀的文章,更容易點(diǎn)贊。從上圖中點(diǎn)的分布情況,大多數(shù)點(diǎn)分布趨向于Y軸(收藏量),讀者收藏的行為要高于點(diǎn)贊。

從上面各類型文章的數(shù)量也可以看出,產(chǎn)品設(shè)計(jì)、產(chǎn)品運(yùn)營(yíng)和產(chǎn)品經(jīng)理核心技能類的文章數(shù)量確實(shí)很多,能夠?yàn)樽x者帶來(lái)一些收獲。

下面看看收藏量、點(diǎn)贊數(shù)和評(píng)論數(shù)前10的文章,看看讀者更偏好那類型的文章:

從收藏量的前10文章類型來(lái)看,Prd文檔、原型設(shè)計(jì)、需求文檔和技術(shù)知識(shí)占據(jù)了絕大部分,這些知識(shí)都是作為產(chǎn)品經(jīng)理需要掌握的做基礎(chǔ)的技能。

大家也可以去網(wǎng)站中搜索這些文章,對(duì)需要入門產(chǎn)品經(jīng)理的同學(xué)會(huì)有一定的幫助。

在點(diǎn)贊數(shù)前10的文章中,除了高質(zhì)量的產(chǎn)品分析文章之外,比較有趣的內(nèi)容獲得大家的青睞,例如《數(shù)據(jù)挖掘?qū)嵅質(zhì)用文本挖掘剖析近5000首《全唐詩(shī)》》、《高能,如何用互聯(lián)網(wǎng)思維賣包子》等,文章內(nèi)容有趣、容易閱讀、能夠在短時(shí)間內(nèi)吸引讀者的眼球。

找到評(píng)論數(shù)前10的文章后,筆者閱讀這些文章的評(píng)論內(nèi)容,發(fā)現(xiàn)大部分評(píng)論是向作者留言要Prd文檔資料之類的,并沒(méi)有進(jìn)行有關(guān)文章內(nèi)容的有效討論。

像《拼多多現(xiàn)象的原罪是什么?》具有“爭(zhēng)議性”話題的文章能夠吸引讀者的討論。但是總體來(lái)說(shuō),這種有效的討論并不是非常多。

筆者另外瀏覽了以下網(wǎng)站的另外一個(gè)模塊——熱門討論,大家會(huì)在這個(gè)模塊里面討論一些時(shí)效性、具有“爭(zhēng)議性”的話題,這可能也使讀者用戶更習(xí)慣在熱門討論區(qū)分享觀點(diǎn)。

總之,更具有閱讀性和有趣性的文章能夠獲得大家的點(diǎn)贊;更有干貨和實(shí)用技能的文章,大家更會(huì)收藏用于今后的學(xué)習(xí)。

總體來(lái)說(shuō),從網(wǎng)站整體點(diǎn)贊和收藏量來(lái)看,讀者收藏的行為多于點(diǎn)贊行為,大部分文章都很有干貨。

五、總結(jié)

本篇文章通過(guò)對(duì)作者投稿的類型、時(shí)間、質(zhì)量和讀者閱讀的類型、時(shí)間、閱讀行為偏好地分析,挖掘其中還存在需求的文章類型,利用數(shù)據(jù)分析給作者投稿、讀者閱讀學(xué)習(xí)和網(wǎng)站文章推送給予一些指導(dǎo)意見。

本人剛開始學(xué)習(xí)爬蟲和數(shù)據(jù)分析,如果有分析不對(duì)或有更好的觀點(diǎn)補(bǔ)充,歡迎討論或私信。

最后,希望通過(guò)這篇文章可以幫助大家回顧2018,給大家2019的工作學(xué)習(xí)能夠給予一些幫助。

祝大家新年快樂(lè)!

 

本文由 @xunkhun 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來(lái)自 Unsplash,基于 CC0 協(xié)議

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 作者有心了

    來(lái)自浙江 回復(fù)
  2. 此篇也得收藏+點(diǎn)贊

    來(lái)自北京 回復(fù)
  3. 作者有心了。 有一點(diǎn)疑問(wèn),讀者閱讀時(shí)間是怎么統(tǒng)計(jì)來(lái)的,爬的什么數(shù)據(jù)?

    來(lái)自山東 回復(fù)
  4. first collect

    來(lái)自浙江 回復(fù)