大數(shù)據(jù)分析:王者榮耀英雄背景下的分詞報(bào)告
文章對(duì)王者榮耀英雄展開分詞分析,一起來(lái)看。
中文分詞在中文信息處理中是最最基礎(chǔ)的,無(wú)論機(jī)器翻譯亦或信息檢索還是其他相關(guān)應(yīng)用,如果涉及中文,都離不開中文分詞,因此中文分詞具有極高的地位。
NLP剛?cè)腴T,想找個(gè)東西練練手,于是便看到了手邊的農(nóng)藥。。。
思路
- 使用Python爬取王者榮耀官網(wǎng)所有英雄的背景資料文本信息
- 使用RMM最大逆向匹配分詞算法對(duì)文本進(jìn)行分詞處理,計(jì)算詞頻
- 使用Excel出具簡(jiǎn)單的可視化報(bào)告
結(jié)果
爬取了王者榮耀官方網(wǎng)站-騰訊游戲71位英雄的英雄故事文本,共計(jì)59793個(gè)字符。
排名前20的高頻詞匯:
【自己】一詞出現(xiàn)了194次,詞頻為0.48%,高居榜首。
王者榮耀團(tuán)隊(duì)在介紹英雄時(shí),多以第一人稱視角進(jìn)行故事敘述和情感宣泄。
有利于用戶更好地理解英雄背景,觸發(fā)共情效果,有利于提高用戶的整體游戲體驗(yàn)。
如蘇烈的英雄故事中,【自己】就出現(xiàn)了4次,圖片所截區(qū)域不全,僅作展示說(shuō)明。
男女詞匯比例
男性詞匯: 他 他們 男 男子 男人 少年 爹爹;出現(xiàn)次數(shù)704次,詞頻為1.74%。
女性詞匯: 她 她們 少女 女 妻子 太后 女媧 小女孩 女郎 女孩 女嬰 女戰(zhàn)士;出現(xiàn)次數(shù)263次,詞頻為0.65%。
男女詞匯比例為73:27,男女英雄數(shù)量比例為72:28,幾乎一致王者榮耀的英雄更迭與故事發(fā)展主要與男性英雄相關(guān)
如鎧的英雄背景中,【他】出現(xiàn)了31次,【她】出現(xiàn)了1次
在同為長(zhǎng)城小隊(duì)隊(duì)員的花木蘭英雄背景中,【他】出現(xiàn)了12次,而【她】出現(xiàn)了1次
主要情節(jié)均由男性角色推動(dòng)。
排名前20的地點(diǎn)詞匯:
【長(zhǎng)安】、【長(zhǎng)城】和【大唐】穩(wěn)居榜首前三,占據(jù)了前20地名中46.67%的詞頻
繁華盛世和戰(zhàn)亂邊疆都是孕育無(wú)數(shù)英雄豪杰的好地方,兼容并蓄的社會(huì)環(huán)境和攘外安內(nèi)的國(guó)家政策迸發(fā)出一批又一批的青年才俊。
王者榮耀的游戲策劃也是深諳此道。
目前所有的英雄均來(lái)自于王者大陸的魔幻土地之上,如城鎮(zhèn)、廢墟、地下、森林、深淵、寺院和戈壁等。
官方人員在設(shè)計(jì)新的英雄時(shí),不妨把視角轉(zhuǎn)向浩渺的天空。
如Dota中的雙頭龍、精靈龍、寒冰飛龍、死靈飛龍和鳳凰等角色,來(lái)為游戲注入新的活力,進(jìn)一步加強(qiáng)游戲本身的趣味性和可玩性。
正負(fù)面情感詞匯比例
正負(fù)面詞匯比例為65:35,英雄們多因外族入侵、魔道猖獗、國(guó)破家亡和希望破滅等因素,為了國(guó)家安定和夢(mèng)想實(shí)現(xiàn),不得不拿起手中刀劍,奔向戰(zhàn)場(chǎng)
天降大任于斯人也,必先苦其心志,勞其筋骨,餓其體膚,空乏其身,行指亂其所為,所以動(dòng)心忍性,曾益其所不能。
正面詞匯: 愛(ài) 仁 和平 信任 勝利 希望 微笑 榮耀 偉大 輝煌 美麗 自信 等;出現(xiàn)次數(shù)425次,詞頻為1.04%。
負(fù)面詞匯: 魔 魔道 黑暗 憤怒 背叛 可怕 恐懼 失去 死亡 危險(xiǎn) 吞噬 邪惡 殘忍 嘲笑 折磨 戰(zhàn)亂 等;出現(xiàn)次數(shù)780次,詞頻為1.91%。
看完了記得點(diǎn)個(gè)贊哦~
本文由 @Pt2017 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自PEXELS,基于CC0協(xié)議
為開始點(diǎn)個(gè)贊
謝謝~ ??
結(jié)論呢
寫PRD去了。。。有空再繼續(xù)補(bǔ)充哈 ?