數(shù)據(jù)分析 文本挖掘?qū)嶄洠河梦谋就诰蚱饰?4萬首詩歌 編輯導語:詩詞的創(chuàng)作需要遵循很多的規(guī)矩,因此詩歌是有規(guī)律的。本文作者運用多種文本挖掘方法,對手頭的詩歌語料庫進行了深入的挖掘和分析,讓我們一起來看看作者是如... 蘇格蘭折耳喵 3年中級文本挖掘
數(shù)據(jù)分析 通過文本挖掘,我們發(fā)現(xiàn)了國家公務員考試的這些秘密 筆者以一個旁觀者的視角,通過一些語義分析技術去發(fā)現(xiàn)近八年(2011~2018)國考行政職業(yè)能力測驗(以下簡稱“行測”)考了哪些內(nèi)容,看能否有一些規(guī)律性的發(fā)現(xiàn)。 據(jù)中國新... 蘇格蘭折耳喵 3年中級文本挖掘
數(shù)據(jù)分析 文本挖掘從小白到精通(二):料庫和詞向量空間 寫筆者最近在梳理自己的文本挖掘知識結(jié)構(gòu),借助gensim、sklearn、keras等庫的文檔做了些擴充,會陸陸續(xù)續(xù)介紹文本向量化、tfidf、主題模型、word2vec,既會涉及理論,也... 蘇格蘭折耳喵 3年中級文本挖掘
數(shù)據(jù)分析 文本挖掘從小白到精通(一):語料、向量空間和模型的概念 本文給大家介紹幾個在使用gensim進行文本挖掘所需了解的基本概念和術語,并提供一些簡單的用法示例。enjoy~ 筆者最近在梳理自己的文本挖掘知識結(jié)構(gòu),借助gensim、sklea... 蘇格蘭折耳喵 2年初級向量空間
數(shù)據(jù)分析 數(shù)據(jù)挖掘?qū)嵅伲梦谋就诰蚱饰鼋?萬首《全唐詩》 本文作者將使用多種文本挖掘方法,來分析《全唐詩》。篇幅略長,請耐心閱讀^_^ 楔子 近些年來,弘揚中華傳統(tǒng)文化的現(xiàn)象級綜藝節(jié)目不斷涌現(xiàn),如《中國漢字聽寫大會》、... 蘇格蘭折耳喵 《全唐詩》3年中級
數(shù)據(jù)分析 利用文本挖掘,淺析Mate 10上市后的用戶輿情 本文以華為Mate 10的京東評論數(shù)據(jù)為分析對象,利用文本挖掘,以更小的代價了解到用戶對華為Mate 10的市場反饋,用戶對Mate 10的具體評價和情感傾向。 2017年10月16日,... 月馬生堯 2年初級文本挖掘
數(shù)據(jù)分析 以虎嗅網(wǎng)4W+文章的文本挖掘為例,展現(xiàn)數(shù)據(jù)分析的一整套流程 本文作者將結(jié)合自身經(jīng)驗,并以實際案例的形式進行呈現(xiàn),涉及從數(shù)據(jù)采集、數(shù)據(jù)清洗、數(shù)據(jù)分析再到數(shù)據(jù)可視化的一整套流程分析,力求條理清晰的展現(xiàn)外部數(shù)據(jù)分析的強大威... 蘇格蘭折耳喵 2年初級數(shù)據(jù)流程分析
數(shù)據(jù)分析 文本挖掘:避孕藥主題情感分析 關于輿情分析的實例分析,希望給你帶來一些幫助。 前言 距離上次文本挖掘小文章時間已經(jīng)過了3個月了,北京已經(jīng)入冬,有人說北京的冬天很冷,但是吃上火鍋很暖;也有人... shangyuan 1年初級文本挖掘
產(chǎn)品經(jīng)理 文本挖掘小探索:避孕藥內(nèi)容主題分析 文章分享了作者的一個文本挖掘的實例,希望對你能夠有所幫助。 輿情監(jiān)測一直是眾多品牌關注的地方,尤其品牌想知道在品牌推廣,品牌策略,品牌廣告中出現(xiàn)的問題,從而... shangyuan 文本挖掘腳本輿情分析
業(yè)界動態(tài) 以《大秦帝國之崛起》為例,來談大數(shù)據(jù)輿情分析和文本挖掘 本文作者將以《大秦帝國之崛起》作為分析對象,來詳細闡述在大數(shù)據(jù)時代數(shù)據(jù)分析會涉及到的全網(wǎng)輿情分析、微博傳播分析以及文本挖掘。 今年開年,拖延上映的《大秦帝國... 蘇格蘭折耳喵 大數(shù)據(jù)實例分析文本挖掘