技術(shù)貼:如何通過搜索引擎學(xué)習(xí)成長,查找各種資源

11 評論 25122 瀏覽 400 收藏 19 分鐘

前幾天,一篇題為《搜索引擎就是我的大學(xué)》一文在我的朋友圈流轉(zhuǎn),小婉姑娘講述了自己初中肄業(yè)從一個月薪三百的鄉(xiāng)郊飯店服務(wù)員,通過搜索引擎自我學(xué)習(xí),一步一步步入城市,拿下人力資源管理,項目經(jīng)理,營銷策劃,文案策劃等多個有挑戰(zhàn)職位的逆襲事跡。

這無意給了很多“有電腦的人”一種天下我有的莫名沖動。雖然搜索引擎可以搜索到幾乎任何你想學(xué)的知識,但終究扔停留在可能性階段。真正高效地駕馭搜索引擎還是需要做些功課。

作為一名野路子網(wǎng)絡(luò)營銷鉆研狗,打算開個帖子給大家做個科普,同時奉上一系列壓箱底的“秘技”,希望于各位看客老爺有所裨益。

本帖分科普篇;實用技巧篇;資源篇三部分,略長但越往后越精彩。

科普篇

一、搜索引擎是個什么東西?

搜索引擎(Search Engine)是指根據(jù)一定的策略、運用特定的計算機程序從互聯(lián)網(wǎng)上搜集信息,在對信息進行組織和處理后,為用戶提供檢索服務(wù),將用戶檢索相關(guān)的信息展示給用戶的系統(tǒng)。搜索引擎包括全文索引、目錄索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、門戶搜索引擎與免費鏈接列表等。

這里的用戶指的是有信息獲取需求的普通用戶,其實信息生產(chǎn)提交方(站長等)嚴格意義來講也是“用戶”,普通用戶只需要掌握搜索引擎使用技巧,而站長們更多的是琢磨SEO(搜索引擎優(yōu)化)。這個帖子這雙邊都會有所涉及。

二、搜索引擎工作原理

640.webp (3)

爬行抓?。核阉饕嬷┲敫欐溄?,抓取頁面html代碼存入數(shù)據(jù)庫,低權(quán)重復(fù)制內(nèi)容過濾;

預(yù)處理:文字和相關(guān)標簽抓取,中文分詞,去掉無意義內(nèi)容提煉頁面主要關(guān)鍵詞(對于蜘蛛沒有意義:如:的、啊、從而等,廣告、申明等),去重(同一內(nèi)容不同網(wǎng)站或同一網(wǎng)站不同網(wǎng)址);倒排索引:關(guān)鍵詞到內(nèi)容,鏈接投票,文件處理(目前只能根據(jù)標簽和相關(guān)描述文字識別),質(zhì)量判斷:搜索引擎算法;

排名:中文分詞(排除無實際意義的詞后對搜索詞的拆分重組,百度快照可查詢分詞結(jié)果),相關(guān)性計算:越常用的詞對搜索詞的意義貢獻越小,詞頻,關(guān)鍵詞位置形式距離(標題、H1、黑體等),鏈接分析(錨文本、周邊文字、原站本身主題),排名過濾調(diào)整(百度第11位)。

搜索引擎的工作原理使命就是確保用戶發(fā)出搜索指令后展現(xiàn)在他們面前的是其所需要的優(yōu)質(zhì)內(nèi)容。

三、目前主流的搜索引擎

QQ截圖20160220155519

搜索引擎簡史:1994年Yahoo!誕生,1998年Google誕生,2000年百度誕生,2012年360搜索(好搜)推出。

百度

640.webp (4)

不管是PC端還是移動端百度市場份額都是絕對的國內(nèi)第一,跟國內(nèi)目前其他搜索引擎相比,不說矮子里面挑高個的難聽話,也不提競價廣告的亂象叢生,但從信息獲取效率以及用戶體驗來比,百度也是當(dāng)之無愧的。

作為學(xué)習(xí)工具,百度搜索有這兩個地方不錯,一是百度網(wǎng)盤,二是百度文庫。

搜狗

QQ截圖20160220140425

搜狗在近年來發(fā)展迅速,最具特色的點是可以搜索微信內(nèi)容和知乎內(nèi)容。這都仰賴于騰訊的買買買內(nèi)容戰(zhàn)略。

360

QQ截圖20160220140722

QQ截圖20160220140735

對于360,實話實說,廣告不比百度少,搜索結(jié)果質(zhì)量也不敢恭維。來個對比。更多例子各位自行搗鼓。

必須掌握Google!

Google上面才是互聯(lián)網(wǎng),其他國內(nèi)的搜索引擎的觸角都受限,只能叫局域網(wǎng)。除了信息全面,用戶體驗也是誰用誰知道。

四、世界范圍內(nèi)各搜索引擎市場份額

以2015年第三季度為例

谷歌以67.49%的份額雄居第一,Yahoo第二,Bing憑借10.67%占據(jù)第三,百度第四,份額8.13%。

搜索引擎以及相關(guān)實用技巧

一、高級搜索指令(了解多用幾遍即可)

這么理解:一般人不知道的,能夠提高搜索效率以及精度的一些特殊指令。

普通用戶常用的包括:

雙引號(搜索:“關(guān)鍵詞”)

2

把搜索詞匯放在雙引號中,代表完全匹配搜索,也就是說搜索出來的結(jié)果頁面都是保護雙引號中所出現(xiàn)的所有詞匯,連順序也是完全匹配的。百度和Google都是支持這個指令的。

使用雙引號搜索可以更準確的找到特定關(guān)鍵詞,更容易找到自己想要的資源。

減號(搜索:關(guān)鍵詞 ?-不需要的關(guān)鍵詞)

減號代表搜索引擎顯示不包括減號后面詞匯的頁面。使用這個指令時減號前面必須是空格,減號后面沒有空格,要緊跟著需要排除的詞。Google和百度都支持這個指令。

使用減號高級指令可以更加準確的找到需要的文件,尤其是某些詞語有多重意義的時候。

星號 (搜索:搜索*擎)

星號是常用的通配符,也可以使用在搜索引擎中。百度不支持*號指令。

比如在Google中搜索“ 搜索*擎”,其中*代表任何文字、出現(xiàn)的結(jié)果就不僅僅是包含“搜索引擎”的頁面了。

inurl:(搜索:inurl:任意字符串)

inurl:指令用于搜索查詢詞出現(xiàn)在URL中的頁面,可以按英文字面意思理解。百度和Google都是支持inurl:指令的。inurl:指令不僅支持英文,還支持中文。

高級搜索指令inurl的語法格式為:inurl:xxx(xxx可以為任意字符串)。此命令是查找url中包含xxx的網(wǎng)頁。

如果你是做SEO的,那么inurl:指令對你會很有用,因為你可以快速的找到競爭對手(因為關(guān)鍵詞出現(xiàn)在URL中對排名有一定的影響)。

intitle:返回的是頁面title中包含關(guān)鍵詞的頁面

640.webp (5)

百度和谷歌都支持intitle。?title是目前頁面優(yōu)化最重要的因素。無論是什么網(wǎng)站,基本都會把關(guān)鍵詞放入title中。

詳細用法:http://jingyan.baidu.com/article/3f16e003c21c162591c103a6.html

filetype:搜索特定文件格式的時候使用。

例如:filetype:pdf 視頻教程,顯示的是包含“視頻教程”的所有PDF文件。filetype指令可以用來搜索特定的資源,比如PDF電子書、Word文件等。Google和百度都是支持filetype:指令的。

詳細用法:http://jingyan.baidu.com/article/73c3ce28f23d8de50343d9ac.html

site:這個高級搜索指令用來搜索某個域名下面的所有文件。

比如搜索“site:www.zhihu.com”,出現(xiàn)的就是www.zhihu.com這個域名下面的所有頁面,可以說這個高級指令是查詢網(wǎng)站收入頁面數(shù)量最直接的方法。site:指令也可以用于子域名。但site:并不準確,特別是在Google中,出現(xiàn)的收入頁面經(jīng)常有大幅度波動,只能用于參考,但不能完全相信。

之前有人用“site:yun.baidu.com??”資源關(guān)鍵詞這個搜網(wǎng)盤里面的資源,現(xiàn)在貌似不大頂用了,等下給出替代方案。

高級搜索指令大全諸位可自行百度,補充一點是,這些指令很多都可以互相搭配使用影響最后的結(jié)果??梢杂泻軓?fù)雜的組合結(jié)果,好消息是有人幫我們封裝好做寫成了特殊的搜索引擎供我們使用。

二、特殊搜索引擎

這有個知乎特殊搜索引擎匯總貼:https://www.zhihu.com/question/20251786

大而全的東西意味著雜亂,外行很容易陷入選擇困難癥一臉茫然。我給大家重點勾勒幾個點。

先順邏輯:從學(xué)習(xí)的角度,我們搜索一個東西最淺顯的需求就是了解知道,要想深入消化吸收往往意味著有必要觸發(fā)資料收集下載這一動作。

嗯,我就是要教大家怎么下載。一般的付費教程以及電子書資源,百度網(wǎng)盤的資源豐富度遠遠超過你想象,不過百度官方并不提供資源檢索功能。借助工具就好了,用網(wǎng)盤搜索引擎即可。我公眾號的菜單欄內(nèi)置了一個,大家可以體驗一下。

webwxgetmsgimg (2)

理論上,只要掛在網(wǎng)上,就算是付費的視頻,文檔也能摳下來。某寶上面固然有售,稍稍懂點搜索引擎的功能其實都能省去不少精力,雖然大伙兒都不差錢,哈哈。

QQ截圖20160220162723

百度文庫,豆丁等下載:冰點下載器

QQ截圖20160220163011

YouTube視頻下載:en.savefrom.net

QQ截圖20160220163153

國內(nèi)視頻網(wǎng)站內(nèi)容下載:碩鼠

虎牙直播,斗魚直播等在線直播視頻下載:屏幕錄制軟件(CamtasiaStudio),我手上是自己寫的軟件。

視頻資源:用各種種子搜索引擎就好了。如:電驢,海盜,死去的btspread,以及不能說的其他站點。等下各位在評論區(qū)補充。

QQ截圖20160220162854

瀏覽國外資訊什么的,起碼要會翻墻吧,建議用付費的vpn,速度有保障,最重要的是下東西飛快。俺用的一款之前叫g(shù)reenvpn,現(xiàn)在叫綠豆加速器。紅杏已掛。

省略一萬種資源獲取方式……

最后放個大招:自行百度吾愛破解,精易論壇,對絕大多數(shù)人來講,那將是另外一片天堂。

各色工具資源站點我收藏夾都躺了幾百個,一次抖不完。嘮叨一個省事的終極思路——互聯(lián)網(wǎng)的基礎(chǔ)設(shè)施是IT們搭建起來的,其中有五顏六色的暗門,摸熟搜索引擎,就是擁有了打開這些暗門的鑰匙。

至于暗網(wǎng)什么的高級黑,下次八卦,寫寫我掌握的一些細節(jié)。

三、關(guān)鍵詞使用

QQ截圖20160220163514

使用搜索引擎的搜索功能最重要的是知道輸入哪個關(guān)鍵詞。

搜索引擎就像一個搬運工,你想讓他給你搬運啥東西,你起碼得知道自己想要什么。例如你想學(xué)英語,你可能就會搜怎么學(xué)英語,英語培訓(xùn)教程。這種起碼的素養(yǎng),一般人初次接觸搜索引擎就具備。這一階段一般使用的往往是泛關(guān)鍵詞

學(xué)習(xí)是個循序漸進的過程,意味著你有深入挖掘細分領(lǐng)域的需求。這就引申出另外一個概念叫精準關(guān)鍵詞(或長尾關(guān)鍵詞),不過多展開,需要強調(diào)的是,大家在使用搜索引擎的時候要有意識地去提煉自己的關(guān)鍵詞,從不同的維度去獲取你想要的信息。

舉個粗暴栗子,黃片又叫愛情動作片,此外番號,番號封面,女優(yōu)這些關(guān)鍵詞也指向你想要獲取的資源,是不是很有趣。

互聯(lián)網(wǎng)再繁雜,只要多記對象名詞,熟悉事物關(guān)鍵節(jié)點,借助搜索引擎就能提綱挈領(lǐng),手到擒來。到這個當(dāng)口,才有天下為我所用的掌握感。

四、搭建網(wǎng)站門類的記憶宮殿

浸淫互聯(lián)網(wǎng)許久,俺在說個有意思的點。導(dǎo)航網(wǎng)站相信大家都很熟悉,像hao123,金山毒霸導(dǎo)航,360導(dǎo)航。

我想給大伙說的是,這些導(dǎo)航網(wǎng)站的布局一般都別有用心(用來做淘寶客導(dǎo)購,軟件注冊推廣,廣告等),而且聚合的站點也很平庸,滿足普羅大眾日常的消遣尚可,但是想讓搜索引擎成為你的大學(xué),就遠遠不夠了。

你需要搭建屬于自己的“網(wǎng)站導(dǎo)航”,在日常接觸到的優(yōu)秀網(wǎng)站,記得在瀏覽器點一下收藏,分門別類。經(jīng)年累月的積累,這將是你電腦上最重要的一筆財富。我換電腦或裝系統(tǒng)幾乎東西不擔(dān)心丟失,同步下收藏夾就好了。

收藏夾

分門別類的收藏夾是你搭建腦海記憶宮殿的基礎(chǔ),最終要達到有搜索需求的時,資源獲取手到擒來。

至于怎么管理你的收藏夾,適合你自己的姿勢才是最好的,一些管理原則,放個帖子:https://www.zhihu.com/question/21537488

五、網(wǎng)感

多泡網(wǎng),見識各色各樣的網(wǎng)站樣式,在建立起自己的站點記憶宮殿之后,培養(yǎng)自己的網(wǎng)感,懂得各色資源的搭配調(diào)取應(yīng)用。網(wǎng)感是個很大的命題,看似有些務(wù)虛,實則用處極大。此處提出這一概念,鑒于篇幅下次闡述。

資源篇

從學(xué)習(xí)獲取資源的角度,看上面的東西就夠用了。你要對搜索引擎真感興趣,俺接著給大家推薦幾本類似行業(yè)圣經(jīng)的讀物。

QQ截圖20160220155555

SEO藝術(shù)

國外譯著,享有盛譽

QQ截圖20160220155840

《這就是搜索引擎:核心技術(shù)詳解》

關(guān)于一些技術(shù)細節(jié)

QQ截圖20160220155728

《搜》

搜索引擎的由來,了解歷史,偏文化經(jīng)濟層次

QQ截圖20160220155810

QQ截圖20160220164806

《SEO深度解析》和《SEO實戰(zhàn)密碼:60天網(wǎng)站流量提高20倍(第3版)》都是站長SEO操作指南。

 

作者:徐戈,微信公眾號:daai1024,老徐有話說。微博:@徐戈xuge

本文由 @徐戈 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理?,未經(jīng)許可,禁止轉(zhuǎn)載。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 很好很強大~!

    來自廣東 回復(fù)
  2. 慢慢都是干貨,非常感激

    來自上海 回復(fù)
  3. 謝謝樓主干貨,但還是希望大家對于在國內(nèi)可以合法觀看的影視劇電影支持正版~

    來自北京 回復(fù)
  4. 不錯,收藏夾功能,我無意中自己使用了,挺方便的

    來自浙江 回復(fù)
  5. 我在2010年的時候入行SEO 買了好幾本書看 自己感覺吧 還是要摸索著來

    來自陜西 回復(fù)
  6. ??

    來自陜西 回復(fù)
  7. 太牛逼了,對咱自學(xué)黨來說就是神器啊

    來自重慶 回復(fù)
  8. 棒棒噠!太有用了,b ??

    來自北京 回復(fù)
  9. seo藝術(shù)一般看不懂,seo實戰(zhàn)密碼我買了,不咋地,沒啥用處

    來自北京 回復(fù)
  10. ?? mark了!

    來自臺灣 回復(fù)