豆瓣首席架構(gòu)師分享:豆瓣的基礎架構(gòu)

3 評論 23252 瀏覽 14 收藏 10 分鐘

小白叨一叨:洪強寧,豆瓣首席架構(gòu)師。豆瓣第一位全職員工。清華畢業(yè)后,洪強寧一直做嵌入式系統(tǒng)。在2002年開始接觸Python語言,從硬件工程師變?yōu)檐浖こ處煟瑢σ环N語言在計算機底層如何工作有深入的理解。下文中洪強寧介紹了豆瓣的架構(gòu)和組件,并分享了豆瓣基礎平臺部的一些團隊經(jīng)驗。

架構(gòu)

豆瓣整個基礎架構(gòu)可以粗略的分為在線和離線兩大塊。在線的部分和大部分網(wǎng)站類似:前面用LVS做HA,用Nginx做反向代理,形成負載均衡的一層;應用層主要是做運算,將運算結(jié)果返回給前面的用戶,DAE平臺是這兩年建起來的,現(xiàn)在大部分豆瓣的應用基本都跑在DAE上面了;應用后面的基礎服務也跟其他網(wǎng)站差不多,MySQL、memcached、redis、beanstalkd,不一樣的是NoSQL的選擇——BeansDB,這是我們在幾年前開源的KV數(shù)據(jù)庫,也是國內(nèi)比較早開源的KV數(shù)據(jù)庫。

BeansDB項目可以說是一個簡化版的AWS DynamoDB,該項目在2008年啟動,2009年開源,第?版使?tokyo cabinet作為存儲引擎,2010年使?bitcask存儲格式重寫了存儲引擎,性能更好。BeansDB對key做哈希運算找到節(jié)點來實現(xiàn)分布和冗余, 一個寫操作會寫好幾個節(jié)點,而現(xiàn)在的配置是寫三份讀一份。BeansDB主要的特點是支持海量KV數(shù)據(jù)庫——相比Redis這種支持幾十個G到幾百個G的內(nèi)存KV數(shù)據(jù)庫,BeansDB可以支持到上百T的數(shù)據(jù)。另外BeansDB最大的好處就是運維很簡單,性能、可用性、擴容都很好,也實現(xiàn)了最終一致性。

BeansDB中間的Proxy是用Go語言寫的,也是一個開源的組件。整體來說BeansDB的設計結(jié)構(gòu)比較簡單,相比Redis那種有多種value 類型的方式,BeansDB的Value比較簡單一些。

在豆瓣內(nèi)部建立了兩個不同的BeansDB集群,一個是doubandb,一個是doubanfs,分別針對不同的場景。doubandb主要存儲小型文本數(shù)據(jù),如影評、用戶個人介紹、帖子內(nèi)容等,這樣的好處是可以大大降低我們對MySQL的性能依賴,算是給MySQL減負;doubanfs主要存放圖片和音頻等中型數(shù)據(jù)。

DAE可以說是基于很多以前積累的、舊的組件做起來的。我們做的這種對內(nèi)的PaaS,相比對外的PaaS而言做了很多簡化,尤其是安全方面如應用間隔離、權限管理方面,我們都不用像公有云那樣花大量精力去做,所以工作量其實還好。DAE現(xiàn)在在計劃開源,當然它現(xiàn)在只支持Python應用。以后我們也許會讓DAE支持Go語言。

上面是在線的部分,對高可用性和低時延有較大要求。離線部分則包括數(shù)據(jù)挖掘、數(shù)據(jù)分析等,技術組件分別是海量分布式文件系統(tǒng)MooseFS,這個文件系統(tǒng)的結(jié)構(gòu)類似HDFS,用C語言編寫,其好處在于FUSE模塊實現(xiàn)的比較好,用文件系統(tǒng)就可以直接進行操作,而不需要專門的命令,可以支持的數(shù)據(jù)量也很大。另外就是自己開發(fā)的分布式計算平臺DPark。

DPark顧名思義是Spark的Python實現(xiàn),不過現(xiàn)在已經(jīng)跟Spark越來越不一樣了。和 Hadoop 相比,Spark可以使用內(nèi)存做為緩存加速分布式計算,DPark繼承了這個優(yōu)點,這對于大規(guī)模數(shù)據(jù)的迭代計算非常有用。在豆瓣的應用場景下,因為我們的離線計算很多是推薦算法計算,這種計算涉及大量的迭代算法,如果每次計算的結(jié)果都入磁盤再在下一輪計算加載,那性能是很差的,所以DPark能夠大幅提升性能。另外,因為DPark的編寫使用了函數(shù)式語言的特點,所以可以寫的非常簡潔:

到目前(2014年3月),DPark的集群規(guī)模和處理數(shù)據(jù)量已經(jīng)比去年多了一倍左右,一天要處理60~100TB左右的數(shù)據(jù)。

團隊

當前,我所負責的豆瓣平臺部一共包括四個部分:核心系統(tǒng),這塊也是由我直接帶領的,共6名工程師;DAE,現(xiàn)在是彭宇負責,共4名工程師;DBA兩人;SA兩人。

平臺部負責的項目大多是跟業(yè)務無關的東西,貼近應用層的主要在產(chǎn)品線團隊做,這個分工跟豆瓣工程團隊的發(fā)展歷史有關。早期豆瓣工程師還不多的時候,就已經(jīng)分為兩種傾向,一種是偏業(yè)務的,就是去做用戶能看得見的東西;另一種是支持性的,運行在業(yè)務層下面、不被用戶所感知的東西。下面這一層就衍變成了平臺部門。

在豆瓣,不管是做產(chǎn)品還是做平臺的工程師,技術實力都比較強,一個項目應該從哪個部門發(fā)起,并不是看這個任務的難度,而是看它是公共的還是業(yè)務特有的。有些項目即使未來可能會成為公共的,但一開始只是一個產(chǎn)品線需要,那么它也會從產(chǎn)品線發(fā)起。比如豆瓣的短信服務,最開始是產(chǎn)品線有需求,所以這些服務都是由他們發(fā)起完成的,平臺這邊主要負責提供建設服務的架構(gòu),比如DoubanService,告訴他們一個服務怎樣去寫、怎樣去部署、怎樣去對用戶開放。短信服務后來成為很多產(chǎn)品線都在使用的服務,同時這個系統(tǒng)本身也越來越成熟,那么它逐漸就被轉(zhuǎn)移到SA團隊來進行維護。

核心系統(tǒng)組做過的項目,包括剛才提到的DPark、BeansDB,還有MooseFS這些二次開發(fā)的,還有搜索服務、信息推送的長連接服務等,大大小小差不多有十幾個。有些項目處于維護狀態(tài),所以需要的人不是那么多。

跟豆瓣其他工程團隊一樣,平臺部也強制大家做code review。這對于核心系統(tǒng)來說很重要的一點在于,code review是一個知識共享的過程:我們?nèi)松夙椖慷?,所以很多項目都是一個人做主力,很容易就變成其他人不知道你這個項目具體是什么情況,而強制code review就可以實現(xiàn)一種公開透明的狀態(tài),讓大家都了解每個項目在做什么。

在平臺部,因為你做的所有東西都會影響到全公司,測試顯然很重要,我們還做了另一件事來進行質(zhì)量保證,那就是一個項目由誰來主導上線,誰就要負責這個項目的故障響應——所有運維、調(diào)整系統(tǒng)等SA的工作,你這個第一負責人都要參與。你做的東西的好壞會影響到自己晚上能不能睡好覺,所以大家就會比較謹慎?;叶壬暇€也是我們這邊的通用做法。

平臺部還有一點跟產(chǎn)品線不一樣的是,平臺部沒有產(chǎn)品經(jīng)理,所以你的工作方向更多是自己去找的,每個人自己發(fā)現(xiàn)問題的能力更重要。我們每個月都會問大家,你這個月想要解決什么問題?如果方向大家一致認可,那就去做。

最后,對于新技術的引入上,豆瓣整體是比較偏激進的,我們鼓勵大家去看看新的技術。當然我們也不會看到新的就上,這里面有一些限制:一個是比較重要的服務如果要上新的技術,一定要有成功案例,且成功案例有跟我們量級差不多的規(guī)模,這樣可以降低風險;另一個是對于引入的新技術一定要吃透——大部分引入的技術肯定是要做二次開發(fā)的,所以拿進來的技術你必須保證能完全理解它的代碼結(jié)構(gòu),出了問題能修,能去掉自己無法掌控的東西。這也是為什么豆瓣不太可能在重要的地方引入Java的原因,除非別無選擇,我們一般都是Python、C和Go。

本文作者:@洪強寧;轉(zhuǎn)載自:InfoQ?

 

 

更多精彩內(nèi)容,請關注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. “大部分引入的技術肯定是要做二次開發(fā)的,所以拿進來的技術你必須保證能完全理解它的代碼結(jié)構(gòu),出了問題能修,能去掉自己無法掌控的東西。這也是為什么豆瓣不太可能在重要的地方引入Java的原因,除非別無選擇,我們一般都是Python、C和Go。”

    這個意思是java不容易維護嗎?

    來自美國 回復
    1. 相比python,c,go而言,java代碼顯得不夠直觀,很容易出現(xiàn)長長的繼承鏈,最底層的實現(xiàn)不知道跑哪去了。個人有體會,作者應該是這個意思。

      來自浙江 回復
  2. 好多專業(yè)名詞,慢慢吸收

    來自北京 回復