對(duì)話 CTO | 服務(wù)萬(wàn)億旅游市場(chǎng),去哪兒網(wǎng)企業(yè)級(jí)運(yùn)維的精益實(shí)踐

去哪兒網(wǎng)作為國(guó)內(nèi)領(lǐng)先的旅游搜索引擎,高效穩(wěn)定服務(wù)萬(wàn)億旅游市場(chǎng)的背后是卓越的運(yùn)維能力。萬(wàn)臺(tái)實(shí)體機(jī)、數(shù)萬(wàn)臺(tái)虛擬機(jī)的服務(wù)器規(guī)模,持續(xù)優(yōu)化的技術(shù)迭代,成為去哪兒網(wǎng)服務(wù)客戶(hù)的強(qiáng)力后盾。
在去哪兒網(wǎng)的內(nèi)部,同樣追求「利用技術(shù)解決效率問(wèn)題」。大概 4、5 年前,為解決團(tuán)隊(duì)的溝通效率問(wèn)題,去哪兒網(wǎng)開(kāi)始研發(fā) QTalk 即時(shí)通訊工具。當(dāng)時(shí)市面上還沒(méi)有釘釘這樣的產(chǎn)品,去哪兒網(wǎng)網(wǎng)站運(yùn)營(yíng)中心 CTO 孫斌團(tuán)隊(duì)決定用開(kāi)源的技術(shù)進(jìn)行內(nèi)部開(kāi)發(fā)。現(xiàn)在,公司所有內(nèi)部運(yùn)營(yíng)系統(tǒng)基本都可以對(duì)接在 QTalk 上,孫斌的想法是,「公司內(nèi)部系統(tǒng)決定了運(yùn)營(yíng)效率問(wèn)題,系統(tǒng)越高級(jí),公司運(yùn)轉(zhuǎn)就沒(méi)那么費(fèi)力,尤其是到了一定規(guī)模以后。」
使用了很多開(kāi)源技術(shù)之后,去哪兒網(wǎng)從去年開(kāi)始將內(nèi)部使用的消息中間件 QMQ 放到 GitHub 進(jìn)行開(kāi)源,在孫斌看來(lái),公司可以通過(guò)開(kāi)源完善技術(shù),而開(kāi)源也會(huì)成為技術(shù)領(lǐng)域的大趨勢(shì)。
本期「對(duì)話 CTO 」請(qǐng)到了去哪兒網(wǎng)網(wǎng)站運(yùn)營(yíng)中心 CTO 孫斌。孫斌加入去哪兒網(wǎng)時(shí),公司還處于相對(duì)早期的起步階段,隨著人的規(guī)模、業(yè)務(wù)的規(guī)模、服務(wù)器的規(guī)模擴(kuò)大,孫斌也在構(gòu)建著自己的技術(shù)視角、管理視角、行業(yè)視角、商業(yè)視角。
業(yè)務(wù)擴(kuò)張背后,萬(wàn)臺(tái)服務(wù)器的高效運(yùn)維
穎奇:非常感謝去哪兒網(wǎng)網(wǎng)站運(yùn)營(yíng)中心 CTO 孫斌同學(xué)接受我們的采訪。請(qǐng)您先大概介紹一下,在去哪兒大框架下網(wǎng)站運(yùn)營(yíng)中心是一個(gè)怎樣的部門(mén)呢?
孫斌:網(wǎng)站運(yùn)營(yíng)中心的職責(zé)有幾個(gè),一是構(gòu)建所有基礎(chǔ)架構(gòu)的設(shè)施,比如像數(shù)據(jù)中心、服務(wù)器、系統(tǒng);另外一個(gè)是配置管理,有點(diǎn)像你們 ONES 的產(chǎn)品。再就是一些過(guò)程改進(jìn)、技術(shù)委員會(huì)的一些標(biāo)準(zhǔn)、監(jiān)控等等。相當(dāng)于所有的底層數(shù)據(jù)的存儲(chǔ)和計(jì)算都在網(wǎng)站運(yùn)營(yíng)中心。
穎奇:那目前在運(yùn)營(yíng)的服務(wù)器大概是什么樣的規(guī)模?
孫斌:我們實(shí)體機(jī)快到 1 萬(wàn)臺(tái),虛擬機(jī)大概 6 萬(wàn)多臺(tái)。我剛來(lái)去哪兒的時(shí)候,其實(shí)已經(jīng)在做虛擬化的東西,只不過(guò)那時(shí)候是 Xen,現(xiàn)在 KVM 多一些,容器也會(huì)做一些。
穎奇:看上去你們有大量的搜索,有一些預(yù)判的東西。
孫斌:對(duì),但是旅游行業(yè)不像搜索行業(yè),搜索行業(yè)必須用實(shí)體機(jī)。旅游行業(yè)沒(méi)有那么大的波動(dòng)的量,基本上我們都是用虛擬化技術(shù),底層的虛擬化加上 Java 的程序去做。
穎奇:流量會(huì)有一個(gè)非常明顯的波峰嗎?
孫斌:實(shí)際上早期會(huì)有,那是因?yàn)橄到y(tǒng)對(duì)容量規(guī)劃做得不好。現(xiàn)在的話,像春運(yùn)或十一我們大概都知道它的區(qū)間了,就不算一個(gè)異常情況,我們都會(huì)提前準(zhǔn)備好。
穎奇:我們近期參與了信通院 DevOps 標(biāo)準(zhǔn)的制定,了解到去哪兒網(wǎng)也有參與進(jìn)來(lái)。您覺(jué)得國(guó)內(nèi) DevOps 能力以及工具的發(fā)展現(xiàn)狀是怎樣?與國(guó)外最大的差別是什么?
孫斌:國(guó)內(nèi)很多的思想是通過(guò)國(guó)外過(guò)來(lái)的,DevOps 也是。國(guó)內(nèi)現(xiàn)在還是一個(gè)混沌的狀態(tài),原來(lái)沒(méi)有這種 DevOps 標(biāo)準(zhǔn),大家就是靠感覺(jué)摸索著做。我個(gè)人覺(jué)得在 DevOps 的實(shí)踐上,適合公司現(xiàn)在的業(yè)務(wù)發(fā)展才是最重要的。因?yàn)槊總€(gè)公司經(jīng)歷過(guò)的東西是不一樣的。比如我之前在雅虎中國(guó)見(jiàn)過(guò)「巨量」公司怎么去做研發(fā)管理;如果是在小公司,核心思想又會(huì)變成怎樣去解決短期最核心要解決的問(wèn)題。
穎奇:所以您覺(jué)得長(zhǎng)期來(lái)看,中國(guó)在研發(fā)管理以及 DevOps 上會(huì)有怎樣的發(fā)展呢?會(huì)追平甚至說(shuō)超越國(guó)外實(shí)踐嗎?
孫斌:我覺(jué)得很有希望超過(guò)國(guó)外,因?yàn)檫@個(gè)世界上好像業(yè)務(wù)量如此龐大的目前就只有中國(guó)。量變會(huì)帶來(lái)質(zhì)變,業(yè)務(wù)總量龐大會(huì)推進(jìn)技術(shù)的變化。
從應(yīng)用到貢獻(xiàn),企業(yè)級(jí) IT 的開(kāi)源洞見(jiàn)
穎奇:剛才講到內(nèi)部管理的一些問(wèn)題,去哪兒網(wǎng)現(xiàn)在是在使用你們內(nèi)部開(kāi)發(fā)的 QTalk?
孫斌:是的。當(dāng)時(shí)我們用的 IM 使用起來(lái)不太方便,工具跟不上軟硬件的更新速度。而且當(dāng)時(shí)市面上也沒(méi)有像釘釘這樣的產(chǎn)品,所以我們用了開(kāi)源的東西來(lái)自己做。我認(rèn)為內(nèi)部系統(tǒng)決定了整個(gè)公司運(yùn)營(yíng)效率問(wèn)題,系統(tǒng)越高級(jí),整個(gè)公司的運(yùn)轉(zhuǎn)就沒(méi)那么費(fèi)力,尤其是到了一定規(guī)模以后。因?yàn)楣こ坛杀臼欠浅4蟮某杀荆@里經(jīng)常會(huì)遇到很多問(wèn)題。我們做完 QTalk,把各個(gè)組件補(bǔ)上之后,移動(dòng)審批、移動(dòng)申請(qǐng)也就都開(kāi)始應(yīng)用了。當(dāng)時(shí)我們看到開(kāi)始移動(dòng)互聯(lián)網(wǎng)化,很多公司內(nèi)部運(yùn)營(yíng)就也一起往移動(dòng)端上遷了。目前我們基本所有的內(nèi)部有流動(dòng)化的系統(tǒng)都集合在 QTalk,比如 IM、監(jiān)控、自動(dòng)化運(yùn)維、HR、財(cái)務(wù)審批等等。我覺(jué)得將來(lái)最好是手機(jī)上用 QTalk 什么事都能搞定。
穎奇:您能夠大概講一下你們內(nèi)部系統(tǒng)的一些選型方式嗎?比如說(shuō)財(cái)務(wù)、HR 是用什么系統(tǒng)進(jìn)行管理的?
孫斌:HR 我們買(mǎi)的是 Oracle PeopleSoft。本來(lái)一開(kāi)始我是想做的,后來(lái)發(fā)現(xiàn)很難做,因?yàn)楹芏嗔鞒淌窍氩坏降摹6耶?dāng)時(shí)選型的時(shí)候,去哪兒還有國(guó)外的一些辦事處。當(dāng)時(shí)的問(wèn)題是,第一流程太細(xì),我們肯定沒(méi)有 Oracle 做了這么多年可以做的那么專(zhuān)業(yè);第二是有國(guó)外的辦事機(jī)構(gòu),當(dāng)?shù)氐亩惵实鹊榷疾灰粯樱再I(mǎi)一個(gè)可能是最省時(shí)省力的。但是他們實(shí)施完后,我們會(huì)接著做二次開(kāi)發(fā)。
穎奇:我們現(xiàn)在的一些客戶(hù),中大型的企業(yè)選型時(shí)也會(huì)考慮這些因素。
孫斌:互聯(lián)網(wǎng)行業(yè)的公司先拋開(kāi)不說(shuō),傳統(tǒng)企業(yè)將來(lái)再往上走,拼的是效率,效率是非常重要的。而且我覺(jué)得傳統(tǒng)方式很難管理技術(shù)人,特別是互聯(lián)網(wǎng)公司的技術(shù)人,所以很多傳統(tǒng)企業(yè)轉(zhuǎn)型的一個(gè)重要事情是看互聯(lián)網(wǎng)公司的東西能不能用起來(lái),怎么能很好的落地。雖然這里面肯定有一些玩法不一樣,畢竟傳統(tǒng)公司和互聯(lián)網(wǎng)公司情況不一樣,但我覺(jué)得大方向肯定是這樣的。
穎奇:您覺(jué)得這種企業(yè)的內(nèi)部系統(tǒng)還有哪些方面是大家可以借鑒的呢?
孫斌:商業(yè)化公司我覺(jué)得現(xiàn)在釘釘做的挺好的,因?yàn)闇贤ㄊ瞧髽I(yè)最基本的需求。它通過(guò)這個(gè)入口能去把一些周邊商業(yè)插件送進(jìn)去,不一定是他自己做,可能跟第三方合作的,這樣企業(yè)的依賴(lài)度就會(huì)更高,這個(gè)戰(zhàn)略我覺(jué)得還是很好的。然后做工具這種,就一定要做專(zhuān)業(yè),并且能夠兼容企業(yè)現(xiàn)有的研發(fā)體系,大家就可以用起來(lái)了。
穎奇:去哪兒使用了很多開(kāi)源的東西,同時(shí)也在貢獻(xiàn)開(kāi)源社區(qū),包括在開(kāi)源 QMQ。您可以大概講一下你們與開(kāi)源社區(qū)互動(dòng)的一些實(shí)踐嗎?
孫斌:開(kāi)源其實(shí)是我們?nèi)ツ晗掳肽?Q3、Q4 做的,我覺(jué)得現(xiàn)在開(kāi)源肯定是個(gè)大趨勢(shì)。阿里現(xiàn)在也在做開(kāi)源,他們的目的是,第一,能完善他們的技術(shù);第二,有人喜歡這個(gè)項(xiàng)目,對(duì)于企業(yè)來(lái)說(shuō),也是一個(gè)很好的招聘渠道;第三,技術(shù)品牌、技術(shù)實(shí)力也能宣傳。其實(shí)我們開(kāi)源的 QMQ 只是內(nèi)部系統(tǒng)的一部分,我們是希望能夠把所有系統(tǒng)關(guān)聯(lián)起來(lái)。因?yàn)槲覀兊南到y(tǒng)兼容性很大,我們開(kāi)源出一個(gè)組件,最好能夠把不同層次的組件都貢獻(xiàn)出去,形成一個(gè)閉環(huán)的模式,從上到下都能夠用起來(lái)。這樣可能對(duì)于中小型公司,它就不需要用一些太復(fù)雜的其他管理系統(tǒng),直接用我們的一套就可以了。
穎奇:我覺(jué)得去哪兒在開(kāi)源方面是有深度參與的。
孫斌:是的。而且我為什么覺(jué)得開(kāi)源是趨勢(shì),美國(guó)好多最近上市的公司都是開(kāi)源,像 Elasticsearch,你就會(huì)看到它慢慢變成一個(gè)標(biāo)準(zhǔn)。把一個(gè)開(kāi)源的東西做得特別好的時(shí)候,全行業(yè)都在用時(shí)候,就會(huì)成為一個(gè)標(biāo)準(zhǔn)。
面向未來(lái)的技術(shù)思考
穎奇:您認(rèn)為有哪些技術(shù)可能在未來(lái)三到五年對(duì)去哪兒有比較大的影響,或者說(shuō)能影響中國(guó)旅游行業(yè)甚至全球旅游行業(yè)的?
孫斌:我最近在關(guān)注 5G,在看它可能對(duì)行業(yè)有什么影響。我覺(jué)得一個(gè)行業(yè)改變,例如底層的像芯片技術(shù)、半導(dǎo)體技術(shù)或者通信技術(shù),等它應(yīng)用到一定程度的時(shí)候,它就會(huì)讓產(chǎn)業(yè)或者是業(yè)務(wù)發(fā)生質(zhì)的變化。5G 可以帶來(lái)好幾倍的帶寬以及高密度,原來(lái)做不了的業(yè)務(wù)可能就可以做了。實(shí)際上 5G 在旅游相關(guān)的產(chǎn)品可能有很多應(yīng)用場(chǎng)景。比如門(mén)票這種,應(yīng)該是游客到了哪里就給他推送什么東西,或者大密度的去推一些東西,原來(lái) 4G 的時(shí)候可能做不到,5G 就有條件去做了。但是這種產(chǎn)品形態(tài)其實(shí)還要再看。
另外像實(shí)時(shí)計(jì)算和智能推薦對(duì)旅游行業(yè)也非常重要。原來(lái)我們對(duì)用戶(hù)都是滯后的判斷,而現(xiàn)在的趨勢(shì)是業(yè)務(wù)要求一個(gè)用戶(hù)的行為你下一秒就要知道,然后再推給他一個(gè)適合他的東西。所以實(shí)時(shí)計(jì)算的技術(shù),像 ELK 其實(shí)對(duì)業(yè)務(wù)模式的影響比較大。原來(lái)只通過(guò)日志分析,就會(huì)有滯后性。
我覺(jué)得其實(shí)一個(gè)商業(yè)模式,入口是你的產(chǎn)品的形態(tài),然后你通過(guò)技術(shù),不管是數(shù)據(jù)也好,系統(tǒng)也好,能夠給客戶(hù)適合他的產(chǎn)品。因?yàn)閺娜巳簛?lái)說(shuō),90 后、00 后對(duì)旅游的認(rèn)知跟 80 后、70 后完全不一樣。70 后、80 后主要看價(jià)格,他們覺(jué)得性?xún)r(jià)比最重要;而 90 后和 00 后的決策,價(jià)格只是其中一個(gè)影響因素。他們比較看中整體體驗(yàn),玩的好不好,以及是否有新的玩法。我們有些項(xiàng)目也在嘗試為用戶(hù)單獨(dú)去拍攝旅行視頻,這個(gè)目前也在探索。
穎奇:YouTube 上看到會(huì)有年輕人用攝像機(jī)拍一天 Vlog,類(lèi)似情景帶入的這種。年輕人在線下也會(huì)有不一樣的旅行習(xí)慣嗎?
孫斌:對(duì),90 后、00 后對(duì)旅游的概念不是說(shuō)像 80 后、70 后那樣,他們一定要融入當(dāng)時(shí)的場(chǎng)景,不是作為游客,而是要去生活去體驗(yàn),這個(gè)差異會(huì)非常大。年輕人也會(huì)到了目的地再?zèng)Q定行程,這個(gè)就需要我們?nèi)ヮA(yù)測(cè)他的意圖。這與之前自己會(huì)做好計(jì)劃,是兩個(gè)決策方式。現(xiàn)在大家都沒(méi)什么計(jì)劃,但是需求不明確的時(shí)候你可以替他完善需求。比如說(shuō)即時(shí)推薦,這又和搜索推薦的技術(shù)相關(guān)。
我覺(jué)得年輕人將來(lái)報(bào)旅行團(tuán)會(huì)越來(lái)越少。因?yàn)榉g的軟件會(huì)越來(lái)越智能,所以語(yǔ)言不是什么問(wèn)題。關(guān)鍵是能不能帶他去融入當(dāng)時(shí)那個(gè)場(chǎng)景,這個(gè)其實(shí)是比較難的。就是實(shí)時(shí)的內(nèi)容提供、景點(diǎn)推薦,包括怎樣帶他去體驗(yàn)當(dāng)?shù)厣睢?/p>
穎奇:接下來(lái)能否給大家介紹一下您的個(gè)人履歷。
孫斌:我大學(xué)畢業(yè) 06 年就直接去了雅虎中國(guó),在雅虎中國(guó)的網(wǎng)絡(luò)運(yùn)維團(tuán)隊(duì)做了差不多 3-4 年。當(dāng)年雅虎比較大,全球 30 萬(wàn)臺(tái)服務(wù)器。我當(dāng)時(shí)是只負(fù)責(zé)中國(guó)區(qū)域,但是能看到全球范圍的資料。當(dāng)時(shí)年紀(jì)小,就見(jiàn)過(guò)種大的體量的公司覺(jué)得還是有很多收獲的。2010 年的時(shí)候我跟著我在雅虎的老板一起來(lái)了去哪兒。當(dāng)時(shí)去哪兒還比較小,很多事情還在規(guī)范當(dāng)中。我雖然在雅虎待了很長(zhǎng)時(shí)間,但當(dāng)時(shí)的雅虎已經(jīng)是個(gè)巨無(wú)霸了,我對(duì)雅虎發(fā)展過(guò)程中的很多細(xì)節(jié)是不太了解的。而我來(lái)去哪兒的時(shí)候就是剛剛起步的階段,所以當(dāng)時(shí)在技術(shù)上、業(yè)務(wù)上的專(zhuān)業(yè)知識(shí)和流程,是隨著去哪兒的發(fā)展過(guò)程邊磨合邊成熟的。
穎奇:去哪兒網(wǎng)一直在快速發(fā)展,您日常有哪些方法去思考或者吸收新知識(shí)?
孫斌:幾個(gè)方面,一個(gè)是看書(shū),一個(gè)是跟不同的人聊天,還有就是像混沌大學(xué),高手講課也可以聽(tīng)一聽(tīng)。我覺(jué)得所有這些信息構(gòu)成一個(gè)人對(duì)事情的基本看法。
穎奇:有沒(méi)有最近看的比較好的書(shū)?可以來(lái)分享一下。
孫斌:《賦能》《躍遷:成為高手的技術(shù)》《奈飛文化手冊(cè)》都還不錯(cuò)。我最近還在看達(dá)里奧的《原則》和《債務(wù)危機(jī)》,我覺(jué)得投資的思維不在于說(shuō)他賺不賺錢(qián),而是他的思考邏輯很閉環(huán),很?chē)?yán)謹(jǐn)。思考的慣性思維,你理解以后對(duì)事情的看法又不一樣。原來(lái)可能你只看到我把這事做了,但實(shí)際上不一定是最優(yōu)的方案。所以很多時(shí)候我們看事情都是只看了表面,沒(méi)看到根本。
穎奇:思維方式確實(shí)是大家都在關(guān)注的問(wèn)題。我們采訪了這么多CTO,一般都是工程師出身,然后逐漸從技術(shù)視角變成管理視角,然后業(yè)務(wù)視角、行業(yè)視角,最終變成商業(yè)視角。今天非常感謝您的分享。
[免責(zé)聲明]
原文標(biāo)題: 對(duì)話 CTO | 服務(wù)萬(wàn)億旅游市場(chǎng),去哪兒網(wǎng)企業(yè)級(jí)運(yùn)維的精益實(shí)踐
本文由作者原創(chuàng)發(fā)布于36氪企服點(diǎn)評(píng);未經(jīng)許可,禁止轉(zhuǎn)載。




