<output id="r87xx"></output>
    1. 
      
      <mark id="r87xx"><thead id="r87xx"><input id="r87xx"></input></thead></mark>
        •   

               當前位置:首頁>管理咨詢>IT運維管理關(guān)鍵技術(shù)點解剖 查詢:
               
          IT運維管理關(guān)鍵技術(shù)點解剖

                  

                  運維關(guān)鍵技術(shù)點解剖

                  1、大規(guī)模集群管理問題

                  首先我們先要明確集群的概念,集群不是泛指各功能服務(wù)器的總合,而是指為了達到某一目的或功能的服務(wù)器、硬盤資源的整合(機器數(shù)大于兩臺),對于應(yīng)用來說它就是一個整體,目前常規(guī)集群可分為:高可用性集群(HA),負載均衡集群(如lvs),分布式儲、計算存儲集群(DFS,如googlegfs,yahoohadoop),特定應(yīng)用集群(某一特定功能服務(wù)器組合、如db、cache層等),目前互聯(lián)網(wǎng)行業(yè)主要基于這四種類型;對于前兩種類似,如果業(yè)務(wù)簡單、應(yīng)用上post操作比較少,可以簡單的采用四層交換機解決(如f5),達到服務(wù)高可用/負責均衡的作用,對于資源緊張的公司也有一些開源解決辦法如lvs+ha,非常靈活;對于后兩種,那就考驗公司技術(shù)實力及應(yīng)用特點了,第三種DFS主要應(yīng)用于海量數(shù)據(jù)應(yīng)用上,如郵件、搜索等應(yīng)用,特別是搜索要求就更高了,除了簡單海量存儲,還包括數(shù)據(jù)挖掘、用戶行為分析;如google、yahoo就能保存分析近一年的用戶記錄數(shù)據(jù),而baidu應(yīng)該少于30天、soguo就更少了。。。這些對于搜索準備性、及用戶體驗是至關(guān)重要的。

                  接下來,我們再談?wù)勅绾慰茖W的管理集群,有以下關(guān)鍵幾點:

                  I、監(jiān)控

                  主要包括故障監(jiān)控和性能、流量、負載等狀態(tài)監(jiān)控,這些監(jiān)控關(guān)系到集群的健康運行,及潛在問題的及時發(fā)現(xiàn)與干預(yù);

                  a、服務(wù)故障、狀態(tài)監(jiān)控:主要是對服務(wù)器自身、上層應(yīng)用、關(guān)聯(lián)服務(wù)數(shù)據(jù)交互監(jiān)控;例如針對前端webserver,我們就可以有很多種類型的監(jiān)控,包括應(yīng)用端口狀態(tài)監(jiān)控,便于及時發(fā)現(xiàn)服務(wù)器或應(yīng)用本身是否crash、通過icmp包探測服務(wù)器健康狀態(tài),更上層可能還包括應(yīng)用各頻道業(yè)務(wù)的監(jiān)控,常用方法是采用面業(yè)特征碼進行判斷,或?qū)χ攸c頁面進行簽名,以網(wǎng)站被黑篡改(報警、并自動恢復(fù)被篡改數(shù)據(jù))等等,這些只是一部份,還有N多監(jiān)控方式,依應(yīng)用特點而定,還有一些問題需解決,如集群過大,如何高性能的進行監(jiān)控也是一個現(xiàn)實問題。

                  b、其它就是集群狀態(tài)類的監(jiān)控或統(tǒng)計,為我們合理管理調(diào)優(yōu)集群提供數(shù)據(jù)參考、包括服務(wù)瓶頸、性能問題、異常流量、攻擊等問題。

                  II、故障管理

                  a、硬件故障問題;對于成百上千或上萬機器的N多集群,服務(wù)器死機、硬件故障概率是非常大的,幾乎每時每刻都有服務(wù)硬件問題,死機、硬盤損壞、電源、內(nèi)存、交換機。針對這種情況,我們在設(shè)計網(wǎng)站架構(gòu)時需要充分考慮到這些問題,并將其視為常態(tài);更多的依靠應(yīng)用的冗余機制來規(guī)避這種風險,但給系統(tǒng)工程師足夠?qū)捲5奶幚頃r間。(如google不是號稱同時死800臺機器,服務(wù)不會受到任何影響嗎);這就是考驗運維工程師及網(wǎng)站架構(gòu)師功能的地方了,好的設(shè)計能達到google所描述自恢復(fù)能力,如gfs,糟糕的設(shè)計那就是一臺服務(wù)器的死機可能會造成大面積服務(wù)的連鎖故障反映,直接對用戶拒絕響應(yīng)。

                  b、應(yīng)用故障問題;可能是某一bug被觸發(fā)、或某一性能閥值被超越、攻擊等情況不一而定,但重要的一點,是要有對這些問題的預(yù)防性措施,不能想當然,它不會出問題,如真出問題了,如何應(yīng)對?這需要運維工程師平時做足功夫,包括應(yīng)急響應(yīng)速度、故障處理的科學性、備用方案的有效等。

                  III、自動化

                  自動化:簡而言之,就是將我們?nèi)粘J謩舆M行的一些工作通過工具,系統(tǒng)自動來完成,解放我們的雙手及枯燥的重復(fù)性勞動,例如:沒有工具前,我們安裝系統(tǒng)需要一臺一臺裸機安裝,如2000臺,可能需要10人/10天,搞爛N張光盤,人力成本更大。。。而現(xiàn)在通過自動化工具,只需幾個簡單命令就能搞定、還有如機器人類程序,自動完成以往每天人工干預(yù)的工作,使其自動完成、匯報結(jié)果,并具備一定的專家系統(tǒng)能力,能做一些簡單的是/非判斷、優(yōu)化選擇等。。。這些好處非常明顯不再多說。。。應(yīng)該說,自動化運維是運維工程師職業(yè)化的一個追求,利已利公,雖然這是一個異常艱巨的任務(wù):不斷變更的業(yè)務(wù)、不規(guī)范化的應(yīng)用設(shè)計、開發(fā)模式、網(wǎng)絡(luò)架構(gòu)變更、IDC變更、規(guī)范變動等因素,都可能會對現(xiàn)有產(chǎn)生影響,所以需要模塊化、接口化、變因參數(shù)化等因此,自動化相關(guān)工作,是運維工程師的核心重點工作之一,也是價值的體現(xiàn)。

                  2、運維中關(guān)鍵技術(shù)點解剖(比較實際,現(xiàn)實中的案例,今天先想出這幾條,如大家有其它感覺興趣的,可以提出,一起交流~)

                  1、大量高并發(fā)網(wǎng)站的設(shè)計方案

                  2、高可靠、高可伸縮性網(wǎng)絡(luò)架構(gòu)設(shè)計

                  3、網(wǎng)站安全問題,如何避免被黑?

                  4、南北互聯(lián)問題,動態(tài)CDN解決方案

                  5、海量數(shù)據(jù)存儲架構(gòu)

                  


          怎樣在職場中獲得廣泛認同中國職場的潛在原則
          職場人要有明確的職業(yè)生涯規(guī)劃成功者的共同品格有哪些
          怎樣妥善應(yīng)對復(fù)雜的職場環(huán)境職場人需要遵守的準則
          怎樣將職場中的劣勢轉(zhuǎn)化為優(yōu)勢怎樣面對職場中的爭端
          怎樣成為優(yōu)秀的職場人嚴重影響職場人際關(guān)系的因素有哪些
          導(dǎo)致面試失敗的表現(xiàn)有哪些提升職業(yè)素養(yǎng)需要注重的因素
          職場中發(fā)言要注意什么怎樣經(jīng)營好職場人際關(guān)系
          怎樣更好地提升工作效率四川八成交通災(zāi)后重建項目已建成
          信息發(fā)布:廣州名易軟件有限公司 http://m.jetlc.com
          • 勁爆價:
            不限功能
            不限用戶
            1998元/年

          • 微信客服

            <output id="r87xx"></output>
          1. 
            
            <mark id="r87xx"><thead id="r87xx"><input id="r87xx"></input></thead></mark>
              • 交+视频+在线+观看 | 青草免费视频99 | 啪啪啪啪网站 | 国产人人操人人 | 超碰大鸡巴 | 亚洲无码操逼 | 国产传媒一区 | 欧美操逼视频免费观看 | 午夜激情网 | AV黄色在线观看 |