哪些運維監(jiān)控

來源: 發(fā)布時間:2023-05-12

Flow是一種數(shù)據(jù)交換方式,其工作原理是:

Flow利用標準的交換模式處理數(shù)據(jù)流的第1個IP包數(shù)據(jù),生成Flow緩存,隨后同樣的數(shù)據(jù)基于緩存信息在同一個數(shù)據(jù)流中進行傳輸,不再匹配相關的訪問控制等策略,F(xiàn)low緩存同時包含了隨后數(shù)據(jù)流的統(tǒng)計信息。

一個Flow流定義為在一個源IP地址和目的IP地址間傳輸?shù)膯蜗驍?shù)據(jù)包流,且所有數(shù)據(jù)包具有共同的傳輸層源、目的端口號。

相對于會話(“Session”)而言,“Flow”具備更細致的標識特征,在傳統(tǒng)的TCP/IP五元組的基礎上增加了一些新的域值,至少包括以下幾個字段:

|源IP地址|目的IP地址|源端口|目的端口|IP層協(xié)議類型|ToS服務類型(dscp)|輸入物理端口(ifindex)|

以上七個字段可以唯1地確定任意一個數(shù)據(jù)包屬于哪個特定的Flow。

換而言之,任何一個字段出現(xiàn)了差異都意味著一個新Flow的發(fā)生。對于Flow的分析展示同樣也是要基于多維度的:

IP(目的與源)、port(目的與源)、業(yè)務、網(wǎng)絡架構、城市、IDC等。

具體所需的維度依賴于自己的業(yè)務場景。Flow是廠商的私有協(xié)議,業(yè)界也有多種的Flow格式。例如CISCO、華為、juniper等等的主流廠商的Flow也是均有一定差異性與優(yōu)劣的,常用的有NetFlow與SFlow。所以這部分的后臺能力是需要有異構。 基于正確的SNMP信息,Argus可實現(xiàn)獲取高準確率的拓撲關系,并自動生成拓撲圖。哪些運維監(jiān)控

IAAS層的監(jiān)控從IAAS層的組成這個維度來說,可以分為一個個獨一的資源對象來分類監(jiān)控,針對每一類對象可以分別從狀態(tài)、性能、容量、質(zhì)量這幾個維度描述,將不同的數(shù)據(jù)綜合為開發(fā)與運維的統(tǒng)一視角。監(jiān)控告警產(chǎn)品的建設是任重而道遠的過程,坑也非常多。要考慮多種因素,技術后臺能力只是其中的一部分。

例如在DevOps的文化下,需要從更高的層面來統(tǒng)一視角(開發(fā)視角&運維視角)避免將監(jiān)控做成"開發(fā)的監(jiān)控”與"運維的監(jiān)控”。也需要更多的考慮監(jiān)控產(chǎn)品使用的雙態(tài)(用戶態(tài)&系統(tǒng)態(tài))與不同的權限(行業(yè)屬性)如何分類設計。 品質(zhì)運維監(jiān)控一般多少錢對于運維監(jiān)控的告警信息,應該如何分析,或者說應該從哪些方向去分析呢?

對于IaaS層的監(jiān)控,本質(zhì)來說就是監(jiān)控組成IaaS層的各個資源對象,那么資源對象代表什么呢?

例如物理服務器、交換機、一條專線與一個公網(wǎng)IP等等都是一個個資源對象。通常來說對于資源對象的監(jiān)控可以分為以下4個維度。

狀態(tài)的監(jiān)控:通指設備的的狀態(tài),如設備的存活狀態(tài)、網(wǎng)絡設備的端口狀態(tài)、電源、風扇狀態(tài)等;

性能監(jiān)控:通指設備內(nèi)存大小,端口流量包量、CPU利用率等等;

質(zhì)量監(jiān)控:通指設備的丟包率、錯包率、網(wǎng)絡訪問的延時等等;

容量監(jiān)控:通指設備的負載使用率、專線帶寬使用率、網(wǎng)絡設備的負載使用率、服務器的負載使用率等等。

運維監(jiān)控系統(tǒng)一般采用分層的方式劃分監(jiān)控對象。在我們的監(jiān)控系統(tǒng)中,主要關注以下幾種類型的監(jiān)控對象:1、主機監(jiān)控,主要指主機節(jié)點軟、硬件資源的一些監(jiān)控數(shù)據(jù)。2、容器環(huán)境監(jiān)控,主要指服務所處運行環(huán)境的一些監(jiān)控數(shù)據(jù)。3、應用服務監(jiān)控,主要指服務本身的基礎數(shù)據(jù)指標,提現(xiàn)服務自身的運行狀況。4、第三方接口監(jiān)控,主要指調(diào)用其他外部服務接口的情況。對于應用服務和第三方接口監(jiān)控,我們常用的指標包括:響應時間、請求量QPS、成功率。Argus是觀縱科技自主研發(fā)的it運維監(jiān)控系統(tǒng),旨在對信息中心軟硬件實施全天候無死角監(jiān)控。

大集群場景特點數(shù)據(jù)規(guī)模大:監(jiān)控對象targets多,數(shù)千萬時序數(shù)據(jù)time-series,單Prometheus負載非常高。

當series數(shù)據(jù)超過300萬時,Prometheus內(nèi)存增長較為明顯,需要使用較大內(nèi)存的機器來運行。壓測過程中,我們使用了工具去生成預期數(shù)目的series,工具生成的series每個label的長度及值的長度都較小,固定為10個字符左右。我們的目的是觀察相對負載變化,實際生產(chǎn)中由于label長度不同,服務發(fā)現(xiàn)機制(比如Pod頻繁重啟)的消耗不同,相同的series數(shù)目所消耗的負載會比壓測中高不少。目前Argus有好幾個集群的采集端Prometheus消耗內(nèi)存在30G以上,這會導致查詢效率下降,嚴重的會導致OOM,有的大集群內(nèi)存消耗達幾百G。 argus運維監(jiān)控平臺讓運維工作不再繁瑣。智能化運維監(jiān)控創(chuàng)新

Argus基于Zabbix的IT運維監(jiān)控平臺。哪些運維監(jiān)控

一般公司里的運維,大致可以分為基礎運維、應用運維、運維開發(fā)、監(jiān)控組四大部分,而運維監(jiān)控是所有運維的基礎。1、基礎運維,負責IDC運維,服務器上下架,網(wǎng)絡設備等。2、應用運維,也就是systemadministrator,系統(tǒng)管理員。3、運維開發(fā),負責運維工具的開發(fā),系統(tǒng)開發(fā)等,例如開發(fā)監(jiān)控系統(tǒng),代碼發(fā)布系統(tǒng)。4、監(jiān)控組,也就是24小時值班的工作人員,需要時刻關注服務器,網(wǎng)站的狀況,出現(xiàn)問題后,盡快時間聯(lián)系相關運維以及研發(fā)人員。哪些運維監(jiān)控

上海觀縱科技有限公司位于上海市奉賢區(qū)望園南路1288弄80號1904、1909室。公司業(yè)務涵蓋webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應用性能監(jiān)控,Argus-IT運維監(jiān)控等,價格合理,品質(zhì)有保證。公司秉持誠信為本的經(jīng)營理念,在傳媒、廣電深耕多年,以技術為先導,以自主產(chǎn)品為重點,發(fā)揮人才優(yōu)勢,打造傳媒、廣電良好品牌。觀縱科技立足于全國市場,依托強大的研發(fā)實力,融合前沿的技術理念,及時響應客戶的需求。