青海運(yùn)維監(jiān)控技術(shù)指導(dǎo)

來源: 發(fā)布時間:2023-01-31

在云原生時代,基礎(chǔ)設(shè)施與應(yīng)用的部署構(gòu)建都發(fā)生了極大變化,傳統(tǒng)的監(jiān)控方式已經(jīng)無法適應(yīng)云原生的場景。Prometheus支持對kubernetes和容器的監(jiān)控,基本上是完美選擇,那么通過Prometheus監(jiān)控體系如何搭建PAAS監(jiān)控體系?監(jiān)控哪些對象?

k8s管理組件、節(jié)點(diǎn)、pod容器、各種中間件數(shù)據(jù)庫組件指標(biāo):mysql、redis、kafka、rocketmq、activemq、zookeeper、elasticsearch、mongodb、nginx、clickhouse。同時,還提供了kingbase、polardb、GreatDB等國產(chǎn)數(shù)據(jù)庫的監(jiān)控。

怎么監(jiān)控?

k8s組件監(jiān)控:Prometheus直接拉取各組件的metrics接口數(shù)據(jù);

節(jié)點(diǎn)監(jiān)控:在各節(jié)點(diǎn)部署node_exporter,Prometheus自動發(fā)現(xiàn)所有節(jié)點(diǎn)對象拉取exporter提供的數(shù)據(jù);

pod容器監(jiān)控:用各節(jié)點(diǎn)部署的kubelet的cadivisor功能,使Prometheus自動發(fā)現(xiàn)并拉取cadivisor提供的容器運(yùn)行時指標(biāo),并部署kube-state-metrics拉取pod容器元數(shù)據(jù)。 Argus基于Zabbix的IT運(yùn)維監(jiān)控平臺。青海運(yùn)維監(jiān)控技術(shù)指導(dǎo)

信創(chuàng)終端運(yùn)維服務(wù)、數(shù)據(jù)中心運(yùn)維服務(wù)、業(yè)務(wù)系統(tǒng)運(yùn)維服務(wù)、適配遷移服務(wù)、安全運(yùn)維服務(wù)等信創(chuàng)運(yùn)維服務(wù)。通過信創(chuàng)運(yùn)維服務(wù)體系、信創(chuàng)安全管理體系、信創(chuàng)一體化服務(wù)保障平臺、信創(chuàng)現(xiàn)場和遠(yuǎn)程運(yùn)維服務(wù)管理平臺,規(guī)范信創(chuàng)運(yùn)維服務(wù)過程,提升信創(chuàng)運(yùn)維服務(wù)保障能力,為客戶創(chuàng)建可視可控的運(yùn)維環(huán)境,保障信創(chuàng)終端、數(shù)據(jù)中心和業(yè)務(wù)應(yīng)用系統(tǒng)的可靠、高效、持續(xù)、安全運(yùn)行。

多種信創(chuàng)技術(shù)路線并存:信創(chuàng)運(yùn)維技術(shù)難度高,缺乏成熟運(yùn)維技術(shù)和經(jīng)驗參考,信創(chuàng)運(yùn)維技術(shù)培訓(xùn)不健全。信創(chuàng)適配遷移困難:缺乏應(yīng)用系統(tǒng)適配改造經(jīng)驗,應(yīng)用遷移涉及重構(gòu)與重編譯,工作量大,遷移工具不成熟。信創(chuàng)生態(tài)環(huán)境不成熟:信創(chuàng)產(chǎn)品性能、可靠性、品質(zhì)、成熟度參差不齊,生態(tài)環(huán)境不成熟,產(chǎn)業(yè)鏈生態(tài)整合能力弱。信創(chuàng)運(yùn)維管理復(fù)雜:信創(chuàng)環(huán)境和非信創(chuàng)環(huán)境并存,運(yùn)維管理復(fù)雜。與國外成熟產(chǎn)品差距大,運(yùn)維難度高,要求較高的運(yùn)維技術(shù)能力。 中國香港運(yùn)維監(jiān)控答疑解惑Argus運(yùn)維監(jiān)控體系全梳理!

2020年12月13日,據(jù)海外媒體報道,一個名為APT的網(wǎng)絡(luò)入侵組織把世界出名網(wǎng)管軟件廠商SolarWinds作為入侵目標(biāo)。這次APT攻擊首先是對SolarWinds旗下的Orion網(wǎng)絡(luò)監(jiān)控軟件更新服務(wù)器進(jìn)行入侵,并在軟件更新(Orion)中植入了惡意代碼。透露大約有1.8萬客戶在其系統(tǒng)上部署了該更新,且對美國財政部高層領(lǐng)導(dǎo)使用的電子郵件系統(tǒng)也造成了影響。

SolarWinds的系統(tǒng)被攻擊之后,已導(dǎo)致全球許多組織的網(wǎng)絡(luò)遭到破壞,涉及的供應(yīng)鏈范圍極為廣大,被稱為2020年美國極大網(wǎng)絡(luò)安全事件。

“太陽風(fēng)”(SolarWinds) 是一家專職提供IT監(jiān)控和運(yùn)維解決方案的商業(yè)公司。其產(chǎn)品SolarWinds Orion Network Performance Monitor(NPM)是集網(wǎng)絡(luò)監(jiān)測、設(shè)備性能維護(hù)管理、故障監(jiān)控、網(wǎng)絡(luò)實時流量監(jiān)控和歷史數(shù)據(jù)統(tǒng)計、匯總和歷史數(shù)據(jù)分析、虛擬數(shù)據(jù)中心監(jiān)控、網(wǎng)絡(luò)拓?fù)浔O(jiān)控等功能于一體的網(wǎng)絡(luò)管理系統(tǒng)。該軟件主要是用于企業(yè)內(nèi)部網(wǎng)絡(luò)管理,目前全球客戶超過32萬家。SolarWinds作為一個齊全的IT管理系統(tǒng)還有一些功能的欠缺,而且中文支持也是一個國內(nèi)推廣的難題。像同一類型的軟件Hostmonitor、CA Unicenter也是存在同樣的問題。

Argus搭建可觀測性監(jiān)控的原則客觀性、系統(tǒng)性、關(guān)聯(lián)性、預(yù)見性。低嵌入、無干擾的第三方視角觀測采集數(shù)據(jù);不單一的只看某個指標(biāo),注重各觀測角度之間的整體性關(guān)系,系統(tǒng)的涵蓋所需觀察的每個方面,體現(xiàn)出被觀測對象較為完整的觀測結(jié)果;每個監(jiān)控項或應(yīng)用既具單獨(dú)性,又具相關(guān)性,而各要素和體關(guān)聯(lián)性系之間同樣存在這種“相互關(guān)聯(lián)或相互作用”的關(guān)系;任何事物的觀察都是基于時間的動態(tài)行為,監(jiān)控的目的是要提早發(fā)現(xiàn)風(fēng)險,避免發(fā)生故障,所以我們所有的監(jiān)控行為都要對將來可能發(fā)生事件實現(xiàn)預(yù)判。 5個運(yùn)維必須知道的運(yùn)維監(jiān)控系統(tǒng),功能真心強(qiáng)大!

對于網(wǎng)絡(luò)出口與網(wǎng)絡(luò)專線的有效監(jiān)控與分析,既能協(xié)助業(yè)務(wù)運(yùn)維同學(xué)有效地定位業(yè)務(wù)異常、評估業(yè)務(wù)服務(wù)質(zhì)量等,也能有效地度量業(yè)務(wù)整體運(yùn)營成本,畢竟現(xiàn)在帶寬的使用成本在整體運(yùn)營成本中也是占比越來越大。相信運(yùn)維同學(xué)多少都會遇到下面等較高頻的使用場景:

這條專線當(dāng)前利用率多少?

在已經(jīng)使用的流量中,某個IP使用了多少流量?這些所產(chǎn)生的流量是基于什么協(xié)議與方向?

專線與網(wǎng)絡(luò)出口的丟包率與時延是怎么樣的?

每條專線中主要是哪些務(wù)在用?哪個是“地主客戶”?對

于網(wǎng)絡(luò)流量的監(jiān)控來說,其實中心是一個分析平臺,通過把采集到的各種流量包抓取過來,然后再把相應(yīng)的流量送入分析集群。 觀縱將強(qiáng)大的Argus IT運(yùn)維監(jiān)控做到數(shù)據(jù)化、工具化、可視化。哪些運(yùn)維監(jiān)控哪里有賣的

IT運(yùn)維監(jiān)控所包含的產(chǎn)品功能強(qiáng)大、易于使用、解決方案齊全,可一站式滿足用戶的各種IT管理需求。青海運(yùn)維監(jiān)控技術(shù)指導(dǎo)

整個餓了么監(jiān)控系統(tǒng)在演進(jìn)過程中主要分為如下3個階段:

第一階段:主要由Statsd/Graphite/Grafana負(fù)責(zé)業(yè)務(wù)層的監(jiān)控,ETrace負(fù)責(zé)全鏈路監(jiān)控,Zabbix負(fù)責(zé)服務(wù)器層面的監(jiān)控,ELog負(fù)責(zé)分布式日志搜索;

第二階段:整個餓了么也從單IDC演進(jìn)成異地多活架構(gòu),所以對監(jiān)控也提出了更高的要求,基于這個我們也自研LinDB,以支持多活架構(gòu)下的監(jiān)控,Zabbix慢慢被ESM/InfluxDB/Grafana所替換,使用ELK替換原來的日志方案;

第三階段:主要做一個減法,即把原來StatsD/Graphite/ETrace/ESM/InfluxDB統(tǒng)一到了EMonitor+LinDB這樣的平臺,以提供給用戶一套統(tǒng)一的監(jiān)控平臺,日志開始使用阿里云的SLS。 青海運(yùn)維監(jiān)控技術(shù)指導(dǎo)

上海觀縱科技有限公司致力于傳媒、廣電,以科技創(chuàng)新實現(xiàn)高質(zhì)量管理的追求。觀縱科技擁有一支經(jīng)驗豐富、技術(shù)創(chuàng)新的專業(yè)研發(fā)團(tuán)隊,以高度的專注和執(zhí)著為客戶提供webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控。觀縱科技繼續(xù)堅定不移地走高質(zhì)量發(fā)展道路,既要實現(xiàn)基本面穩(wěn)定增長,又要聚焦關(guān)鍵領(lǐng)域,實現(xiàn)轉(zhuǎn)型再突破。觀縱科技創(chuàng)始人姜應(yīng)偉,始終關(guān)注客戶,創(chuàng)新科技,竭誠為客戶提供良好的服務(wù)。