哪個運(yùn)維監(jiān)控管理案例好用

來源: 發(fā)布時間:2023-02-05

2020年12月13日,據(jù)海外媒體報道,一個名為APT的網(wǎng)絡(luò)入侵組織把世界出名網(wǎng)管軟件廠商SolarWinds作為入侵目標(biāo)。這次APT攻擊首先是對SolarWinds旗下的Orion網(wǎng)絡(luò)監(jiān)控軟件更新服務(wù)器進(jìn)行入侵,并在軟件更新(Orion)中植入了惡意代碼。透露大約有1.8萬客戶在其系統(tǒng)上部署了該更新,且對美國財政部高層領(lǐng)導(dǎo)使用的電子郵件系統(tǒng)也造成了影響。

SolarWinds的系統(tǒng)被攻擊之后,已導(dǎo)致全球許多組織的網(wǎng)絡(luò)遭到破壞,涉及的供應(yīng)鏈范圍極為廣大,被稱為2020年美國極大網(wǎng)絡(luò)安全事件。

“太陽風(fēng)”(SolarWinds) 是一家專職提供IT監(jiān)控和運(yùn)維解決方案的商業(yè)公司。其產(chǎn)品SolarWinds Orion Network Performance Monitor(NPM)是集網(wǎng)絡(luò)監(jiān)測、設(shè)備性能維護(hù)管理、故障監(jiān)控、網(wǎng)絡(luò)實時流量監(jiān)控和歷史數(shù)據(jù)統(tǒng)計、匯總和歷史數(shù)據(jù)分析、虛擬數(shù)據(jù)中心監(jiān)控、網(wǎng)絡(luò)拓?fù)浔O(jiān)控等功能于一體的網(wǎng)絡(luò)管理系統(tǒng)。該軟件主要是用于企業(yè)內(nèi)部網(wǎng)絡(luò)管理,目前全球客戶超過32萬家。SolarWinds作為一個齊全的IT管理系統(tǒng)還有一些功能的欠缺,而且中文支持也是一個國內(nèi)推廣的難題。像同一類型的軟件Hostmonitor、CA Unicenter也是存在同樣的問題。 Argus是觀縱科技自主研發(fā)的it運(yùn)維監(jiān)控系統(tǒng),旨在對信息中心軟硬件實施全天候無死角監(jiān)控。哪個運(yùn)維監(jiān)控管理案例好用

觀縱在協(xié)調(diào)交付與研發(fā)做信創(chuàng)產(chǎn)品適配,幫助客戶在內(nèi)部搭建信創(chuàng)環(huán)境的時候發(fā)現(xiàn),如果想讓運(yùn)維行業(yè)的信創(chuàng)產(chǎn)業(yè)高質(zhì)量發(fā)展,是依靠自主創(chuàng)新研發(fā)產(chǎn)品是不夠的,還需要有領(lǐng)航者來為運(yùn)維行業(yè)發(fā)展做“規(guī)劃”,給予客戶足夠的安全感和信任感。

如今,觀縱的Argus運(yùn)維監(jiān)控系統(tǒng)目前已獲得部分信創(chuàng)適配證書。未來觀縱將繼續(xù)投入人力與物力,對產(chǎn)品進(jìn)行創(chuàng)新實踐,加快其在信創(chuàng)領(lǐng)域的運(yùn)維場景落地應(yīng)用,攜手上下游合作伙伴共建生態(tài),領(lǐng)導(dǎo)智能運(yùn)維行業(yè)向高質(zhì)量發(fā)展。 信創(chuàng)智能運(yùn)維監(jiān)控管理平臺Argus運(yùn)維監(jiān)控全自動拓?fù)渖?,?zhǔn)確率高達(dá)90%以上。

在信息系統(tǒng)的生命周期中,一般系統(tǒng)建設(shè)的時間大約為一年,而系統(tǒng)使用運(yùn)維的時間大約四到七年或更長,因此,業(yè)界提出了“三分建設(shè),七分管理”的運(yùn)維監(jiān)控管理。經(jīng)過大致兩輪的信息化建設(shè),企業(yè)信息化將逐步趨于成熟,后續(xù)信息化工作的重點之一便是做好系統(tǒng)的運(yùn)維工作,保障系系統(tǒng)平穩(wěn)運(yùn)行,支撐業(yè)務(wù)發(fā)展。

信息保障部門日常運(yùn)行管理條塊分割,網(wǎng)絡(luò)、應(yīng)用、IT基礎(chǔ)環(huán)境等資源需要不同技能分工人員,在不同時段值守,當(dāng)網(wǎng)絡(luò)設(shè)備發(fā)生變化時,無法迅速的適應(yīng)。各類業(yè)務(wù)應(yīng)用系統(tǒng)缺乏針對性的管理平臺,單從網(wǎng)元和資源個體進(jìn)行管理的角度無法解決業(yè)務(wù)系統(tǒng)的監(jiān)控要求,因為業(yè)務(wù)系統(tǒng)是由多個關(guān)聯(lián)資源及其關(guān)聯(lián)關(guān)系組成,一旦業(yè)務(wù)系統(tǒng)出現(xiàn)運(yùn)行過慢、無法登錄、應(yīng)用報錯等問題時,難以排查具體的故障點,從而影響業(yè)務(wù)系統(tǒng)故障恢復(fù),也不利于業(yè)務(wù)系統(tǒng)的性能調(diào)優(yōu),造成單位IT資源與IT管理人員的“雙高”負(fù)荷運(yùn)轉(zhuǎn)。沒有統(tǒng)一的實時監(jiān)控IT運(yùn)維是依托經(jīng)驗式、補(bǔ)救式的事后運(yùn)維。同樣的IT故障引發(fā)大范圍報障,需要通過監(jiān)控鎖定故障源合并事件;同樣的IT故障在缺乏監(jiān)控數(shù)據(jù)描述和處置經(jīng)驗的支撐時,擅長不同技能的運(yùn)維工程師處理效率有天壤之別;同樣的IT故障高頻復(fù)發(fā),需要監(jiān)控的分析優(yōu)化資源配置。

中間件和數(shù)據(jù)庫組件監(jiān)控:中間件和數(shù)據(jù)庫組件都統(tǒng)一提供sidecar模式部署的exporter進(jìn)行指標(biāo)采集,并配置監(jiān)控告警。如果不是集群納管的數(shù)據(jù)庫,也可以開發(fā)自定義exporter(kingbase、greatdb等國產(chǎn)數(shù)據(jù)庫都走這個方式),也可以開發(fā)指標(biāo)推到Prometheus的pushgateway(polardb國產(chǎn)數(shù)據(jù)庫走這個方式),還可以配置Prometheus去拉取各組件的metrics(etcd等中間件有提供標(biāo)準(zhǔn)的metrics)。

各業(yè)務(wù)集群怎么部署監(jiān)控組件各業(yè)務(wù)集群都單獨部署Prometheus和grafana;在集群各節(jié)點部署有kubelet客戶端和demonset模式的node-exporter;在集群管理節(jié)點部署Deloyment模式的kube-state-metrics;而k8s的管理組件kube-scheduler、control-manager、etcd自帶metrics,不需要部署任何采集工具,而是在Prometheus的配置文件中配置各組件的metrics地址獲取指標(biāo)數(shù)據(jù);中間件和數(shù)據(jù)庫組件內(nèi)帶有Sidecar模式的xxx-exporter(比如mysql-exporter),部署中間件和數(shù)據(jù)庫時就開始收集監(jiān)控數(shù)據(jù)。 以 zabbix 為采集中心配合自研的 ArgusNMS 增強(qiáng)模塊為一組采集單元, ArgusEdge 的統(tǒng)一調(diào)度實現(xiàn)監(jiān)管控的需求。

數(shù)據(jù)準(zhǔn)入:所有數(shù)據(jù)對象化,定義固定字段、對象描述字段、對象具體數(shù)值三類,便于后續(xù)管理。數(shù)據(jù)血緣:數(shù)據(jù)采集階段記錄數(shù)據(jù)依賴關(guān)系,明確展示數(shù)據(jù)血緣,避免數(shù)據(jù)關(guān)聯(lián)錯誤同時可比較大化減少數(shù)據(jù)冗余。數(shù)據(jù)生命周期:嚴(yán)格控制數(shù)據(jù)存儲生命周期,定時對冗余數(shù)據(jù)進(jìn)行清洗校驗,確保整體性能。數(shù)據(jù)完整性:基于數(shù)據(jù)血緣,對所有數(shù)據(jù)的完整性進(jìn)行校驗,不僅對單條數(shù)據(jù)本身同時需要對上下關(guān)聯(lián)數(shù)據(jù)進(jìn)行校驗。數(shù)據(jù)責(zé)任制:將各類數(shù)據(jù)的正確性和關(guān)聯(lián)性責(zé)任到各個專業(yè)團(tuán)隊,從源頭控制數(shù)據(jù)質(zhì)量。我們要運(yùn)維監(jiān)控的對象你是否了解呢?比如CPU到底是如何工作的?信創(chuàng)智能運(yùn)維監(jiān)控管理平臺

想吃透運(yùn)維監(jiān)控系統(tǒng),就這一篇足夠了!哪個運(yùn)維監(jiān)控管理案例好用

Argus搭建可觀測性監(jiān)控的原則客觀性、系統(tǒng)性、關(guān)聯(lián)性、預(yù)見性。低嵌入、無干擾的第三方視角觀測采集數(shù)據(jù);不單一的只看某個指標(biāo),注重各觀測角度之間的整體性關(guān)系,系統(tǒng)的涵蓋所需觀察的每個方面,體現(xiàn)出被觀測對象較為完整的觀測結(jié)果;每個監(jiān)控項或應(yīng)用既具單獨性,又具相關(guān)性,而各要素和體關(guān)聯(lián)性系之間同樣存在這種“相互關(guān)聯(lián)或相互作用”的關(guān)系;任何事物的觀察都是基于時間的動態(tài)行為,監(jiān)控的目的是要提早發(fā)現(xiàn)風(fēng)險,避免發(fā)生故障,所以我們所有的監(jiān)控行為都要對將來可能發(fā)生事件實現(xiàn)預(yù)判。 哪個運(yùn)維監(jiān)控管理案例好用

上海觀縱科技有限公司是一家集研發(fā)、生產(chǎn)、咨詢、規(guī)劃、銷售、服務(wù)于一體的服務(wù)型企業(yè)。公司成立于2022-11-14,多年來在webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控行業(yè)形成了成熟、可靠的研發(fā)、生產(chǎn)體系。公司主要經(jīng)營webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控等產(chǎn)品,產(chǎn)品質(zhì)量可靠,均通過傳媒、廣電行業(yè)檢測,嚴(yán)格按照行業(yè)標(biāo)準(zhǔn)執(zhí)行。目前產(chǎn)品已經(jīng)應(yīng)用與全國30多個省、市、自治區(qū)。webfunny,walkingfunny,argus為用戶提供真誠、貼心的售前、售后服務(wù),產(chǎn)品價格實惠。公司秉承為社會做貢獻(xiàn)、為用戶做服務(wù)的經(jīng)營理念,致力向社會和用戶提供滿意的產(chǎn)品和服務(wù)。上海觀縱科技有限公司注重以人為本、團(tuán)隊合作的企業(yè)文化,通過保證webfunny前端監(jiān)控,webfunny前端埋點,全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控產(chǎn)品質(zhì)量合格,以誠信經(jīng)營、用戶至上、價格合理來服務(wù)客戶。建立一切以客戶需求為前提的工作目標(biāo),真誠歡迎新老客戶前來洽談業(yè)務(wù)。