為什么Zabbix需要HA?讓我們深入探討什么是高可用性,并嘗試定義“高可用性”一詞的含義:如果一個(gè)系統(tǒng)沒有單點(diǎn)故障,那么系統(tǒng)是以高可用性模式運(yùn)行;單點(diǎn)故障是導(dǎo)致整個(gè)系統(tǒng)停止運(yùn)行的部件故障;在使用高可用性的系統(tǒng)中,冗余是一項(xiàng)要求。在我們的例子中,我們需要一個(gè)冗余組件,如果當(dāng)前活動(dòng)的組件遇到問題,我們可以將其故障轉(zhuǎn)移到該組件;故障切換過程需要透明和自動(dòng)化;就Zabbix平臺(tái)架構(gòu)而言,單點(diǎn)故障就是我們的ZabbixServer。盡管Zabbix自身非常穩(wěn)定,但是仍然會(huì)因?yàn)椴僮飨到y(tǒng)級(jí)別的問題或其它不可預(yù)料的情況(如磁盤空間不足)而發(fā)生Zabbix平臺(tái)崩潰。如果ZabbixServer停機(jī),所有數(shù)據(jù)收集、問題檢測(cè)和警報(bào)都將停止。這就是為什么Zabbix提供可以實(shí)現(xiàn)高可用和冗余的組件非常重要。zabbix大流量數(shù)據(jù)的接收。要求zabbix聯(lián)系方式
原生態(tài)ZabbixHA高可用方案Zabbix6.0LTS版本所提供的高可用解決方案易于設(shè)置,所需的所有步驟都記錄在Zabbix文檔中。本解決方案不需要任何額外的專業(yè)知識(shí),Zabbix將繼續(xù)提供官方支持、更新和改進(jìn)。本高可用性解決方案不需要任何新的軟件組件——高可用性解決方案將有關(guān)Zabbix服務(wù)器節(jié)點(diǎn)狀態(tài)的信息存儲(chǔ)在Zabbix數(shù)據(jù)庫后端。Zabbix集群是如何工作的要啟用ZabbixServer的高可用功能,我們首先需要在高可用模式下啟動(dòng)Zabbix服務(wù)器組件。為了實(shí)現(xiàn)這一點(diǎn),我們需要查看/etc/zabbix/zabbix_文件中的兩個(gè)新參數(shù):HANodeName–為ZabbixServer集群指定任意名稱;ExternalAddress–指定集群節(jié)點(diǎn)的地址;完成更改并添加這些參數(shù)后,不要忘記重新啟動(dòng)ZabbixServer集群集節(jié)點(diǎn)以應(yīng)用更改。zabbix監(jiān)控mysql監(jiān)控工具之Zabbix,搭建過程和使用心得。
zabbix優(yōu)點(diǎn):1、數(shù)據(jù)采集:可用性和性能檢測(cè),自動(dòng)發(fā)現(xiàn),支持agent、snmp、JMX、telnet等多種采集方式,支持主動(dòng)和被動(dòng)模式數(shù)據(jù)傳輸、支持用戶自定義插件,自定義間隔收集數(shù)據(jù)2、高可用:server對(duì)設(shè)備性能要求低,支持proxy分布式監(jiān)控,分布式集中管理,有自動(dòng)發(fā)現(xiàn)功能,可以實(shí)現(xiàn)自動(dòng)化監(jiān)控;開放式接口,擴(kuò)展性強(qiáng),插件編寫容易3、告警管理:支持多條件告警,支持多種告警方式,支持多組模板,模板繼承。4、告警設(shè)置:告警周期,告警級(jí)別,告警恢復(fù)通知、告警暫停,時(shí)段閾值、支持維護(hù)周期、支持單機(jī)停用5、圖形化展示:允許自定義創(chuàng)建多監(jiān)控項(xiàng)視圖,網(wǎng)絡(luò)拓?fù)?,自定義面板展示,自定義IT服務(wù)可用性6、歷史數(shù)據(jù):歷史數(shù)據(jù)查詢可配置,內(nèi)置housekeeping數(shù)據(jù)清理機(jī)制7、安全審計(jì):具備安全的用戶審計(jì)日志,權(quán)限認(rèn)證,用戶可以限制允許維護(hù)的列表。
作為監(jiān)控系統(tǒng),Zabbix所面臨的挑戰(zhàn)之一在于需要從大量的監(jiān)控目標(biāo)接收數(shù)據(jù),這一方面意味著需要連接非常多的監(jiān)控目標(biāo),另一方面意味著監(jiān)控?cái)?shù)據(jù)的流量(訪問量)比較大。影響這種通信效率的一個(gè)重要因素是通信協(xié)議,考慮到單個(gè)消息中包含的數(shù)據(jù)量不同,在數(shù)據(jù)接收階段,Zabbix采用了兩種不同的通信協(xié)議。Trapper進(jìn)程要求在每個(gè)消息中包含較大量的監(jiān)控?cái)?shù)據(jù),因此Zabbix采用基于TCP協(xié)議和JSON格式的自定義協(xié)議進(jìn)行通信。而對(duì)于poller進(jìn)程,當(dāng)poller進(jìn)程向agent請(qǐng)求單個(gè)監(jiān)控值時(shí),Zabbix采用簡(jiǎn)化的文本協(xié)議進(jìn)行通信,以提高通信效率。Zabbix具有足夠的靈活性和通用性,可以全棧監(jiān)控從硬件層到比較上層業(yè)務(wù)服務(wù)的整個(gè)IT基礎(chǔ)架構(gòu)。
如何為Zabbix選擇高可用方案在Zabbix6.0LTS版本中增加ZabbixServerHA集群功能支持之前,一般使用第三方HA方案來實(shí)現(xiàn)ZabbixServer的高可用。這引發(fā)了一場(chǎng)持續(xù)的討論——我應(yīng)該使用哪種第三方解決方案,以及我應(yīng)該如何為Zabbix組件配置它?除此之外,您還將擁有一個(gè)新的軟件層,需要適當(dāng)?shù)膶I(yè)知識(shí)來部署、配置和管理。當(dāng)然,也有基于云的HA方案,但大多數(shù)情況下,這些方案會(huì)產(chǎn)生額外的成本。沒有第三方高可用性工具所需的專業(yè)知識(shí)可能會(huì)導(dǎo)致不必要的Zabbix系統(tǒng)停機(jī),在壞的情況下,可能會(huì)導(dǎo)致ZabbixDB后端不一致。以下是錯(cuò)誤配置的高可用性解決方案可能引發(fā)的情況:自動(dòng)故障切換可能未正確配置;兩個(gè)ZabbixServer節(jié)點(diǎn)同時(shí)運(yùn)行的場(chǎng)景,可能會(huì)導(dǎo)致Zabbix數(shù)據(jù)庫后端不一致;錯(cuò)誤配置STONITH(射中頭部的另一個(gè)節(jié)點(diǎn))場(chǎng)景——可能導(dǎo)致兩個(gè)ZabbixServer節(jié)點(diǎn)都崩潰;Zabbix性能改進(jìn)和內(nèi)部變化。安徽zabbix技術(shù)指導(dǎo)
Zabbix主要功能和優(yōu)劣勢(shì)有哪些?要求zabbix聯(lián)系方式
Zabbix通過很大程度地減少寫鎖持有時(shí)間,并將持有時(shí)間碎片化,從而降低了寫鎖對(duì)Zabbix進(jìn)程并行性能的影響。我們注意到configuration syncer進(jìn)程是***的,并未采用多進(jìn)程方式,這一方面是因?yàn)樵獢?shù)據(jù)內(nèi)部需要維持某些一致性,如果使用多進(jìn)程方式,無疑會(huì)增加維持一致性方面的開銷,另一方面,如果采用多進(jìn)程,這些進(jìn)程之間仍然需要解決鎖***的問題,**終的結(jié)果與單進(jìn)程并無多大區(qū)別。不過,如果能夠基于元數(shù)據(jù)之間的**性,實(shí)現(xiàn)基于數(shù)據(jù)分組的并行化,那就另當(dāng)別論。要求zabbix聯(lián)系方式
上海觀縱科技有限公司致力于傳媒、廣電,以科技創(chuàng)新實(shí)現(xiàn)高質(zhì)量管理的追求。觀縱科技深耕行業(yè)多年,始終以客戶的需求為向?qū)?,為客戶提供高質(zhì)量的webfunny前端監(jiān)控,webfunny前端埋點(diǎn),全鏈路應(yīng)用性能監(jiān)控,Argus-IT運(yùn)維監(jiān)控。觀縱科技致力于把技術(shù)上的創(chuàng)新展現(xiàn)成對(duì)用戶產(chǎn)品上的貼心,為用戶帶來良好體驗(yàn)。觀縱科技創(chuàng)始人姜應(yīng)偉,始終關(guān)注客戶,創(chuàng)新科技,竭誠為客戶提供良好的服務(wù)。