分布式存儲(chǔ)的興起與互聯(lián)網(wǎng)的發(fā)展密不可分,互聯(lián)網(wǎng)公司由于其數(shù)據(jù)量大而資本積累少,而通常都使用大規(guī)模分布式存儲(chǔ)系統(tǒng)。與傳統(tǒng)的高duan服務(wù)器、高duan存儲(chǔ)器和高duan處理器不同的是,互聯(lián)網(wǎng)公司的分布式存儲(chǔ)系統(tǒng)由數(shù)量眾多的、低成本和高性價(jià)比的普通PC服務(wù)器通過網(wǎng)絡(luò)連接而成。其主要原因有以下三點(diǎn)(1)互聯(lián)網(wǎng)的業(yè)務(wù)發(fā)展很快,而且注意成本消耗,這就使得存儲(chǔ)系統(tǒng)不能依靠傳統(tǒng)的縱向擴(kuò)展的方式,即先買小型機(jī),不夠時(shí)再買中型機(jī),甚至大型機(jī)?;ヂ?lián)網(wǎng)后端的分布式系統(tǒng)要求支持橫向擴(kuò)展,即通過增加普通PC服務(wù)器來提高系統(tǒng)的整體處理能力。(2)普通PC服務(wù)器性價(jià)比高,故障率也高,需要在軟件層面實(shí)現(xiàn)自動(dòng)容錯(cuò),保證數(shù)據(jù)的一致性。(3)另外,隨著服務(wù)器的不斷加入,需要能夠在軟件層面實(shí)現(xiàn)自動(dòng)負(fù)載均衡,使得系統(tǒng)的處理能力得到線性擴(kuò)展。 分布式存儲(chǔ)“避坑”指南。上海分布式存儲(chǔ)架構(gòu)實(shí)戰(zhàn)
分布式存儲(chǔ)包含的種類繁多,除了傳統(tǒng)意義上的分布式文件系統(tǒng)、分布式塊存儲(chǔ)和分布式對(duì)象存儲(chǔ)外,還包括分布式數(shù)據(jù)庫和分布式緩存等,但其中架構(gòu)無外乎于三種;以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)。客戶端是通過一個(gè)設(shè)備映射關(guān)系計(jì)算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲(chǔ)節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。以Ceph為代biao的架構(gòu)是其典型的代biao。在該架構(gòu)中與HDFS不同的地方在于該架構(gòu)中沒有中心節(jié)點(diǎn)??蛻舳耸峭ㄟ^一個(gè)設(shè)備映射關(guān)系計(jì)算出來其寫入數(shù)據(jù)的位置,這樣客戶端可以直接與存儲(chǔ)節(jié)點(diǎn)通信,從而避免中心節(jié)點(diǎn)的性能瓶頸。 紹興什么是分布式存儲(chǔ)架構(gòu)實(shí)戰(zhàn)分布式存儲(chǔ)的小知識(shí),你值得擁有!
分布式存儲(chǔ)系統(tǒng)具有如下特性:數(shù)據(jù)分為多個(gè)分片存儲(chǔ)在多臺(tái)服務(wù)節(jié)點(diǎn)上。每個(gè)分片有多個(gè)副本,存儲(chǔ)在不同的服務(wù)節(jié)點(diǎn)上。許多客戶端并發(fā)訪問系統(tǒng),執(zhí)行讀寫操作,每個(gè)讀寫操作在系統(tǒng)中需要花費(fèi)不等的時(shí)間。除非下文中特別注明和討論,讀寫操作是原子的。與數(shù)據(jù)庫事務(wù)一致性的區(qū)別:數(shù)據(jù)庫事務(wù)的ACID的中也有一個(gè)一致性(consistency),但彼一致性非此一致性。ACID中的一致性是指,數(shù)據(jù)庫的事務(wù)的執(zhí)行,或者說事務(wù)觀察到的數(shù)據(jù),總是要滿足某些全局的一致性約束條件,如性約束,外鍵約束等。這個(gè)概念和數(shù)據(jù)庫的數(shù)據(jù)是否多副本沒關(guān)系。而本文的一致性在多副本的語境下才有意義。所以,數(shù)據(jù)庫事務(wù)的一致性,是指數(shù)據(jù)項(xiàng)之間總是滿足某些約束條件,或者說整個(gè)數(shù)據(jù)庫在滿足約束條件的意義上是正確的。
軟硬件解耦的分布式存儲(chǔ)在性能設(shè)計(jì)上存在兩大天然缺陷:標(biāo)準(zhǔn)服務(wù)器不具備機(jī)房突然斷電時(shí)保護(hù)內(nèi)存數(shù)據(jù)的電池(BBU),所以只能用SSD卡/盤來做數(shù)據(jù)緩存。SSD的時(shí)延遠(yuǎn)高于內(nèi)存,導(dǎo)致業(yè)界絕大多數(shù)的軟硬解耦的分布式存儲(chǔ)時(shí)延無法和生產(chǎn)存儲(chǔ)媲美。單獨(dú)采購的分布式存儲(chǔ)軟件無法和第三方服務(wù)器的SSD盤緊密配合,從而無法像業(yè)界先進(jìn)的全閃存存儲(chǔ)一樣實(shí)現(xiàn)全局垃圾回收,控制數(shù)量眾多的SSD盤各自的垃圾回收導(dǎo)致的生產(chǎn)應(yīng)用時(shí)延波動(dòng)。軟硬件一體的分布式存儲(chǔ)有機(jī)會(huì)克服如上兩大缺陷。我們看到業(yè)界先進(jìn)的分布式存儲(chǔ)產(chǎn)品,采用了類似于全閃存存儲(chǔ)的電池保護(hù)(BBU)、系統(tǒng)級(jí)全局垃圾回收,達(dá)到了媲美傳統(tǒng)生產(chǎn)存儲(chǔ)的高并發(fā)壓力下的1ms穩(wěn)定時(shí)延,從而為分布式存儲(chǔ)進(jìn)入企業(yè)生產(chǎn)應(yīng)用提供了性能的SLA保障。 布式存儲(chǔ)系統(tǒng),采用Scale-out擴(kuò)展架構(gòu),可實(shí)現(xiàn)超大集群規(guī)模的部署。
很多人可能對(duì)分布式存儲(chǔ)耳熟能詳,但是,大多數(shù)人對(duì)其概念或者知識(shí)點(diǎn)卻了解得都過于分散,看了很多卻“只見樹木,不見森林”,學(xué)了很多往往只能“知其然,卻不能知其所以然”。因此,有必要對(duì)分布式存儲(chǔ)的概念、問題和矛盾進(jìn)行一下分析和解讀。實(shí)際上,如果可能,應(yīng)該是盡量不使用分布式的,因?yàn)檫@會(huì)增加系統(tǒng)的復(fù)雜度和管理難度,然而,雖然是這樣,但這些終歸是可以通過其他技術(shù)來解決,而如果不使用分布式,系統(tǒng)的可用性、穩(wěn)定性都無法保證,更談不上系統(tǒng)的高性能了。因此,說分布式是被迫使用的,一點(diǎn)也不夸張。 分布式存儲(chǔ)在數(shù)據(jù)治理過程中的優(yōu)勢(shì)。安徽分布式存儲(chǔ)架構(gòu)實(shí)戰(zhàn)
分布式存儲(chǔ)在數(shù)據(jù)治理過程中的定位。上海分布式存儲(chǔ)架構(gòu)實(shí)戰(zhàn)
為了保證分布式存儲(chǔ)系統(tǒng)的高可靠和高可用,數(shù)據(jù)在系統(tǒng)中一般存儲(chǔ)多個(gè)副本。當(dāng)某個(gè)副本所在的存儲(chǔ)節(jié)點(diǎn)出現(xiàn)故障時(shí),分布式存儲(chǔ)系統(tǒng)能夠自動(dòng)將服務(wù)切換到其他的副本,從而實(shí)現(xiàn)自動(dòng)容錯(cuò)。分布式存儲(chǔ)系統(tǒng)通過復(fù)制協(xié)議將數(shù)據(jù)同步到多個(gè)存儲(chǔ)節(jié)點(diǎn),并確保多個(gè)副本之間的數(shù)據(jù)一致性。客戶端將寫請(qǐng)求發(fā)送給主副本,主副本將寫請(qǐng)求復(fù)制到其他備副本,常見的做法是同步操作日志(CommitLog)。主副本首先將操作日志同步到備副本,備副本回放操作日志,完成后通知主副本。接著,主副本修改本機(jī),等到所有的操作都完成后再通知客戶端寫成功。下圖中的復(fù)制協(xié)議要求主備同步成功才可以返回客戶端寫成功,這種協(xié)議稱為強(qiáng)同步協(xié)議。 上海分布式存儲(chǔ)架構(gòu)實(shí)戰(zhàn)
江蘇魏晉元興智能科技有限公司致力于數(shù)碼、電腦,是一家貿(mào)易型的公司。魏晉元興智能致力于為客戶提供良好的網(wǎng)絡(luò)安全,VR,MR,VR,AI,視頻監(jiān)控安防,出入口門禁失控制,一切以用戶需求為中心,深受廣大客戶的歡迎。公司從事數(shù)碼、電腦多年,有著創(chuàng)新的設(shè)計(jì)、強(qiáng)大的技術(shù),還有一批**的專業(yè)化的隊(duì)伍,確保為客戶提供良好的產(chǎn)品及服務(wù)。魏晉元興智能立足于全國市場(chǎng),依托強(qiáng)大的研發(fā)實(shí)力,融合前沿的技術(shù)理念,飛快響應(yīng)客戶的變化需求。