日韩久久久精品,亚洲精品久久久久久久久久久,亚洲欧美一区二区三区国产精品 ,一区二区福利

一致性hash

系統(tǒng) 1865 0
? 【轉(zhuǎn)】

一致性hash算法 - consistent hashing

?

? http://blog.csdn.net/sparkliang/article/details/5279393

?
?
?

一致性 ? hash ? 算法( ? consistent hashing ?

張亮

consistent hashing ? 算法早在 ? 1997 ? 年就在論文 ? Consistent hashing and random trees ? 中被提出,目前在 ? cache ? 系統(tǒng)中應(yīng)用越來越廣泛;

1 ? 基本場景

比如你有 ? N ? 個(gè) ? cache ? 服務(wù)器(后面簡稱 ? cache ? ),那么如何將一個(gè)對象 ? object ? 映射到 ? N ? 個(gè) ? cache ? 上呢,你很可能會采用類似下面的通用方法計(jì)算 ? object ? ? hash ? 值,然后均勻的映射到到 ? N ? 個(gè) ? cache ?

hash(object)%N

一切都運(yùn)行正常,再考慮如下的兩種情況;

1 ? 一個(gè) ? cache ? 服務(wù)器 ? m down ? 掉了(在實(shí)際應(yīng)用中必須要考慮這種情況),這樣所有映射到 ? cache m ? 的對象都會失效,怎么辦,需要把 ? cache m ? ? cache ? 中移除,這時(shí)候 ? cache ? ? N-1 ? 臺,映射公式變成了 ? hash(object)%(N-1) ?

2 ? 由于訪問加重,需要添加 ? cache ? ,這時(shí)候 ? cache ? ? N+1 ? 臺,映射公式變成了 ? hash(object)%(N+1) ?

1 ? ? 2 ? 意味著什么?這意味著突然之間幾乎所有的 ? cache ? 都失效了。對于服務(wù)器而言,這是一場災(zāi)難,洪水般的訪問都會直接沖向后臺服務(wù)器;

再來考慮第三個(gè)問題,由于硬件能力越來越強(qiáng),你可能想讓后面添加的節(jié)點(diǎn)多做點(diǎn)活,顯然上面的 ? hash ? 算法也做不到。

? ? 有什么方法可以改變這個(gè)狀況呢,這就是 ? consistent hashing...

2 hash ? 算法和單調(diào)性

? Hash ? 算法的一個(gè)衡量指標(biāo)是單調(diào)性( ? Monotonicity ? ),定義如下:

  單調(diào)性是指如果已經(jīng)有一些內(nèi)容通過哈希分派到了相應(yīng)的緩沖中,又有新的緩沖加入到系統(tǒng)中。哈希的結(jié)果應(yīng)能夠保證原有已分配的內(nèi)容可以被映射到新的緩沖中去,而不會被映射到舊的緩沖集合中的其他緩沖區(qū)。

容易看到,上面的簡單 ? hash ? 算法 ? hash(object)%N ? 難以滿足單調(diào)性要求。

3 consistent hashing ? 算法的原理

consistent hashing ? 是一種 ? hash ? 算法,簡單的說,在移除 ? / ? 添加一個(gè) ? cache ? 時(shí),它能夠盡可能小的改變已存在 ? key ? 映射關(guān)系,盡可能的滿足單調(diào)性的要求。

下面就來按照 ? 5 ? 個(gè)步驟簡單講講 ? consistent hashing ? 算法的基本原理。

3.1 ? 環(huán)形 hash ? 空間

考慮通常的 ? hash ? 算法都是將 ? value ? 映射到一個(gè) ? 32 ? 為的 ? key ? 值,也即是 ? 0~2^32-1 ? 次方的數(shù)值空間;我們可以將這個(gè)空間想象成一個(gè)首( ? 0 ? )尾( ? 2^32-1 ? )相接的圓環(huán),如下面圖 ? 1 ? 所示的那樣。

circle space

? 1 ? 環(huán)形 ? hash ? 空間

3.2 ? 把對象映射到 hash ? 空間

接下來考慮 ? 4 ? 個(gè)對象 ? object1~object4 ? ,通過 ? hash ? 函數(shù)計(jì)算出的 ? hash ? ? key ? 在環(huán)上的分布如圖 ? 2 ? 所示。

hash(object1) = key1;

… …

hash(object4) = key4;

object

? 2 4 ? 個(gè)對象的 ? key ? 值分布

3.3 ? cache ? 映射到 hash ? 空間

Consistent hashing ? 的基本思想就是將對象和 ? cache ? 都映射到同一個(gè) ? hash ? 數(shù)值空間中,并且使用相同的 hash ? 算法。

假設(shè)當(dāng)前有 ? A,B ? ? C ? ? 3 ? ? cache ? ,那么其映射結(jié)果將如圖 ? 3 ? 所示,他們在 ? hash ? 空間中,以對應(yīng)的 ? hash 值排列。

hash(cache A) = key A;

… …

hash(cache C) = key C;

cache

? 3 cache ? 和對象的 ? key ? 值分布

?

說到這里,順便提一下 ? cache ? ? hash ? 計(jì)算,一般的方法可以使用 ? cache ? 機(jī)器的 ? IP ? 地址或者機(jī)器名作為 hash ? 輸入。

3.4 ? 把對象映射到 cache

現(xiàn)在 ? cache ? 和對象都已經(jīng)通過同一個(gè) ? hash ? 算法映射到 ? hash ? 數(shù)值空間中了,接下來要考慮的就是如何將對象映射到 ? cache ? 上面了。

在這個(gè)環(huán)形空間中,如果沿著順時(shí)針方向從對象的 ? key ? 值出發(fā),直到遇見一個(gè) ? cache ? ,那么就將該對象存儲在這個(gè) ? cache ? 上,因?yàn)閷ο蠛? ? cache ? ? hash ? 值是固定的,因此這個(gè) ? cache ? 必然是唯一和確定的。這樣不就找到了對象和 ? cache ? 的映射方法了嗎?!

依然繼續(xù)上面的例子(參見圖 ? 3 ? ),那么根據(jù)上面的方法,對象 ? object1 ? 將被存儲到 ? cache A ? 上; ? object2 ? object3 ? 對應(yīng)到 ? cache C ? ? object4 ? 對應(yīng)到 ? cache B ?

3.5 ? 考察 cache ? 的變動

前面講過,通過 ? hash ? 然后求余的方法帶來的最大問題就在于不能滿足單調(diào)性,當(dāng) ? cache ? 有所變動時(shí), cache ? 會失效,進(jìn)而對后臺服務(wù)器造成巨大的沖擊,現(xiàn)在就來分析分析 ? consistent hashing ? 算法。

3.5.1 ? 移除 ? cache

考慮假設(shè) ? cache B ? 掛掉了,根據(jù)上面講到的映射方法,這時(shí)受影響的將僅是那些沿 ? cache B ? 逆時(shí)針遍歷直到下一個(gè) ? cache ? ? cache C ? )之間的對象,也即是本來映射到 ? cache B ? 上的那些對象。

因此這里僅需要變動對象 ? object4 ? ,將其重新映射到 ? cache C ? 上即可;參見圖 ? 4 ?

remove

? 4 Cache B ? 被移除后的 ? cache ? 映射

3.5.2 ? 添加 ? cache

再考慮添加一臺新的 ? cache D ? 的情況,假設(shè)在這個(gè)環(huán)形 ? hash ? 空間中, ? cache D ? 被映射在對象 ? object2 ? object3 ? 之間。這時(shí)受影響的將僅是那些沿 ? cache D ? 逆時(shí)針遍歷直到下一個(gè) ? cache ? ? cache B ? )之間的對象(它們是也本來映射到 ? cache C ? 上對象的一部分),將這些對象重新映射到 ? cache D ? 上即可。

?

因此這里僅需要變動對象 ? object2 ? ,將其重新映射到 ? cache D ? 上;參見圖 ? 5 ?

add

? 5 ? 添加 ? cache D ? 后的映射關(guān)系

4 ? 虛擬節(jié)點(diǎn)

考量 ? Hash ? 算法的另一個(gè)指標(biāo)是平衡性 ? (Balance) ? ,定義如下:

平衡性

  平衡性是指哈希的結(jié)果能夠盡可能分布到所有的緩沖中去,這樣可以使得所有的緩沖空間都得到利用。

hash ? 算法并不是保證絕對的平衡,如果 ? cache ? 較少的話,對象并不能被均勻的映射到 ? cache ? 上,比如在上面的例子中,僅部署 ? cache A ? ? cache C ? 的情況下,在 ? 4 ? 個(gè)對象中, ? cache A ? 僅存儲了 ? object1 ? ,而 ? cache C ? 則存儲了 ? object2 ? ? object3 ? ? object4 ? ;分布是很不均衡的。

為了解決這種情況, ? consistent hashing ? 引入了“虛擬節(jié)點(diǎn)”的概念,它可以如下定義:

“虛擬節(jié)點(diǎn)”( ? virtual node ? )是實(shí)際節(jié)點(diǎn)在 ? hash ? 空間的復(fù)制品( ? replica ? ),一實(shí)際個(gè)節(jié)點(diǎn)對應(yīng)了若干個(gè)“虛擬節(jié)點(diǎn)”,這個(gè)對應(yīng)個(gè)數(shù)也成為“復(fù)制個(gè)數(shù)”,“虛擬節(jié)點(diǎn)”在 ? hash ? 空間中以 ? hash ? 值排列。

仍以僅部署 ? cache A ? ? cache C ? 的情況為例,在圖 ? 4 ? 中我們已經(jīng)看到, ? cache ? 分布并不均勻。現(xiàn)在我們引入虛擬節(jié)點(diǎn),并設(shè)置“復(fù)制個(gè)數(shù)”為 ? 2 ? ,這就意味著一共會存在 ? 4 ? 個(gè)“虛擬節(jié)點(diǎn)”, ? cache A1, cache A2 ? 代表了 ? cache A ? ? cache C1, cache C2 ? 代表了 ? cache C ? ;假設(shè)一種比較理想的情況,參見圖 ? 6 ?

virtual nodes

? 6 ? 引入“虛擬節(jié)點(diǎn)”后的映射關(guān)系

?

此時(shí),對象到“虛擬節(jié)點(diǎn)”的映射關(guān)系為:

objec1->cache A2 ? ? objec2->cache A1 ? ? objec3->cache C1 ? ? objec4->cache C2 ?

因此對象 ? object1 ? ? object2 ? 都被映射到了 ? cache A ? 上,而 ? object3 ? ? object4 ? 映射到了 ? cache C ? 上;平衡性有了很大提高。

引入“虛擬節(jié)點(diǎn)”后,映射關(guān)系就從 ? { ? 對象 ? -> ? 節(jié)點(diǎn) ? } ? 轉(zhuǎn)換到了 ? { ? 對象 ? -> ? 虛擬節(jié)點(diǎn) ? } ? 。查詢物體所在 ? cache 時(shí)的映射關(guān)系如圖 ? 7 ? 所示。

map

? 7 ? 查詢對象所在 ? cache

?

“虛擬節(jié)點(diǎn)”的 ? hash ? 計(jì)算可以采用對應(yīng)節(jié)點(diǎn)的 ? IP ? 地址加數(shù)字后綴的方式。例如假設(shè) ? cache A ? ? IP ? 地址為 202.168.14.241 ?

引入“虛擬節(jié)點(diǎn)”前,計(jì)算 ? cache A ? ? hash ? 值:

Hash(“202.168.14.241”);

引入“虛擬節(jié)點(diǎn)”后,計(jì)算“虛擬節(jié)”點(diǎn) ? cache A1 ? ? cache A2 ? ? hash ? 值:

Hash(“202.168.14.241#1”); ? ? // cache A1

Hash(“202.168.14.241#2”); ? ? // cache A2

5 ? 小結(jié)

Consistent hashing ? 的基本原理就是這些,具體的分布性等理論分析應(yīng)該是很復(fù)雜的,不過一般也用不到。

http://weblogs.java.net/blog/2007/11/27/consistent-hashing ? 上面有一個(gè) ? java ? 版本的例子,可以參考。

http://blog.csdn.net/mayongzhan/archive/2009/06/25/4298834.aspx ? 轉(zhuǎn)載了一個(gè) ? PHP ? 版的實(shí)現(xiàn)代碼。

http://www.codeproject.com/KB/recipes/lib-conhash.aspx ? C語言版本

?

?

一些參考資料地址:

http://portal.acm.org/citation.cfm?id=258660

http://en.wikipedia.org/wiki/Consistent_hashing

http://www.spiteful.com/2008/03/17/programmers-toolbox-part-3-consistent-hashing/

? http://weblogs.java.net/blog/2007/11/27/consistent-hashing

http://tech.idv2.com/2008/07/24/memcached-004/

http://blog.csdn.net/mayongzhan/archive/2009/06/25/4298834.aspx

?

一致性hash


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點(diǎn)擊下面給點(diǎn)支持吧,站長非常感激您!手機(jī)微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點(diǎn)擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 怀来县| 乌恰县| 桐庐县| 沂源县| 昌宁县| 温泉县| 肇州县| 宝应县| 南安市| 吉林市| 文山县| 邵阳县| 同江市| 峨边| 济源市| 四子王旗| 卓尼县| 九台市| 泽库县| 东阿县| 澄迈县| 秀山| 沙田区| 牙克石市| 崇州市| 天津市| 福鼎市| 绥芬河市| 南乐县| 福贡县| 安吉县| 宣城市| 苍溪县| 雅安市| 泰宁县| 翼城县| 雅江县| 弋阳县| 丰台区| 科技| 黔西县|