日本高清一,思思玖玖玖在线精品视频,免费观看色视频

SQL數據庫使用號段模式實現分布式ID

當前位置：點晴教程→知識管理交流 →『技術文檔交流』

admin

2024年10月22日 19:38 本文熱度 671

在單體系統時代，程序常被部署在單個物理機中，數據被存儲在單個數據庫中，我們可以采取數據庫的自增 ID 來實現 ID 的全局唯一。

現在，系統開始從單體系統演變為分布式系統，當業務量和數據量增長之后，我們會選擇分庫分表。同時，隨著微服務的推廣與普及，我們的服務變得越來越多。

當然，在復雜的分布式系統中，我們同樣需要對大量的數據進行唯一標識，而數據庫的自增 ID 顯然已經不能滿足需求了。此時，我們就需要通過其他手段實現全局唯一 ID 了。

事實上，實現分布式全局唯一的 ID 有許多方案，包括基于 Redis 實現分布式 ID 方案、UUID、數據庫號段模式、雪花算法等。但今天我們學習如何通過號段模式實現分布式 ID？為什么選擇了“號段模式”。要回答這個問題，你需要先知道業務系統對分布式 ID 到底有要求？

在我看來，業務系統對分布式 ID 的要求，主要是 4 個包括：全局唯一性、趨勢遞增、單調遞增和信息安全。接下來，我就和你一一分析下。

第一， 全局唯一性。確保 ID 的全局唯一性，是最基本的要求。

第二， 趨勢遞增。

趨勢遞增指的是，我們的分布式 ID 是呈增長趨勢的，但是序列之間是不連續的。事實上，MySQL 的 InnoDB 引擎使用的是聚集索引，底層的數據結構是 B+ 樹，使用有序的主鍵可以保證寫入性能。

這也是為什么我們不提倡使用 UUID（Universally Unique Identifier，通用唯一識別碼）作為 ID 的原因：UUID 的無序性，會導致新增數據的時候不是順序的，從而出現頻繁的頁分裂，嚴重影響性能。

第三， 單調遞增。我們要保證 ID 的增長不僅有序，而且還要單調遞增，即下一個新增的 ID 一定大于上一個存在的 ID，從而保證能支持事務版本號、排序等場景。

第四， 信息安全 。在一些應用場景下，我們需要 ID 有不規則性，確保它難以被猜測。例如，訂單號，我們就需要確保它不是順序遞增的，不然，就很容易被競爭對手猜測出我們一天的訂單量。

號段模式滿足全局唯一性、趨勢遞增、單調遞增三個要求，所以我選擇了號段模式。而信息安全的要求，例如訂單號場景，我們常常會采用雪花算法來實現。那么，如何通過號段模式實現分布式 ID？

使用號段模式如何實現分布式 ID？

想一想，我們在數據庫中創建一張全局 ID 序列表。例如，這張表叫做 common_sequence，它有 id、name、value、gmt_modified 四個字段。需要注意的是，每個業務用 name 字段來區分，每個 name 的 ID 獲取是相互隔離、互不影響的。

CREATETABLE`common_sequence`(
`id`int(11)unsignedNOTNULLAUTO_INCREMENT,
`name`varchar(64)NOTNULLDEFAULT'',
`value`bigint(20)NOTNULL,
`gmt_modified`dateNOTNULL,
PRIMARYKEY(`id`),
UNIQUEKEY`name`(`name`)
)ENGINE=InnoDBDEFAULTCHARSET=utf8mb4;

當我們需要為某個表生成主鍵 ID 時，就從序列表中分配全局主鍵 ID。

例如，我們新增一個客服工單，需要自增一個 ID。在這里，我們在全局 ID 序列表中，存入 name 等于 task 的記錄，它的值是 1，也就是說，這個業務表的自增 ID 的當前值是 1。

但是，如果我們每次獲取 ID 都需要讀寫一次數據庫，就會對數據庫造成比較大的壓力。那么，有什么比較好的優化方案呢？

事實上，我們可以做一個小優化：每次向全局 ID 序列表獲取 一批 ID，然后存入 JVM 本地緩存中慢慢使用；當這批 ID 被消耗完了，再向全局 ID 序列表重新發起一次讀寫請求。這里，從全局 ID 序列表中申請的一批可用的 ID，我們稱之為 ID 號段。

ID 分段之后，我們再來看看整體流程。

在新增客服工單時，我們會向全局 ID 序列表申請的可以使用的號段。假設，我們需要預申請 5000 個 ID。首先，客服工單服務會先查詢全局 ID 序列表，獲取當前 name 等于 task 的記錄的最新值是多少。這里，最新值是 1。

然后呢，全局 ID 序列表更新相對應的記錄值。它把最新值 +5000，也就是 5001，存儲起來。

緊接著，客服工單服務將可以使用的號段存儲在 JVM 本地緩存中，即為[1, 5000]。客服工單服務在區間[1, 5000]中依次獲取 ID。

如果客服工單服務把區間的值用完了，再去請求全局 ID 序列表，獲取到可以用的[5001, 10000]區間的 ID。

通過這個方案，我們用完號段之后再去數據庫獲取新的號段，可以大大減輕對數據庫的依賴及給數據庫造成的壓力。

總結一下， 號段模式每次向全局 ID 序列表獲取一批可以使用的 ID 號段，然后存入 JVM 本地緩存中。

其中，我們需要預申請 5000 個 ID 中的“5000”，我們稱為步長。當這批號段被消耗完了，我們再向全局 ID 序列表重新發起一次讀寫請求。當 5000 個 ID 被消耗完了之后，才會重新讀寫一次數據庫。因此，讀寫數據庫的頻率從 1 減小到了 1/5000。

號段模式 不僅提升了數據庫讀寫性能，還很方便我們做橫向的線性擴展。

假設，我們部署 3 臺客服工單服務，它們分別申請可用的[5001, 10000]、[10001, 15000]、[15001, 20000]號段。然后呢，全局 ID 序列表將該業務的自增 ID 可用值更新為 20001。多臺客服工單服務之間憑借號段生成算法的原子性，保證每臺服務上的可用號段不會重復，從而使得 ID 全局唯一。

使用號段模式實現分布式 ID，有哪些常見問題？

想一想，這個流程會不會存在什么潛在問題？事實上，會的。

服務重啟，可用號段浪費

我們遇到的第一個問題是，如果某臺客服工單服務重啟了，那么該號段就作廢了。因此，我們需要 特別注意步長的配置，盡可能減少可用 ID 的浪費。

但是呢，減少步長的大小，間接的就會提升數據庫的性能壓力，因為數據庫的讀寫數據庫的頻率是 1/步長。

數據庫的頻率=1/步長

因此，步長的配置需要一個折中的配置策略。我們可以用觀測平時的業務峰值，和大促時的業務峰值，來動態配置步長。此外，由于重啟導致的可用 ID 的浪費，也會造成 ID 不是連續的，不過，這對于大部分業務都是可接受的。

并發安全：多態服務同時獲取 ID 區間段

我們遇到的第二個問題是，如果是多臺服務同時獲取號段，可能會發生競爭問題。

其實呢，我們可以 使用悲觀鎖來解決。最容易實現的方案就是，用數據庫自身的行鎖。數據庫行鎖在數據處理過程中，將數據處于鎖定狀態，來保證數據訪問的排他性。

如果考慮到數據庫的悲觀鎖會阻塞等待，我們也可以考慮給全局 ID 序列表加一個版本號，通過樂觀鎖的方式來實現。也就是說，每次更新都加上版本號，保證并發更新的正確性。

監控大盤的毛刺：線程阻塞等待

我們遇到的第三個問題是，當服務消費完號段之后，向全局 ID 序列表重新發起讀寫請求時，在這個臨界點可能會發生線程阻塞在數據庫取回號段的等待，它帶來的表象就是監控大盤上的偶爾會出現的毛刺。

對于這個問題，業界提出了 雙號段緩存 方案。在開源框架中，例如美團的 leaf 和滴滴的 tinyid 都提供了 雙號段緩存 方案的支持。

雙號段緩存方案 的思路是，在號段快用完的時候，我們異步加載下一個可以使用的號段，保證 JVM 本地緩存中始終有可用的號段。因此，我們就不需要等到號段用完的時候才去更新號段，以此來避免性能波動。

事實上，雙號段緩存方案中，服務內部的緩存區有兩個號段：號段 A 和號段 B。當前號段 A 用到一定程度的時候，如果下一個號段 B 還未更新，則服務開啟一個線程異步更新下一個號段 B。

當前號段 A 全部消耗完之后，同時，下一個號段 B 準備好了，那么把緩存區中的號段 A 與號段 B 切換，也就是說，當前可用號段 A 變成了號段 B，如此反復循環切換。

單點故障

我們遇到的第四個問題是，數據庫只有一個實例時，會存在單點故障。也就是說，如果數據庫不可用，則獲取號段不可用。因此，我們還要支持多數據庫實例。

這個時候，我們還需要引入兩個新的概念， 外步長和內步長：

外步長，主要用于服務向全局 ID 序列表申請的號段；
內步長，主要用于多個數據庫實例之間分配序列，從而避免重復分配。

這里，有一個公式來計算新值。這個新值，是用來計算號段的生成區間。

新值=(新值-新值%外步長)+外步長+數據庫第i個實例*內步長;

我舉一個案例。假設有兩個數據庫實例，我們設置外步長是 1000，內步長也是 1000。客服工單服務向數據庫 1 申請可用的[1, 1000]號段。

當 1000 個 ID 被消耗完了之后，再重新讀寫一次數據庫，正好此時路由到了數據庫 2，然后呢，數據庫 2 分配可用的[1001, 2000]號段，然后根據計算公式把自己的值更新為 2001。

總結

我們圍繞如何通過號段模式實現分布式 ID 進行了討論。號段模式滿足全局唯一性、趨勢遞增、單調遞增三個要求。

首先，我們需要了解號段模式，它通過每次向全局 ID 序列表獲取一批可以使用的號段，然后存入 JVM 本地緩存中使用，當這批號段被消耗完了，再向全局 ID 序列表重新發起一次讀寫請求。

在具體實現中，使用號段模式還有 4 個潛在問題：

因為服務重啟會導致可用號段會浪費，我們可以通過減少步長的大小來緩解問題。
因為多臺服務同時獲取 ID 區間段存在并發安全問題，我們可以采用悲觀鎖或樂觀鎖來保證并發更新的正確性。
因為線程阻塞等待會導致的監控大盤上面的毛刺，我們可以采取雙號段緩存方案來優化性能；
因為單點故障問題會導致無法獲取有效的號段，我們可以通過多數據庫實例來規避這個問題。

該文章在 2024/10/23 9:57:19 編輯過

關鍵字查詢

正在查詢...

點晴ERP是一款針對中小制造業的專業生產管理軟件系統,系統成熟度和易用性得到了國內大量中小企業的青睞。

點晴PMS碼頭管理系統主要針對港口碼頭集裝箱與散貨日常運作、調度、堆場、車隊、財務費用、相關報表等業務管理，結合碼頭的業務特點，圍繞調度、堆場作業而開發的。集技術的先進性、管理的有效性于一體，是物流碼頭及其他港口類企業的高效ERP管理信息系統。

點晴WMS倉儲管理系統提供了貨物產品管理,銷售管理,采購管理,倉儲管理,倉庫管理,保質期管理,貨位管理,庫位管理,生產管理,WMS管理系統,標簽打印,條形碼,二維碼管理,批號管理軟件。

點晴免費OA是一款軟件和通用服務都免費，不限功能、不限時間、不限用戶的免費OA協同辦公管理系統。

欧美成人精品手机在线观看_69视频国产_动漫精品第一页_日韩中文字幕网 - 日本欧美一区二区