使用 Redis 實現分佈式鎖的方法

語言: CN / TW / HK

這是我參與11月更文挑戰的第27天,活動詳情查看:2021最後一次更文挑戰

在一個分佈式系統中,會遇到一些需要對多個節點共享的資源加鎖的情況,這個時候需要用到分佈式鎖。分佈式鎖通常保存在一個共享的存儲系統中,可以被多個節點共享和訪問。

鎖的本質

簡單來講,鎖可以用一個變量來表示。比如,在一個單機多線程的程序來説,某個資源的鎖用一個 bit 的數據就可以表示。即 0 表示沒有資源可以訪問,1 表示資源的鎖已被別的線程獲取,不能訪問。

獲取和釋放特定資源的鎖,本質上就是為獲取和修改這個變量的值。如果值是 0 則將其修改為 1,就完成了獲取的過程,如果訪問到的值不是 0,則獲取鎖失敗;如果之前獲取了鎖,將表示鎖的變量的值修改為 0 的操作,其實就是釋放鎖的操作。

在一個分佈式場景中,實現鎖的方式也是一樣的,只不過這個表示資源鎖的變量,需要保存在一個共享的存儲系統中。這個共享的存儲系統,可以是 Redis,也可以是其他的任何可以提供數據存儲的系統。

基於 Redis 的分佈式鎖實現

第一步:初步實現功能

對於將 Redis 作為這個共享存儲系統的情況來説,代表某個資源的鎖的變量,就是 Redis 中的一個鍵值對。假如,需要添加分佈式鎖的資源叫 resource_a,我們可以將 Redis 中 resource_a 的鎖變量的 key 叫做 lock_a。

例如,節點一需要獲取鎖,它會訪問 Redis 中 lock_a 的值,假設獲取到的值為 0,則節點一將這個值設置為 1 後,就完成了加鎖操作。此時,節點二也需要獲取 resource_a 的鎖,它去訪問 Redis 中 lock_a 的值,發現值是 1,説明鎖已經被別的節點獲取,並且還沒有釋放,因此,節點二對資源 resource_a 加鎖失敗。

當節點一需要釋放鎖的時候,只需要將 Redis 中的 lock_a 的值設置為 0 就完成了鎖的釋放,之後,其他的節點就可以再次獲取資源的鎖。

第二步:加鎖操作原子化

以上的描述中,加鎖的並不是一個單一的操作,而是包含了多個步驟:讀取鎖變量、判斷變量的值、修改鎖變量。這三個操作需要原子化。

在 Redis 中,有一個 SETNX 命令,用於設置鍵值對的值,與 SET 命令不同,它在是先事會判斷鍵值對是否存在,只有當指定的 KEY 不存在的時候,才會執行值的設定,否則什麼都不執行。SETNX 就是「SET if Not eXist」的意思。它的用法與 SET 相同:

SETNX lock_a 1

這樣,當需要獲取鎖的時候,使用 SETNX 命令為 lock_a 設置一個值,如果設置成功則獲取到了鎖,如果失敗則沒有獲取到鎖;當需要釋放鎖的時候,使用 DEL 操作刪除鍵值對即可。

這樣就實現了獲取和釋放鎖的原子化操作。

第三步:防止加鎖後不釋放

接下來早考慮一個問題,如果節點一獲取到鎖之後,由於程序異常等原因,導致一直麼有釋放鎖,此時,鎖會一直被它持有,無法釋放,其他節點也無法訪問資源。

為了避免這種情況的發生,我們必須給鎖變量設置過期時間,當鎖變量過期後,就可以重新請求加鎖,這樣就可以避免這個問題。

SETNX 的命令並沒有設置過期時間的選項,所幸的是,Redis 為 SET 命令提供了模擬 SETNX 的 NX 選項,我們可以這樣設置過期時間:

SET lock_a 1 NX PX 10000

以上命令代表,如果 lock_a 不存在,則將它的值設置為 1,並且在 10 秒後過期。

第四步:誰加鎖誰釋放

最後一個問題是,如果節點一獲取了鎖,而由於某種原因,節點二執行了 DEL 操作,那麼,其他節點又可以獲取鎖了。

為了解決這個問題,我們可以修改一下鎖變量保存的內容。在前面的邏輯中,我們申請鎖的時候,是去判斷鎖變量是否存在,而與其中保存的值關係不大,因此,我們可以把這個值利用起來。

在加鎖的時候,如果把值保存為每個節點唯一的標識,那麼,在釋放鎖執行 DEL 之前再對這個值進行判斷,那麼,就可以先判斷鎖是否是當前節點加上的,是的話再進行釋放,這樣就實現了「誰加鎖誰是放」。

這一部分,沒有一個單一的指令可以完成讀取鎖變量、判斷、刪除的操作,因此,可以使用 Lua 腳本實現。在腳本中獲取到當前鎖變量的值,與給定的節點標識進行比對,符合的話才進行刪除操作,否則不操作。

在釋放鎖時,執行 Lua 腳本即可。

第五步:實現高可用

完善了功能之後,最後再來實現高可用。如果我們使用單一的 Redis 作為分佈式鎖的共享存儲系統,那麼,如果這個 Redis 不可用了,那涉及到分佈式鎖的部分都不可用了,這樣是很脆鎖的,這是高可用非常有必要的原因。

此時,需要搬出 Redis 的作者 Antirez 提出的分佈式鎖算法 Redlock。簡而言之,是讓鎖的申請者,想多個獨立的 Redis 實例請求加鎖,如果能在半數以上的 Redis 完成枷鎖操作,那麼就成功的獲取了鎖,反之獲取失敗。

在釋放鎖的操作時,同樣只要在超過半數的實例上執行成功刪除鎖變量的 Lua 腳本,即可視為成功。