vivo全球商城:庫存系統架構設計與實踐
作者:vivo官網商城開發團隊 - Xu Yi、Yan Chao
本文是vivo商城系列文章,主要介紹vivo商城庫存系統發展歷程、架構設計思路以及應對業務場景的實踐。
一、業務背景
庫存系統是電商商品管理的核心繫統,本文主要介紹vivo商城庫存中心發展歷程、架構設計思路及應對各種業務場景的實踐。
vivo商城原庫存系統耦合在商品系統,考慮到相關業務邏輯複雜度越來越高,庫存做了服務拆分,在可售庫存管理的基礎上新增了實物庫存管理、秒殺庫存、物流時效 、發貨限制、分倉管理等功能,滿足了商城庫存相關業務需求。
本文將介紹vivo商城庫存系統架構設計經驗以及一些問題的解決方案。
二、系統架構設計
2.1 vivo大電商庫存架構
根據vivo大電商的銷售渠道與業務場景可以將庫存業務架構分為3個層級:倉庫層、調度層以及銷售層。
倉庫層對應實體倉庫,包括自營倉庫、順豐倉等第三方倉庫以及WMS系統、ERP系統等;調度層負責庫存調度與訂單發貨管理;銷售層包含多個服務終端,vivo官方商城、vivo門店、第三方電商分銷渠道等。其分層結構如圖所示:
本文探討的vivo官方商城庫存架構設計,從整個vivo大電商庫存架構來看,vivo官方商城庫存系統涉及銷售層內部架構以及銷售層與調度層的交互。
2.2 商城庫存系統架構演變
早期商城的庫存宂餘在各業務系統中,如可售庫存在商品系統、活動庫存在營銷系統等,庫存流轉也只有扣減與釋放,無法針對庫存進行整合與業務創新,存在諸多限制:
不能進行精細化管理,庫存未分層,無法針對實物庫存、分倉策略、活動庫存進行精細化管理。
沒有分倉策略,無法提前獲取商品收發地址,物流時效無法估算。
無法針對地區、商品等進行發貨管控。
實時性差,無法及時同步實物庫存以及分倉策略。
性能弱,與其他系統耦合大,不能靈活擴展。
基於上述限制與產品期望,21年庫存系統完成初版架構設計,此後系統不斷迭代完善,形成當前的系統架構:
庫存系統提供兩個核心能力:交易能力和庫存管理。上層業務方可以調用提供的API完成庫存查詢、庫存扣減等操作;管理台可以按成分倉策略、庫存同步等操作。
三、系統業務架構
3.1 庫存類型&分倉管理
3.1.1 庫存類型結構
庫存系統一共包含4類庫存:可售庫存、實物庫存、預佔庫存、活動庫存。
可售庫存:運營配置的普通商品庫存,商品維度到SKU。
實物庫存:由倉儲系統同步到庫存系統的實物庫存,細化到具體倉庫。
預佔庫存:用户下單完成庫存預佔,倉儲系統發貨後釋放預佔庫存,預佔庫存可以監控已下單未發貨庫存量。
活動庫存:用於秒殺、搶購等各類營銷活動的商品庫存。
基於不同類型庫存,可以構建一個簡單的庫存分層體系:

3.1.2 分倉管理
庫存中心還維護了倉庫信息、分倉策略、倉庫實物庫存信息等等:
倉庫信息:倉庫基礎信息,包括倉庫地址、類型、編碼等。
分倉策略:倉庫功能信息,倉庫可發貨區域、無實物庫存後的備選倉庫;訂單根據收貨地址對應優先發貨的倉庫,爭取儘快發貨儘早到貨。
倉庫庫存:倉庫實物庫存,由倉庫調度系統同步到商城庫存系統。
3.2 商城庫存流轉方案
商品庫存流轉涉及兩個主要操作:正向庫存扣減、逆向庫存回退,整套庫存變更流程如下:
3.2.1 正向庫存扣減流程
對於庫存扣減,目前常見有兩種庫存扣減方案:
(1)下單時扣庫存。
優點是:實時扣庫存,避免付款時因庫存不足而阻斷影響用户體驗。
缺點是:庫存有限的情況下,惡意下單佔庫存影響其他正常用户下單。比如説有100台手機,如果沒有限制下單數量,這100個庫存可能被一個用户惡意佔用,導致其他用户無法購買。
(2)支付時扣庫存。
優點是:不受惡意下單影響。
缺點是:當支付訂單數大於實際庫存,會阻斷部分用户支付,影響購物體驗。比如説只有100台手機,但可能下了1000個訂單,但有900個訂單在支付時無法購買。
從用户體驗考慮,我們採用的是下單時扣庫存 + 回退這種方案。
下單時扣減庫存,但只保留一段時間(比如15分鐘),保留時間段內未支付則釋放庫存,避免長時間佔用庫存。
3.2.2 逆向庫存回退流程
庫存回退基於庫存變更日誌逐個回退。
庫存回退基本流程:訂單出庫前用户申請退款,回退可售庫存、回退預佔庫存、軟刪除扣減日誌、增加回退日誌;一旦商品出庫,用户申請退貨走處理機流程,可售庫存和實物庫存均不回退。
3.3 精細化發貨管控
庫存系統還提供了一系列定製輔助功能:分倉策略、發貨限制、物流時效等等。
(1)分倉策略
為了給用户更快的發貨,我們採用的是分倉策略,即由最近的倉庫(存在優先級)給用户發貨;同時存在備選倉庫,當所有倉庫無實物庫存時可走備選倉庫。
3.3.1 發貨限制
發貨限制分地區限制時間限制。
地區限制:根據收貨地址批量設置部分區域無法發貨等規則,粒度到省市區維度。
時間限制:倉庫的發貨時效管理,包括每天的發貨時段、大促發貨時段、以及特殊情況下的停發時段。
3.3.2 物流時效預估
根據用户收貨地址,基於分倉策略確定發貨地址,再基於發貨時效確定發貨時間,提升用户體驗。
四、系統架構技術要點
4.1 庫存扣減防重
訂單重複提交會導致庫存重複扣減,比如用户誤提交、系統超時重試等,針對此類問題有如下常見解決方案:
訂單提交按鈕單擊置灰,避免重複提交。
注:對於按鈕置灰這種方案,可以減少用户誤觸重複提交的可能性,但不能從根本上解決庫存被重複扣減的問題,比如通過腳本來刷扣減庫存的接口,依舊造成庫存的重複扣減。
保證庫存扣減接口的冪等性。
注:保證接口冪等的方案有很多,比如每次扣減庫存時,帶上唯一的流水號,利用數據庫的唯一索引保證冪等等。
採用令牌機制。用户提交訂單會進行令牌校驗,校驗通過才能提交訂單。
注:這種方案保證每次提交的訂單是唯一的,如果用户多次下單,那麼會產生多個訂單。
本系統採用的是保證接口冪等性的方案。
在庫存扣減接口入參中增加訂單序列號作為唯一標識,庫存扣減時增加一條扣減日誌。當接口重複請求時,會優先校驗是否已經存在扣減記錄,如果已存在則直接返回,避免重複扣減問題,具體流程如下:

4.2 防超賣與高併發扣減方案
4.2.1 常規渠道防超賣方案
常規下單渠道流量小且對超賣風險厭惡度極高,常用的防超賣方案有:
方案一:
直接數據庫扣減。通過sql判斷剩餘庫存是否大於等於待扣庫存,滿足則扣減庫存。該方案利用樂觀鎖原理即update的排他性確保事務性,避免超賣。
偽代碼sql:
sql:update store set store = store - #{deductStore } where (store-#{deductStore }) >= 0
該方案的優點是:
實庫實扣,不會出現超賣;
數據庫樂觀鎖保證併發扣減一致性;
數據庫事務保證批量扣減正常回滾。
該方案的缺點是:
行級鎖的原因存在性能瓶頸,高併發會出現請求堵塞超時問題;
直連數據庫,每次扣庫存都是寫操作,接口性能較低。
方案二:
利用分佈式鎖,強制串行化扣減同一商品庫存。
該方案的優點是:
減輕數據庫壓力,同時還能確保不會超賣。
該方案的缺點是:
每次只能有一個請求搶佔鎖,不能應對高併發場景。
對於常規渠道,庫存扣減是後置邏輯,流量不高,我們採用的是直接數據庫扣減,且針對弊端做了一些措施:
前置校驗嚴格,同時針對刷單場景會有嚴格限流,保證最終扣減庫存的流量可控;
庫存系統讀寫分離,減少數據庫的壓力。
4.2.2 高併發庫存扣減方案
針對高併發庫存扣減,比如秒殺,一般採用的是緩存扣減庫存的方式(redis+lua腳本實現單線程庫存更新)作為前置流程,代替數據庫直接更新。
在redis中扣減庫存雖然性能高,可以大大減輕數據庫壓力,但需要保證緩存數據能完整、正確的入庫,以保證最終一致性。
針對緩存數據更新至數據庫,目前主流方案有兩種:
方案一:Redis數據直接異步更新至數據庫。

優點:簡單、沒有複雜的流程。
缺陷:redis宕機或者故障,可能會造成緩存內庫存數據的丟失。
方案二:Redis扣減庫存時,同步在業務數據中insert庫存信息。

這裏大家可能會有兩個疑問:
有數據庫的插入操作,性能怎麼保證?
有數據庫的操作,又有redis的更新,事務性怎麼保證?
異步更新業務庫存在延遲,庫存逆向回退如何保證?
對於疑問1:由於數據庫insert比update性能優,insert是在表的末尾直接插入,沒有尋址的過程,可以保證性能比較快。
對於疑問2:方案2不同於緩存直接扣減,而是把緩存扣減放在數據庫insert的事務內,通過數據庫的事務保證整體的事務。
insert的表被稱為庫存任務表,其中保存了庫存扣減的信息,庫存任務表結構可以設計的非常簡單,主鍵 + 庫存信息(json字符串)就可以了。
後續通過異步任務,從庫存任務表表中查詢出庫存更新信息,將其同步到具體的庫存表中,實現最終一致性,這種方案可以避免數據的丟失。
對於疑問3:庫存回退是根據業務庫中扣減記錄進行回退的,由於異步更新業務庫必定存在延遲(延遲極低,數秒以內),所以極端場景會存在走退款逆向流程時業務庫的庫存扣減記錄還未更新。
針對這種情況庫存回退設置延遲重試機制,如果再極端點達到重試閾值依舊沒有扣減記錄,則返回回退成功,不做阻斷。
目前我們針對秒殺庫存扣減,採用的是方案2。但畢竟涉及數據庫的更新,為了避免風險,在前置流量校驗上做了限制,保證流量的可控:

4.2.3 庫存熱點問題
什麼是熱點問題?熱點問題就是因熱點商品導致的redis、數據庫等性能瓶頸。在庫存系統中,熱點問題主要存在:
採用直接扣減庫存數據庫的方式,存在數據庫的行鎖問題。常規渠道的庫存扣減,我們採用的就是的就是這種方式。
採用緩存扣減庫存的方式,大流量的情況下,熱點商品扣減庫存操作會打向redis單片,造成單片性能抖動,從而出現redis性能瓶頸。
對於第1種熱點問題,在vivo商城常見的場景是:新發的爆品手機,在準點售賣時會有搶購效應,容易造成庫存數據庫單行的瓶頸問題。針對這種熱點問題,我們的解決方案是“分而治之”:
對於潛在的熱點爆款手機,我們會將庫存平均分為多行(比如M行),扣減庫存時,隨機在M行中選取一行庫存數據進行扣減。該方案突破了數據庫單行鎖的瓶頸限制,解決了爆款商品的熱點問題。
對於第2種redis單片熱點問題,解決方案也是分而治之。將數據庫中的庫存數據同步到redis時,把key值打散,分散在多個redis單片中。注:我們目前線上的流量峯值還達不到會造成redis單片瓶頸的問題,為避免過度設計,只做了前置限流,沒有進行key值的打散。
4.3 庫存同步方案
庫存系統存在一些庫存同步場景:
對接倉儲系統,完成實物庫存同步。
兼容歷史架構,商品系統庫存的可售庫存同步等。
(1)實物庫存同步:
實物庫存同步,對接的是倉儲系統,通過接口來獲取商品的實際庫存。實物庫存同步分成兩種:定時全量同步、指定單品更新。
定時全量同步:每天定時全量拉取庫存調度平台的實物庫存進行全量同步。
制定單品:運營也可以手動觸發單個sku的商品即時同步實物庫存。
(2)商品系統庫存同步:
由於庫存系統多個場景涉及庫存變更,運營手動編輯、用户下單退款導致庫存扣減回退,還有商品系統內編輯庫存數據也會導致庫存變更(以前庫存系統未獨立,庫存數據維護在商品系統)。同時很多業務在查詢庫存時,參考的依舊是商品系統的庫存數據。
這裏有一個問題:庫存系統已經獨立出來,為什麼還會依賴商品系統的庫存數據?
這有兩點原因:
商城多個業務的後台有商品篩選的需要,商品篩選會有庫存數量的篩選項。商品數量很多,篩選是分頁的,如果將庫存數據全部替換成庫存系統的,那麼存在跨系統分頁問題,分頁篩選會存在問題;
歷史遺留問題,很多業務方依賴的是商品系統的庫存數據(包括依賴商品庫存離線表的業務方),全部切換到庫存系統,成本和影響範圍大。
因此,我們需要保證商品系統和庫存系統兩邊庫存數據的一致。
庫存變更場景多,為了降低業務複雜度、採用簡單的方式實現庫存同步,我們利用了團隊自研的CDC系統(魯班平台),整體流程如下:
庫存數據庫發生變更後,魯班平台通過binlog採集獲取庫存變更日誌,再通過自定義規則篩選,然後發送mq變更消息,最後商品系統消費消息完成庫存同步變更。
五、總結及展望
最後對庫存系統進行一個總結:
庫存系統完成服務拆分,在單一的可售庫存扣減功能基礎上拓展了很多功能,賦能業務的發展。
完成庫存架構分層,抽象多個庫存類型,更靈活地滿足當前業務需求。
針對庫存扣減防重、高併發場景下的庫存扣減、庫存熱點問題、庫存同步等技術問題,我們根據業務實際情況設計合理方案。
展望
目前vivo商城庫存系統平台化能力不足,部分能力分散在其他系統中,未來我們希望能為vivo新零售提供一體化的庫存管理方案。
END
猜你喜歡
本文分享自微信公眾號 - vivo互聯網技術(vivoVMIC)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閲讀的你也加入,一起分享。
- 循序漸進講解負載均衡vivoGateway(VGW)
- Tars-Java網絡編程源碼分析
- vivo 短視頻用户訪問體驗優化實踐
- 100 行 shell 寫個 Docker
- vivo全球商城:庫存系統架構設計與實踐
- 非侵入式入侵 —— Web緩存污染與請求走私
- 解密遊戲推薦系統的建設之路
- 解密遊戲推薦系統的建設之路
- 用户行為分析模型實踐(三)——H5通用分析模型
- vivo版本發佈平台:帶寬智能調控優化實踐-平台產品系列03
- 廣告流量反作弊風控中的模型應用
- vivo官網App模塊化開發方案-ModularDevTool
- OKR之劍·實戰篇05:OKR致勝法寶-氛圍&業績雙輪驅動(上)
- vivo 自研Jenkins資源調度系統設計與實踐
- vivo官網App模塊化開發方案-ModularDevTool
- Dubbo 中 Zookeeper 註冊中心原理分析
- 用户行為分析模型實踐(三)——H5通用分析模型
- Node.js 應用全鏈路追蹤技術——全鏈路信息存儲
- 從0到1設計通用數據大屏搭建平台
- vivo 超大規模消息中間件實踐之路