Mysql索引覆蓋
作者:京東零售 孫濤
1.什麼是覆蓋索引
通常情況下,我們創建索引的時候只關注where條件,不過這只是索引優化的一個方向。優秀的索引設計應該縱觀整個查詢,而不僅僅是where條件部分,還應該關注查詢所包含的列。索引確實是一種高效的查找數據方式,但是mysql也可以從索引中直接獲取數據,這樣就不在需要讀數據行了。 覆蓋索引(covering index)指一個查詢語句的執行只需要從輔助索引中就可以得到查詢記錄,而不需要回表,去查詢聚集索引中的記錄。可以稱之為實現了索引覆蓋。 在mysql數據庫中,如何看出一個sql是否實現了索引覆蓋呢?

從執行計劃看,Extra的信息為using index ,即用到了索引覆蓋。
2.覆蓋索引為什麼快
innodb存儲引擎底層實現包括B+樹索引和哈希索引,innodb存儲引擎默認的索引模型/結構是B+樹,所以大部分時候我們使用的都是B+樹索引,因為它良好的性能和特性更適合於構建高併發系統。根據索引的存儲方式來劃分,索引可以分為聚簇索引和非聚簇索引。聚簇索引的特點是葉子節點包含了完整的記錄行,而非聚簇索引的葉子節點只有索引字段和主鍵ID。非聚簇索引中因為不含有完整的數據信息,查找完整的數據記錄需要回表,所以一次查詢操作實際上要做兩次索引查詢。而如果所有的索引查詢都要經過兩次才能查到,那麼肯定會引起效率下降,畢竟能少查一次就少查一次。
覆蓋索引就實現了從非聚簇索引中直接獲取數據,所以效率會提升。

3.SQL優化場景
(1)無where條件
請看下面的sql


執行計劃中,type為ALL,代表進行了全表掃描,掃描行數達到了26274308,所以執行時間為9.25秒,也是正常的。
那麼如何優化?優化措施很簡單,就是對查詢列建立索引。如下,
alter table instance_space_history add index idx_org1(org1); 看添加索引後的執行計劃

Possible_keys為null,説明沒有where條件時優化器無法通過索引檢索數據;
但是看extra的信息 Using index,即從索引中獲取數據,減少了讀取的數據塊的數量 。

在看實際優化效果,掃描行數沒變,但是使用了覆蓋索引,查詢時間從9.25秒縮短到5.67秒。 思考: 無where條件的查詢,可以通過索引來實現索引覆蓋查詢。但前提條件是,查詢返回的字段數足夠少,更不用説select *之類的了。畢竟,建立key length過長的索引,始終不是一件好事情。
(2)where條件區分度低
使用區分度極低的字段作為where條件的查詢SQL,對於dba或者研發人員優化一直是比較頭疼的問題,這裏介紹一種思路,就是通過索引覆蓋來優化 。 t_material_image是一張8億多數據的大表,where條件的material_type字段區分度很低,下面是沒加任何索引的執行計劃和查詢時間(7.35秒)。


最容易想到的優化方式,就是給where條件的字段加索引,添加索引語句如下: alter table t_material_image add index idx_material_type (material_type);
再來看執行計劃

通過執行計劃和測試結果看,的確是有效果的,但是走索引後的查詢效率依然不能滿足我們期望。 然後試着給material_type,material_id添加聯合索引。 alter table t_material_image add index idx_material_id_type (material_type,material_id);


從這個sql的執行計劃看,出現Using index,實現了索引覆蓋;再看執行時間,性能得到了巨大的提升,居然已經可以跑到0.85s左右了。
思考:
當where條件字段區分度低(過濾性差),且where條件與查詢字段總數較少的情況下,使用索引覆蓋優化,是個不錯的選擇。
(3)查詢僅選擇主鍵
對於Innodb的輔助索引,它的葉子節點存儲的是索引值和指向主鍵索引的位置,然後需要通過主鍵在查詢表的字段值,所以輔助索引存儲了主鍵的值。如果查詢所選擇的列只有主鍵,應該考慮通過索引覆蓋優化。 看下面的兩個sql,字段 pin 和completion_time有聯合索引,where條件差別只有comment_voucher_status = 0,但是執行時間差距巨大(第一個sql0.58s,第二個sql0.2s),為什麼呢?是不是很困惑




我們來看執行計劃,主要差別體現在extra,第一個sql用到Using index condition,而第二個sql用到Using index,因為pin和completion_time有聯合索引,而且查詢結果只選擇了主鍵id,所以第二個sql覆蓋了所有的where條件字段和查詢結果選擇字段,故實現了索引覆蓋。 思考:
當查詢字段只有主鍵時,更容易實現索引覆蓋,因為索引只要覆蓋where條件,就可以實現索引覆蓋。
4.總結與建議
索引的核心作用: (1)通過索引檢索僅需要數據 (2)從索引中直接獲取查詢結果
索引覆蓋的條件: (1)Select查詢的返回列包含在索引列中 (2)有where條件時,where條件中要包含索引列或複合索引的前導列 (3)查詢結果的總字段長度可以接受
- 應用健康度隱患刨析解決系列之數據庫時區設置
- 對於Vue3和Ts的心得和思考
- 一文詳解擴散模型:DDPM
- zookeeper的Leader選舉源碼解析
- 一文帶你搞懂如何優化慢SQL
- 京東金融Android瘦身探索與實踐
- 微前端框架single-spa子應用加載解析
- cookie時效無限延長方案
- 聊聊前端性能指標那些事兒
- Spring竟然可以創建“重複”名稱的bean?—一次項目中存在多個bean名稱重複問題的排查
- 京東金融Android瘦身探索與實踐
- Spring源碼核心剖析
- 深入淺出RPC服務 | 不同層的網絡協議
- 安全測試之探索windows遊戲掃雷
- 關於數據庫分庫分表的一點想法
- 對於Vue3和Ts的心得和思考
- Bitmap、RoaringBitmap原理分析
- 京東小程序CI工具實踐
- 測試用例設計指南
- 當你對 redis 説你中意的女孩是 Mia