MySQL多列索引的应用

多列索引

我们经常听到一些人说”把WHERE条件里的列都加上索引”,其实这个建议非常错误。在多个列上建立单独的索引大部分情况下并不能提高MySQL的查询性能。MySQL在5.0之后引入了一种叫“索引合并”(index merge)的策略,一定程度上可以使用表上的多个单列索引来定位指定的行。但是当服务器对多个索引做联合操作时,通常需要耗费大量CPU和内存资源在算法的缓存、排序和合并操作上,特别是当其中有些索引的选择性不高,需要合并扫描大量的数据的时候。

这个时候,我们需要一个多列索引。

案例

创建一个测试数据库和数据表:

  1. CREATE DATABASE IF NOT EXISTS db_test default charset utf8 COLLATE utf8_general_ci;  
  2. use db_test; 
  3. CREATE TABLE payment (   
  4.     id         INT UNSIGNED NOT NULL AUTO_INCREMENT,   
  5.     staff_id  INT UNSIGNED NOT NULL,   
  6.     customer_id INT UNSIGNED NOT NULL,   
  7.     PRIMARY KEY (id) 
  8. ) ENGINE=InnoDB DEFAULT CHARSET=utf8;  

插入1000w行随机数据(利用存储过程):

  1. DROP PROCEDURE IF EXISTS add_payment;   
  2. DELIMITER // 
  3.     create PROCEDURE add_payment(in num INT
  4.     BEGIN 
  5.         DECLARE rowid INT DEFAULT 0; 
  6.         SET @exesql = 'INSERT INTO payment(staff_id, customer_id) values (?, ?)'
  7.         WHILE rowid < num DO 
  8.             SET @staff_id = (1 + FLOOR(5000*RAND()) );  
  9.             SET @customer_id = (1 + FLOOR(500000*RAND())); 
  10.             SET rowid = rowid + 1; 
  11.             prepare stmt FROM @exesql; 
  12.             EXECUTE stmt USING @staff_id, @customer_id;             
  13.         END WHILE; 
  14.     END // 
  15. DELIMITER ;  

或者你可以直接下载使用我的测试数据(也是利用上面的存储过程,但是我之后调整了数据):

测试数据

添加两个单列索引(执行过程要花点时间,建议分开一句一句执行):

  1. ALTER TABLE `payment` ADD INDEX idx_customer_id(`customer_id`); 
  2.  
  3. ALTER TABLE `payment` ADD INDEX idx_staff_id(`staff_id`);  

查询一条数据利用到两个列的索引:

  1. select count(*) from payment where staff_id = 2205 AND customer_id = 93112; 

查看执行计划:

  1. mysql> explain select count(*)  from payment  where staff_id =  2205  AND customer_id =  93112; 
  2. +----+-------------+---------+-------------+------------------------------+------------------------------+---------+------+-------+-------------------------------------------------------------------------+ 
  3. | id | select_type | table   | type        | possible_keys                | key                          | key_len | ref  | rows  | Extra                                                                   | 
  4. +----+-------------+---------+-------------+------------------------------+------------------------------+---------+------+-------+-------------------------------------------------------------------------+ 
  5. |  1 | SIMPLE      | payment | index_merge | idx_customer_id,idx_staff_id | idx_staff_id,idx_customer_id | 4,4     | NULL | 11711 | Using intersect(idx_staff_id,idx_customer_id); Using where; Using index | 
  6. +----+-------------+---------+-------------+------------------------------+------------------------------+---------+------+-------+-------------------------------------------------------------------------+ 
  7. 1 row in set (0.00 sec) 

可以看到type是index_merge,Extra中提示Using intersect(idx_staff_id,idx_customer_id);

这便是索引合并,利用两个索引,然后合并两个结果(取交集或者并集或者两者都有)

查询结果:

  1. mysql> select count(*)  from payment  where staff_id =  2205  AND customer_id =  93112 ; 
  2. +----------+ 
  3. count(*) | 
  4. +----------+ 
  5. |   178770 | 
  6. +----------+ 
  7. 1 row in set (0.12 sec)  

然后删除以上索引,添加多列索引:

  1. ALTER TABLE payment DROP INDEX idx_customer_id; 
  2.  
  3. ALTER TABLE payment DROP INDEX idx_staff_id; 
  4.  
  5. ALTER TABLE `payment` ADD INDEX idx_customer_id_staff_id(`customer_id`, `staff_id`);  

注意,多列索引很关注索引列的顺序(因为customer_id的选择性更大,所以把它放前面)

查询:

  1. mysql> select count(*)  from payment  where staff_id =  2205  AND customer_id =  93112; 
  2. +----------+ 
  3. count(*) | 
  4. +----------+ 
  5. |   178770 | 
  6. +----------+ 
  7. 1 row in set (0.05 sec)  

发现多列索引加快的查询(这里数据量还是较小,更大的时候比较更明显)

注意

多列索引的列顺序至关重要,如何选择索引的列顺序有一个经验法则:将选择性***的列放到索引最前列(但是不是绝对的)。经验法则考虑全局的基数和选择性,而不是某个具体的查询:

  1. mysql> select count(DISTINCT staff_id) / count(*) AS staff_id_selectivity, count(DISTINCT customer_id) / count(*) AS customer_id_selectivity, count(*) from payment\G; 
  2. *************************** 1. row *************************** 
  3.    staff_id_selectivity: 0.0005 
  4. customer_id_selectivity: 0.0500 
  5.                count(*): 10000000 
  6. 1 row in set (6.29 sec)  

customer_id的选择性更高,所以将它作为索引列的***位。

多列索引只能匹配最左前缀,也就是说:

  1. select * from payment  where staff_id =  2205  AND customer_id =  93112 ; 
  2. select count(*)  from payment  where  customer_id =  93112 ;  

可以利用索引,但是

  1. select * from payment where staff_id = 2205 ; 

不能利用索引。 

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/289638.html<

(0)
运维的头像运维
上一篇2025-05-16 21:26
下一篇 2025-05-16 21:27

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注