什么?MySQL的等值查询竟然出错了?

1.问题背景

前段时间,一个业务线的小伙伴大G找过来,如下是我俩的对话。

大G:云杰,听说你MySQL挺厉害的,我最近遇到一个奇怪问题,不知道你遇到过没,请教你下。

我:请教不敢当,我也就是个MySQL入门级选手,说来看看。

大G:WHERE条件去等值查询字符串,结果却查出来几条尾部有空格的,明明不相等。

我:不会吧?这么神奇,这个真没遇到过!

大G:不信你试试!

我:试试就试试!

抱着求知的心态,开启了本篇的探索之旅。

2.验证

2.1 数据准备

首先在测试库里建表,并准备相关的原数据。创建个user_info表,分别插入’adu'(无空格)、’adu ‘(一个空格)、’adu    ‘(四个空格)三个用户。

CREATETABLE`user_info` (
`id`BIGINT(20) UNSIGNEDNOTNULLAUTO_INCREMENTCOMMENT'主键自增ID',
`user_name`VARCHAR(64) NOTNULLDEFAULT''COMMENT'名字',

PRIMARYKEY (`id`),
KEY`idx_user_name` (`user_name`)
) ENGINE=InnoDBDEFAULTCHARSET=utf8mb4COMMENT='用户表';

INSERTINTOuser_info(user_name) values('adu'); #无空格
INSERTINTOuser_info(user_name) values('adu '); #一个空格
INSERTINTOuser_info(user_name) values('adu '); #四个空格

2.2 问题验证

2.2.1 尾部空格验证

SELECT*FROMuser_infoWHEREuser_name='adu'; #无空格
SELECT*FROMuser_infoWHEREuser_name='adu '; #一个空格
SELECT*FROMuser_infoWHEREuser_name='adu '; #两个空格
SELECT*FROMuser_infoWHEREuser_name='adu '; #四个空格

我们使用如上条件去查,还真复现了!无论查询中尾部带有几个空格,结果是一样的,都会命中’adu’、’adu ‘、’adu    ‘三个用户,结果如下图所示(红框圈起来的表示我们认为不应该出现的异常结果):

太神奇了!

2.2.2 头部空格验证

那如果把空格放在前面呢?再来一把,结果如下:这下又匹配不上了。空格放在后边可以,放在前边不可以,这太神奇了!!

2.2.3 唯一索引验证

那如果在user_name字段上建唯一索引,还能插入这三条记录吗?再来一把,结果如下:

也不行,被唯一索引约束住了。

2.2.4 长度验证

那这三条记录的user_name长度又分别是多少呢?

确实长度也不一样。

2.3 验证小结

从结果上来看,明明是三个长度不同的字符串,空格放在前边被认为是不同,放在后边又被认为是相同,而且唯一索引也冲突。我们有充足的理由怀疑MySQL忽略字符串尾部的空格,把’adu’、’adu ‘、’adu    ‘都当成’adu’来处理。这确实超出了已有的认知,那背后的原因究竟又是什么呢?

3.分析原因

查询MySQL的官方文档[1],原来跟字符串的校对规则有关。

原来MySQL的校对规则基于PAD SPACE,这就意味着CHAR、VARCHAR、TEXT等字符串的等值比较(“=”)会忽略掉尾部的空格,而且官网也说了,适用于所有MySQL版本,并且不会改变。这。。。

既然MySQL官网说的这么肯定,那么自信来自哪里呢?我们继续追查SQL规范,原来SQL规范还真对这块做了特别说明[2],如下所示:

既然规范都这样要求了,等值查询“=”不能精确查询,那么到底该如何精确地进行等值查询呢?

4.精确查询的方法

通过调研,我们可以通过以下两种方式进行精确等值查询。

4.1 LIKE

LIKE是基于逐个字符进行比较的,这样就不会忽略尾部的空格,官网对这块也有特别的说明。

那么我们再使用LIKE进行等值查询,结果还真可以!

4.2 BINARY

BINARY不是函数,是类型转换运算符,它用来强制它后面的字符串转为二进制字节,再逐个字节比较,也可以理解成精确匹配,官网[4]对这块也有特别的说明。

那么我们再使用BINARY进行等值查询,结果也是可以的。

5.总结

  • MySQL的CHAR、VARCHAR、TEXT等字符串字段在等值比较(”=”)时,基于PAD SPACE校对规则,会忽略掉尾部的空格;
  • 在存储时,不会自动截断尾部的空格,会按原值存储;
  • 如果想要精确查询就不能用等值查询(”=”),而应改用LIKE或BINARY;
  • 认知有界,而求知无界。

关于作者

杜云杰,高级架构师,转转架构部负责人,转转技术委员会执行主席,腾讯云TVP。负责服务治理、MQ、云平台、APM、IM、分布式调用链路追踪、监控系统、配置中心、分布式任务调度平台、分布式ID生成器、分布式锁等基础组件。

道阻且长,拥抱变化;而困而知,且勉且行。

文章来源网络,作者:管理,如若转载,请注明出处:https://shuyeidc.com/wp/230844.html<

(0)
管理的头像管理
上一篇2025-04-19 10:25
下一篇 2025-04-19 10:26

相关推荐

  • 骨干网络体系结构能干什么?骨干网络体系结构的作用

    骨干网络体系结构是现代信息社会的“超级高速公路网”,它通过分层设计、冗余备份和智能调度,确保海量数据在全球范围内高速、稳定、安全地传输,是支撑云计算、物联网及人工智能应用的底层基石,想象一下,如果你把互联网比作一个巨大的城市交通系统,那么骨干网络就是连接各个城市的主干道和立交桥,没有它,你的每一次微信发送、每一……

    2026-06-18
    0
  • 高io数据库可以干什么用?高io数据库适合什么场景

    高IO数据库的核心价值在于通过极高的读写吞吐量,解决海量数据场景下的性能瓶颈,是支撑高并发交易、实时分析及大规模内容分发的关键基础设施,在数字化转型的深水区,数据不再仅仅是静态的记录,而是流动的资产,传统的机械硬盘或普通SSD早已无法满足现代应用对速度的极致追求,高IO(Input/Output)数据库,就是那……

    2026-06-18
    0
  • 高io服务器性能如何?高io服务器适合什么场景

    高IO服务器并非单纯指代某种硬件,而是指在随机读写、高并发连接及小文件处理场景下,具备极致IOPS(每秒输入输出操作次数)和低延迟特性的计算资源,它是支撑现代高并发应用稳定运行的核心基石,在2026年的数字化浪潮中,业务负载早已从简单的静态页面展示演变为复杂的实时数据处理,许多开发者在排查系统瓶颈时,往往忽略了……

    2026-06-18
    0
  • 隔离网络空间哪里便宜?国内隔离网络空间价格

    隔离网络空间并没有统一的“便宜”标准,其成本高度取决于物理隔离等级、带宽需求及安全合规要求,通常物理网闸方案初期投入较高但长期运维成本低,而逻辑隔离方案虽初期便宜但存在潜在安全风险,建议根据业务敏感度选择混合隔离架构以平衡成本与安全,在数字化时代,企业构建独立网络环境的需求日益增长,但“隔离网络空间哪里便宜”这……

    2026-06-18
    0
  • 骨干网络体系结构设备为何故障?常见原因有哪些

    骨干网络体系结构设备故障的核心原因通常归结为硬件老化、配置错误、物理链路中断及外部攻击四大类,其中电源模块失效与光模块性能衰减是占比最高的隐性故障源,骨干网作为数字经济的“大动脉”,其稳定性直接关乎国计民生,当核心路由器或交换机出现丢包、震荡甚至宕机时,运维人员往往面临巨大的压力,很多人第一反应是检查软件配置……

    2026-06-18
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注