自增ID插入时,究竟发生了什么?

《​​MySQL自增ID,居然大部分人都搞错了​​?​》中的作业题,有少量答对的人,但原理讲得不透,今天简单说下作业题中的答案,以及相关知识点。

作业题是这样的:

droptablet1;
createtablet1(
idintnotnullauto_increment,
namevarchar(10) unique,
countintdefault0,
primarykey(id),
index(name)
)engine=innodb;

insertintot1(id, name) values(1, "shenjian");

insertintot1(id, name) values
(111, "111"),(NULL, "abc"),(222, "222"),(NULL,"xyz");

执行结束后id分别是:

(1, 'shenjian')
(111, '111') // 允许指定值
(112, 'abc') // 忽略NULL,从最大值开始增
(222, '222') // 允许指定值
(223, 'xyz') // 忽略NULL,从最大值开始增

如果继续执行以下语句:

insertintot1(name)values("shenjian"),("aaa"),("bbb")
onduplicatekeyupdatecount=100;

请问:

  • 会不会执行报错?
  • 如果报错,为什么呢?
  • 如果不报错,得到的数据是什么呢?

知其然,知其所以然。先系统性讲讲相关知识点,InnoDB自增键,插入,如何插入,以及插入之后发生了什么?

画外音:本文均以MySQL5.6,InnoDB引擎为例。

​什么是插入?

MySQL有一系列的语句,可以往数据库新增数据,称作泛插入语句(insert-like statement)。不同的插入方式,对自增键的影响是不一样的。

画外音:自增键,是指auto_increment,大家应该都用得很多。

有几种插入方式?​

更为细化后,总的来说,插入方式分为三类:

  • 简单插入(simple insert)
  • 批量插入(bulk insert)
  • 混合插入(mixed-mode insert)

什么是简单插入(simple insert)?

​普通的insert/replace语句,不管是单条插入还是多条插入,都是简单插入。

画外音:

  • 不包含递归的子查询;
  • 不包含insert … on duplicate key update… ;

例如,对于作业题中的数据表:

insertintot1(id, name) values(1,"shenjian");
insertintot1(name) values("zhangsan"),("lisi"),("ww");

都是简单插入。

简单插入的特点是,能够提前知道被插入的行数。因此,这类插入,在处理自增键时,是最容易的。

画外音:很容易保证自增键连续性。

什么是批量插入(bulk insert)?​

与简单插入相对,在插入时,不知道被插入的行数,是批量插入。

例如,对于作业题中的数据表:

insertintot1(name) selectnamefromt2;

除此之外,像:

  • replace … select …
  • load data

都是批量插入。

由于不能够提前知道多少行插入,在处理自增列时,每插入一行,才会赋值新的自增值。

画外音,官网原文是:

InnoDB assigns new values for the AUTO_INCREMENT column one at a time as each
row is processed.

这里的潜台词是,在批量插入事务并发时,“可能”出现同一个事务的自增键不连续。

什么是混合插入(mixed-mode insert)?

例如,对于作业题中的SQL:

insertintot1(id, name) values

(111,"111"),(NULL, "abc"),(222,"222"),(NULL,"xyz");

有些行插入时指定了自增键,无需数据库生成;有些行插入时未指定自增键(NULL),需要数据库生成。

画外音:具体走哪个分支,实际执行时才知道。

以及,作业题中的如下SQL:

insertintot1(name) values("shenjian"),("aaa"),("bbb")
onduplicatekeyupdatecount=100;

有些行插入实际上是修改,有些行插入实际上就是插入。​

画外音:具体走哪个分支,也是实际执行时才知道。

insert … on duplicate key update … 这种情况是最最复杂的,它可能导致,系统生成的自增值,在更新阶段用不上。

画外音,官网原文是:

an INSERT followed by a UPDATE, where the allocated value for the
AUTO_INCREMENT column may or may not be used during the update phase.

说了这么多,对于作业题,id分别是:​

(1, 'shenjian')
(111, '111') // 允许指定值
(112, 'abc') // 忽略NULL,从最大值开始增
(222, '222') // 允许指定值
(223, 'xyz') // 忽略NULL,从最大值开始增

如果继续执行以下语句,答案会是什么呢?

insertintot1(name)values("shenjian"),("aaa"),("bbb")
onduplicatekeyupdatecount=100;

答案如下:

对于:​

insert ("shenjian"),("aaa"),("bbb")

系统以为是批量插入,就生成了224,225,226三个连续自增键。

接下来:​

onduplicatekeyupdate...

结果有一行插入冲突,实际是更新,导致224这个自增值并没有用上,于是就出现了奇怪的“自增值不连续”的怪异现象。​

文章来源网络,作者:管理,如若转载,请注明出处:https://shuyeidc.com/wp/240772.html<

(0)
管理的头像管理
上一篇2025-04-24 00:53
下一篇 2025-04-24 00:55

相关推荐

  • 骨干网络体系结构能干什么?骨干网络体系结构的作用

    骨干网络体系结构是现代信息社会的“超级高速公路网”,它通过分层设计、冗余备份和智能调度,确保海量数据在全球范围内高速、稳定、安全地传输,是支撑云计算、物联网及人工智能应用的底层基石,想象一下,如果你把互联网比作一个巨大的城市交通系统,那么骨干网络就是连接各个城市的主干道和立交桥,没有它,你的每一次微信发送、每一……

    2026-06-18
    0
  • 高io数据库可以干什么用?高io数据库适合什么场景

    高IO数据库的核心价值在于通过极高的读写吞吐量,解决海量数据场景下的性能瓶颈,是支撑高并发交易、实时分析及大规模内容分发的关键基础设施,在数字化转型的深水区,数据不再仅仅是静态的记录,而是流动的资产,传统的机械硬盘或普通SSD早已无法满足现代应用对速度的极致追求,高IO(Input/Output)数据库,就是那……

    2026-06-18
    0
  • 高io服务器性能如何?高io服务器适合什么场景

    高IO服务器并非单纯指代某种硬件,而是指在随机读写、高并发连接及小文件处理场景下,具备极致IOPS(每秒输入输出操作次数)和低延迟特性的计算资源,它是支撑现代高并发应用稳定运行的核心基石,在2026年的数字化浪潮中,业务负载早已从简单的静态页面展示演变为复杂的实时数据处理,许多开发者在排查系统瓶颈时,往往忽略了……

    2026-06-18
    0
  • 隔离网络空间哪里便宜?国内隔离网络空间价格

    隔离网络空间并没有统一的“便宜”标准,其成本高度取决于物理隔离等级、带宽需求及安全合规要求,通常物理网闸方案初期投入较高但长期运维成本低,而逻辑隔离方案虽初期便宜但存在潜在安全风险,建议根据业务敏感度选择混合隔离架构以平衡成本与安全,在数字化时代,企业构建独立网络环境的需求日益增长,但“隔离网络空间哪里便宜”这……

    2026-06-18
    0
  • 骨干网络体系结构设备为何故障?常见原因有哪些

    骨干网络体系结构设备故障的核心原因通常归结为硬件老化、配置错误、物理链路中断及外部攻击四大类,其中电源模块失效与光模块性能衰减是占比最高的隐性故障源,骨干网作为数字经济的“大动脉”,其稳定性直接关乎国计民生,当核心路由器或交换机出现丢包、震荡甚至宕机时,运维人员往往面临巨大的压力,很多人第一反应是检查软件配置……

    2026-06-18
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注