SQL应用复制如何跳过错误？

在SQL应用复制过程中,错误处理是确保数据一致性和复制稳定性的关键环节，当主从复制遇到错误时（如主键冲突、数据类型不匹配、唯一索引重复等），直接终止复制会导致数据同步中断，影响业务连续性，通过配置复制跳过错误，可以在特定条件下忽略部分错误并继续复制流程，但需谨慎使用以避免数据不一致，以下是SQL复制跳过错误的详细方法、适用场景及注意事项。

（图片来源网络，侵删）

复制错误的常见类型及跳过原理

SQL复制错误通常源于数据冲突或结构不一致,常见类型包括：

主键或唯一键冲突：从库已有相同主键/唯一键的数据，导致INSERT或UPDATE失败。
数据类型不匹配：主从列类型不一致（如主库INT、从库VARCHAR），引发转换错误。
外键约束失败：从库外键关联的数据不存在。
执行超时：大事务或复杂查询超过从库slave_net_timeout阈值。
DDL语句冲突：主从表结构不一致（如列数、类型不同）。

跳过错误的原理是通过设置复制参数,让从库SQL线程在遇到特定错误码时继续执行后续事件，而非终止复制，需注意，跳过错误仅适用于可容忍数据不一致的场景（如临时数据同步、非核心业务），核心业务建议优先修复数据源。

MySQL复制跳过错误的实现方法

全局跳过错误（临时生效）

通过sql_slave_skip_counter参数跳过指定数量的复制事件（通常为1，跳过当前错误事件）：

STOP SLAVE;
SET GLOBAL sql_slave_skip_counter = 1;
START SLAVE;

适用场景：单次错误跳过，如主键冲突后手动介入修复。
缺点：需手动执行，无法自动化；跳过事件可能导致数据丢失。

（图片来源网络，侵删）

基于错误码的自动跳过（推荐）

在从库配置文件（my.cnf或my.ini）中设置slave_skip_errors参数，指定跳过的错误码（多个用逗号分隔）：

[mysqld]
slave_skip_errors = 1062,1032,1053

常见错误码说明：
| 错误码 | 错误名称 | 典型场景 |
|——–|————————|——————————|
| 1062 | Duplicate key name | 主键/唯一键冲突 |
| 1032 | Record not found | UPDATE/DELETE的目标记录不存在 |
| 1053 | Server shutdown in progress | 服务器关闭中（临时错误） |
| 1592 | Unsafe statement | 不安全的SQL（如非确定函数） |

动态生效（无需重启）：

SET GLOBAL slave_skip_errors = '1062,1032';

基于GTID的复制跳过错误

使用GTID（全局事务标识符）时，可通过gtid_purged或gtid_executed控制跳过事务：

（图片来源网络，侵删）

-- 跳过指定GTID事务
SET GLOBAL gtid_purged = 'xxxxxxxx:xx';
-- 或在复制启动时指定跳过事务
CHANGE REPLICATION SOURCE TO
  SOURCE_AUTO_POSITION=1,
  FOR_CHANNEL 'channel1'
  SOURCE_RETRY_COUNT=10;

基于过滤规则的跳过

通过replicate-wild-ignore-table或replicate-do-table参数过滤特定表，避免复制错误：

[mysqld]
replicate-wild-ignore-table=test.%
replicate-ignore-db=information_schema

PostgreSQL复制跳过错误的方法

PostgreSQL基于流复制（Streaming Replication）和逻辑复制（Logical Replication），跳过错误的方式与MySQL不同：

流复制跳过错误：
通过recovery.conf（PostgreSQL 12及以下）或standby.signal（PostgreSQL 13+）设置recovery_target_timeline和pause_at_recovery_target，结合手动干预：
```
standby_mode = on
primary_conninfo = 'host=primary_user=replicapassword=xxx'
recovery_target_timeline = latest
```
遇到错误时,可通过pg_ctl promote提升从库为主库，或使用pg_recvlogical跳过事务。

逻辑复制跳过错误：
创建订阅（subscription）时设置copy_data=false，避免初始同步错误：

CREATE SUBSCRIPTION mysub
CONNECTION 'host=primaryuser=replicapassword=xxx'
PUBLICATION mypub
WITH (copy_data = false, enabled = false);

SQL Server复制跳过错误的方法

SQL Server的复制（Transactional/Peer-to-Peer）可通过以下方式跳过错误：

使用sp_repldone标记事务：
手动跳过事务并标记为已执行：

EXEC sp_repldone @xactid = NULL, @xact_segno = NULL, @numtrans = 0, @time = 0;

配置分发代理参数：
在分发代理启动时添加-SkipErrors参数：
```
-SkipErrors 2601,2627
```
禁用约束检查：
临时禁用外键约束或唯一约束：
```
ALTER TABLE nocheck CONSTRAINT all;
```

注意事项与最佳实践

错误分析优先：跳过错误前需通过SHOW SLAVE STATUS（MySQL）或pg_stat_replication（PostgreSQL）分析错误原因，避免掩盖问题。
定期验证数据一致性：使用pt-table-checksum（Percona工具）或pg_verify_checksums校验主从数据差异。
监控与告警：配置复制延迟或错误监控（如Prometheus+Grafana），及时发现问题。
测试环境验证：生产环境跳过错误前，需在测试环境模拟相同场景，评估数据影响。
限制跳过范围：避免全局跳过（如slave_skip_errors=all），仅跳过已知可恢复的错误。

SQL应用复制如何跳过错误？

复制错误的常见类型及跳过原理

MySQL复制跳过错误的实现方法

全局跳过错误（临时生效）

基于错误码的自动跳过（推荐）

基于GTID的复制跳过错误

基于过滤规则的跳过

PostgreSQL复制跳过错误的方法

SQL Server复制跳过错误的方法

注意事项与最佳实践

相关问答FAQs

发表回复