详解mysql字符集

字符集是一套符合和编码,校验规则(collation)是在字符集内用于比较字符的一套规则,即字符集的排序规则。MySQL可以使用对种字符集和检验规则来组织字符。

MySQL服务器可以支持多种字符集,在同一台服务器,同一个数据库,甚至同一个表的不同字段都可以指定使用不同的字符集,相比oracle等其他数据库管理系统,在同一个数据库只能使用相同的字符集,MySQL明显存在更大的灵活性。

一、服务器级字符集

(1)、可以在my.cnf中设置

[mysqld]
default-character-set=gbk (5.1)
character-set-server=gbk (5.5)

(2)、可以在启动选项中设置

mysqld --default-character-set=gbk

(3)、可以在编译的时候设置

./configure --with-charset=gbk
         或
cmake . -default-charset=gbk

如果没有指定服务器的字符集,默认使用latin1为服务器的字符集。

(4)、查看当前服务器的字符集

mysql> show variables like '%char%';
+--------------------------+-----------------------------------------+
| Variable_name            | Value                                   |
+--------------------------+-----------------------------------------+
| character_set_client     | latin1                                  |
| character_set_connection | latin1                                  |
| character_set_database   | latin1                                  |
| character_set_filesystem | binary                                  |
| character_set_results    | latin1                                  |
| character_set_server     | latin1                                  |
| character_set_system     | utf8                                    |
| character_sets_dir       | /usr/local/mysql-5.6.28/share/charsets/ |
+--------------------------+-----------------------------------------+

二、数据库字符集

数据库的字符集在创建数据库的时候指定,也可以在创建完数据库之后通过alter database语句修改。如果数据库中已经存在数据,修改数据库字符集并不能将已有的数据按新字符集存放。所以无法通过修改数据库字符集修改数据的内容。

设置数据库字符集的规则:

(1)、如果指定了字符集和校对规则,则使用指定的规则;

(2)、如果仅指定字符集而没有指定校对规则,则使用指定的字符集和默认的校对规则;

(3)、如果没有指定字符集和校对规则,则使用服务器的字符集和校对规;

三、表字符集

表的字符集是在建表的时候指定的,可以通过alter table语句进行修改。同样,对于表中已经存在的数据,修改字符集不会影响原有的记录,仍将使用原有的字符集。

设置表的字符集的规则同设置数据库的字符集规则。

四、列字符集

列的字符集和校对规则可以在建表的时候指定,也可以在修改表的时候调整。(这个不常用,仅记录一下)

五、SET NAMES命令

除了上述的四种字符集外,对实际的应用访问来说,还存在客户端和服务端之间交互的字符集,如下:

(1)、character_set_client:客户端字符集 (2)、character_set_connection:连接字符集 (3)、character_set_resluts:结果字符集

通常情况下,这3个字符集都应该是相同的,才能保证用户写入的数据被正确的读出,特别是对于中文字符。

set names命令则用于同时修改这3个参数的值。

六、关于中文字符集插入的实验

字符集不一致是导致数据库内中文内容乱码的罪魁祸首。

实验环境:

Server version: 5.6.28 (在此说明实验环境是由于在学习过程中,从网上参考了部分资料,实验过程与资料描述稍有出入,未查出原因,只能暂归结为版本不同所致。)

实验对象:

mysql> show create table char_test\G
*************************** 1. row ***************************
      Table: char_test
Create Table: CREATE TABLE `char_test` (
 `id` smallint(6) NOT NULL AUTO_INCREMENT,
 `name` char(20) NOT NULL,
 PRIMARY KEY (`id`)
) ENGINE=InnoDB AUTO_INCREMENT=3 DEFAULT CHARSET=latin1
1 row in set (0.00 sec)

由上可知,char_test表的字符集是latin1,如果不设置正确的字符集,插入中文字符时,必然会出现如下错误:

mysql> insert into char_test (name) values ('小王');
ERROR 1366 (HY000): Incorrect string value: '\xE5\xB0\x8F\xE7\x8E\x8B' for column 'name' at row 1

解决方案

(1)、先set names latin1,然后再插入数据。

mysql> set names latin1;
Query OK, 0 rows affected (0.00 sec)

mysql> insert into char_test (name) values ('小王');
Query OK, 1 row affected (0.01 sec)

mysql> select * from char_test;
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
+----+--------+
3 rows in set (0.00 sec)

(2)、在data.sql文件中指定set names latin1,然后通过source命令导入data.sql。

# vi data.sqlset names latin1;
insert into char_test (name) values ('小李');

mysql> source data.sql
Query OK, 1 row affected (0.00 sec)

mysql> select * from char_test;
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
|  4 | 小李   |
+----+--------+
4 rows in set (0.00 sec)

(3)、在data.sql文件中指定set names latin1,然后通过mysql命令导入

# vi data.sqlset names latin1;
insert into char_test (name) values ('小张');

# mysql -uroot -p test1  # mysql -uroot -p -e "set names latin1;select * from test1.char_test;"

(4)、通过指定mysql命令的字符集参数实现 –default-charset-set=字符集

# vi data.sql
insert into char_test (name) values ('小张');

# 错误方法# mysql -uroot -p  test1  Enter password: ****** ERROR 1366 (HY000) at line 1: Incorrect string value: '\xE5\xB0\x8F\xE8\xB5\xB5' for column 'name' at row 1 # 正确方法# mysql -uroot -p  --default-character-set=latin1 test1  Enter password: ****** # mysql -uroot -p -e "set names latin1;select * from test1.char_test;" Enter password: ****** +----+--------+ | id | name   | +----+--------+ |  1 | Tom    | |  2 | 小明   | |  3 | 小王   | |  4 | 小李   | |  5 | 小张   | |  6 | 小赵   | +----+--------+ 

(5)、在配置文件中指定客户端的字符集

vi my.cnf
[client]
default-character-set=latin1

mysql> insert into char_test (name) values ('小马');
Query OK, 1 row affected (0.00 sec)

mysql> select * from char_test;
+----+--------+
| id | name   |
+----+--------+
|  1 | Tom    |
|  2 | 小明   |
|  3 | 小王   |
|  4 | 小李   |
|  5 | 小张   |
|  6 | 小赵   |
|  7 | 小马   |
+----+--------+
7 rows in set (0.00 sec)

文章来源网络,作者:运维,如若转载,请注明出处:https://shuyeidc.com/wp/206364.html<

(0)
运维的头像运维
上一篇2025-04-08 01:21
下一篇 2025-04-08 01:22

相关推荐

  • 个人主题怎么制作?

    制作个人主题是一个将个人风格、兴趣或专业领域转化为视觉化或结构化内容的过程,无论是用于个人博客、作品集、社交媒体账号还是品牌形象,核心都是围绕“个人特色”展开,以下从定位、内容规划、视觉设计、技术实现四个维度,详细拆解制作个人主题的完整流程,明确主题定位:找到个人特色的核心主题定位是所有工作的起点,需要先回答……

    2025-11-20
    0
  • 社群营销管理关键是什么?

    社群营销的核心在于通过建立有温度、有价值、有归属感的社群,实现用户留存、转化和品牌传播,其管理需贯穿“目标定位-内容运营-用户互动-数据驱动-风险控制”全流程,以下从五个维度展开详细说明:明确社群定位与目标社群管理的首要任务是精准定位,需明确社群的核心价值(如行业交流、产品使用指导、兴趣分享等)、目标用户画像……

    2025-11-20
    0
  • 香港公司网站备案需要什么材料?

    香港公司进行网站备案是一个涉及多部门协调、流程相对严谨的过程,尤其需兼顾中国内地与香港两地的监管要求,由于香港公司注册地与中国内地不同,其网站若主要服务内地用户或使用内地服务器,需根据服务器位置、网站内容性质等,选择对应的备案路径(如工信部ICP备案或公安备案),以下从备案主体资格、流程步骤、材料准备、注意事项……

    2025-11-20
    0
  • 如何企业上云推广

    企业上云已成为数字化转型的核心战略,但推广过程中需结合行业特性、企业痛点与市场需求,构建系统性、多维度的推广体系,以下从市场定位、策略设计、执行落地及效果优化四个维度,详细拆解企业上云推广的实践路径,精准定位:明确目标企业与核心价值企业上云并非“一刀切”的方案,需先锁定目标客户群体,提炼差异化价值主张,客户分层……

    2025-11-20
    0
  • PS设计搜索框的实用技巧有哪些?

    在PS中设计一个美观且功能性的搜索框需要结合创意构思、视觉设计和用户体验考量,以下从设计思路、制作步骤、细节优化及交互预览等方面详细说明,帮助打造符合需求的搜索框,设计前的规划明确使用场景:根据网站或APP的整体风格确定搜索框的调性,例如极简风适合细线条和纯色,科技感适合渐变和发光效果,电商类则可能需要突出搜索……

    2025-11-20
    0

发表回复

您的邮箱地址不会被公开。必填项已用 * 标注