字符集

Mysql 的字符集有4个级别的默认设置:服务器级数据库级表级字段级,客户端交互时,也可以指定字符集

# 字符集:是一个系统支持的所有抽象字符的集合。字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等

最早的字符集:ASCII码

中国的字符集:gbk,utf8,gbk2312
日本字符集:shift-JIS
韩国字符集:Euc-kr 万国编码:Unicode 字符集 # 常用的字符集:
gbk:一个汉字占用2个字节
utf8:一个汉字占用3个字节
utf8mb4:一个汉字占用4个字节 # 字符集修改要求:
包含关系才可以修改,通常可以从 gbk -> utf8 -> utfm64
而不能反过来,否则某些字符编码会不识别(如 utfm64 中包含表情) # 查看字符集:
mysql> show charset;
mysql> select * from information_schema.character_sets;

校验规则

这些比较规则的命名还挺有规律的,具体规律如下:

比较规则名称以与其关联的字符集的名称开头。如上图的查询结果的比较规则名称都是以utf8开头的。

后边紧跟着该比较规则主要作用于哪种语言,比如utf8_polish_ci表示以波兰语的规则比较,utf8_spanish_ci是以西班牙语的规则比较,utf8_general_ci是一种通用的比较规则。

名称后缀意味着该比较规则是否区分语言中的重音、大小写啥的,具体可以用的值如下:

后缀 英文释义 描述
_ai accent insensitive 不区分重音
_as accent sensitive 区分重音
_ci case insensitive 不区分大小写
_cs case sensitive 区分大小写
_bin binary 以二进制方式比较

比如utf8_general_ci这个比较规则是以ci结尾的,说明不区分大小写。

每种字符集对应若干种比较规则,每种字符集都有一种默认的比较规则,SHOW COLLATION的返回结果中的Default列的值为YES的就是该字符集的默认比较规则,比方说utf8字符集默认的比较规则就是utf8_general_ci。

Mysql 的校验规则有4个级别的默认设置:服务器级数据库级表级字段级,客户端交互时,也可以指定校验规则

# 查看校验规则:
mysql> show collation;
mysql> select * from information_schema.collations; | latin7_general_ci | latin7 |
| latin7_general_cs | latin7 |
| latin7_bin | latin7 | # 校验规则区别
1.以 ci 结尾:不区分大小写
2.以 cs 或者 bin 结尾:区分大小写 # 大小写不同,相同字段也不能添加
mysql> alter table city add nAME varchar(10);
ERROR 1060 (42S21): Duplicate column name 'nAME'

设置字符集

# 1.xshell 字符集,在工具类设置
# 2.linux 系统字符集
# 临时修改
[root@db03 ~]# LANG=zh_CN.UTF-8
# 永久修改
[root@db03 ~]# vim /etc/sysconfig/i18n # Centos6
[root@db03 ~]# vim /etc/locale.conf # Centos7
LANG="zh_CN.UTF-8" # 3.数据库 字符集
1)cmake 字符集指定
cmake .
-DDEFAULT_CHARSET=utf8 \
-DDEFAULT_COLLATION=utf8_general_ci \
-DWITH_EXTRA_CHARSETS=all \
2)配置文件
[root@db03 ~]# vim /etc/my.cnf
[mysqld]
character-set-server=utf8 # 4.创建数据库时指定字符集
mysql> create database db7 charset utf8;
Query OK, 1 row affected (0.00 sec) mysql> show create database db7;
+----------+--------------------------------------------------------------+
| Database | Create Database |
+----------+--------------------------------------------------------------+
| db7 | CREATE DATABASE `db7` /*!40100 DEFAULT CHARACTER SET utf8 */ |
+----------+--------------------------------------------------------------+
1 row in set (0.00 sec) # 5.建表时根据库的字符集来建表
mysql> create table tb1(id int); # 6.指定字符集建表
mysql> create table tb3(id int) charset utf8mb4;
Query OK, 0 rows affected (0.01 sec) # 7.指定列的字符集
mysql> create table tbtest(name varchar(12) charset latin1);
Query OK, 0 rows affected (0.05 sec) # 8.修改库的字符集
mysql> alter database db7 charset gbk;
Query OK, 1 row affected (0.00 sec) # 9.修改表的字符集
mysql> alter table tb2 charset gbk;
Query OK, 0 rows affected (0.00 sec)
Records: 0 Duplicates: 0 Warnings: 0 # 10.修改列的字符集
mysql> alter table student change name name char(24) character set utf8;
Query OK, 6 rows affected (0.03 sec)
Records: 6 Duplicates: 0 Warnings: 0

参考:

字符集和字符序(校验规则),及其四个默认等级

最新文章

  1. PDO操作数据库
  2. mysql数据库及oracle数据库的定时备份
  3. mongostat 3.2指标详解
  4. 谈谈JPA-01-概述
  5. Be quiet
  6. 转:ASP.NET MVC中Unobtrusive Ajax的妙用
  7. NSIS 2.0界面快速入门
  8. 一天一个Java基础——排序
  9. JXL解析Excel表格内容到数据库
  10. java中的堆、栈、常量池
  11. 搭建ganglia集群而且监视hadoop CDH4.6
  12. C#,js数据排序及其操作
  13. JavaScript使用点滴
  14. c++中的左值与右值
  15. Django学习手册 - 如何安装django 和 python ?
  16. PTA第三个编程题总结
  17. godaddy如何联系客服帮助的技巧和方法
  18. Flask学习【第2篇】:Flask基础
  19. MySQL事务提交过程(转载)
  20. ORM 的基本操作

热门文章

  1. 聊聊 React
  2. Pulsar 社区周报|2021-01-11~2021-01-17
  3. 一个div画同心圆
  4. 基于FPGA的光口通信开发案例|基于Kintex-7 FPGA SFP+光口的10G UDP网络通信开发案例
  5. [Usaco2008 Mar]牛跑步
  6. 1.8V转3V,1,8V转3.3V电源芯片的规格书参数
  7. 2V升3.3V芯片,输出500MA,低功耗10uA解决方案
  8. RecyclerView 源码分析(二) —— 缓存机制
  9. GIT常用命令:
  10. 我们都可以把它放 Sidecar 容器中,这样微服务具备了 Super power,一种超能力