MySQL的字符编码体系（二）—

MySQL的字符编码体系能够分成两部分：一部分是关于数据库server本身存储数据表时怎样管理字符数据的编码；还有一部分是关于client与数据库server数据传输怎样编码。上一篇MySQL的字符编码体系（一）——数据存储编码讨论了数据存储编码，本篇讨论数据传输编码。

MySQL的client能够分为两种：一种就是用C语言写的官方client——MySQL命令程序；一种就是寻常程序猿使用JDBC等connector API写成的client。这里仅仅讨论第一种。

Windowsclient

MySQL命令程序在Windows和Linux系统中关于字符编码处理的部分并不等效，下图是Windows系统的client字符编码转换逻辑：

当中的三个character变量存在于server上，而charset_info存在于client。

当client启动连接到server时。client将依据配置參数设置charset_info为指定编码，同一时候通知server让server把三个character变量设置为同样编码。

因为在Windows平台上MySQL程序在读取控制台时使用了Unicode Console Read API，所以程序从控制台获取的原始字符串实际上是UTF16编码。所以这里的“操作系统编码”并非Windows通常的GBK，而应该看做UTF16。

下图是Linux系统中的MySQLclient程序字符编码转换逻辑：

它与Windows版的不同之处就在于。它并不把来自终端标准输入的操作系统编码字符串强制转换为charset_info编码，也不会把输出到终端的charset_info编码结果字符串强制转换为操作系统编码。

也就是说，Linux平台的MySQL程序这时候会会忽略charset_info变量。当然。这样一来Linuxclient的传输数据流程就比Windowsclient相应地少几步。

依据Linux平台MySQL程序的这一特点，非常easy产生这样一个可能的陷阱：在Linux系统中通过MySQLclient向数据库插入中文数据后，查询结果没有乱码，但从配置正确的Windows平台MySQLclient查询同一个表得到的却是乱码。

能够这样模拟上述的情况：

创建一个表。当中仅仅包括一个GBK字符串字段和UTF8字符串字段。

Linux中启动MySQL连接到数据库server，将server的三个character变量从默认的UTF8改动为GBK。向数据库插入中文数据，马上select，结果无异常：

可是使用Windows的MySQLclient查询时。结果却是乱码：

结合前面的传输数据流程，就能知道问题出在什么地方：

到这里为止。数据表中存了一个UTF8字符串，而server却当它是GBK，在同一个Linuxclient查询时：

在Windowsclient查询时：

假设Windowsclient也想看到正确的结果，那就要有益错误地配置：