UTF-8 (8-bit Unicode Transformation Format) 是一种针对Unicode的可变长度字符编码,又称万国码,它包含全世界所有国家需要用到的字符,是国际编码,通用性强,是用以解决国际上字符的一种多字节编码。由Ken Thompson于1992年创建。UTF-8用1到4个字节编码UNICODE字符,它对英文使用8位/8Bit(即1个字节/1Byte),中文使用24位/24Bit(3个字节/3Byte)来编码。用在网页上可以同一页面显示中文简体繁体及其它语言(如日文,韩文)。

GBK (Chinese Internal Code Specification) 是汉字编码标准之一,全称《汉字内码扩展规范》,中华人民共和国全国信息技术标准化技术委员会1995年12月1日制订,国家技术监督局标准化司、电子工业部科技与质量监督司1995年12月15日联合以技监标函1995 229号文件的形式,将它确定为技术规范指导性文件。
GBK是国家标准GB2312基础上扩容后兼容GB2312的标准(GB2312共收录了7445个字符,包括6763个汉字和682个其它符号;GBK共收录了27484个汉字,同时还收录了藏文、蒙文、维吾尔文等主要的少数民族文字)。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示(注意,GB系列编码是利用了字节中的最高位和ASCII编码区分的,可以和ASCII码混用。所以全角模式下英文是2字节,半角模式英文还是1字节)。为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。

简单概况就是:
UTF-8英文1字节中文3字节,在编码效率和编码安全性之间做了平衡,适合网络传输,是理想的中文编码方式.
GBK英文1字节(半角1字节,全角2字节),中文2字节,GBK的范围比GB2312广,GBK兼容GB2312。

最新文章

  1. MYSQL 导入Excel数据到数据库中
  2. Java多线程之构造与发布
  3. spring-data-redis注册fastjson序列化工具
  4. 如何处理js的跨域问题
  5. eclipse 快捷键保存在哪里
  6. [Javascript] The "this" keyword
  7. 纠结的ARC
  8. ubuntu14.04修复启动项
  9. iOS 跳转到应用所在的App Store市场
  10. 第四章 Linux环境
  11. JDBC连接数据库实现删除功能
  12. oracle 创建用户并赋权 清空用户表
  13. jsp九个内置对象、四个域对象及Servlet的三大域对象
  14. phpStudy2018 在win7下切换php7不成功解决办法
  15. 简单理解Zookeeper的Leader选举【转】
  16. redhat 5.6安装wireshark
  17. 冲刺博客NO.4
  18. Daily Scrum (2015/11/3)
  19. centos 6.5 双网卡 上网 virtualbox nat hostonly
  20. .NET 使用 XPath 来读写 XML 文件

热门文章

  1. Python开发基础-Day2-流程控制、数字和字符串处理
  2. Python的zip函数(转)
  3. [BZOJ3566][SHOI2014]概率充电器(概率DP)
  4. 【点分治】【FFT】Gym - 101234D - Forest Game
  5. getDimension,getDimensionPixelOffset和getDimensionPixelSize
  6. MATLAB/Octave warning: mx_el_eq: automatic broadcasting operation applied 错误分析
  7. <摘录>算法策略的总结
  8. vs code 使用Git进行源代码管理
  9. js禁止复制粘贴
  10. appium+python自动化44-appium命令行模式