UTF-8 GBK GB2312
2024-10-15 08:45:41
至于UTF-8编码则是用以解决国际上字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24位(三个字节)来编码。对于英文字符较多的论坛则用UTF-8节省空间。 GBK包含全部中文字符;UTF-8则包含全世界所有国家需要用到的字符。 GBK是在国家标准GB2312基础上扩容后兼容GB2312的标准(好像还不是国家标准)
UTF-8编码的文字可以在各国各种支持UTF8字符集的浏览器上显示。
比如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,而无需他们下载IE的中文语言支持包。 所以,对于英文比较多的论坛 ,使用GBK则每个字符占用2个字节,而使用UTF-8英文却只占一个字节。 UTF8是国际编码,它的通用性比较好,外国人也可以浏览论坛,GBK是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBK大~字符的一种多字节编码,它对英文使用8位(即一个字节),中文使用24为(三个字节)来编码。UTF-8包含全世界所有国家需要用到的字符,是国际编码,通用性强。UTF-8编码的文字可以在各国支持UTF8字符集的浏览器上显示。如,如果是UTF8编码,则在外国人的英文IE上也能显示中文,他们无需下载IE的中文语言支持包。 GBK是国家标准GB2312基础上扩容后兼容GB2312的标准。GBK的文字编码是用双字节来表示的,即不论中、英文字符均使用双字节来表示,为了区分中文,将其最高位都设定成1。GBK包含全部中文字符,是国家编码,通用性比UTF8差,不过UTF8占用的数据库比GBD大。 GBK、GB2312等与UTF8之间都必须通过Unicode编码才能相互转换: GBK、GB2312--Unicode--UTF8 UTF8--Unicode--GBK、GB2312 对于一个网站、论坛来说,如果英文字符较多,则建议使用UTF-8节省空间。不过现在很多论坛的插件一般只支持GBK。 GB2312是GBK的子集,GBK是GB18030的子集
GBK是包括中日韩字符的大字符集合
如果是中文的网站 推荐GB2312 GBK有时还是有点问题
为了避免所有乱码问题,应该采用UTF-8,将来要支持国际化也非常方便
UTF-8可以看作是大字符集,它包含了大部分文字的编码。
使用UTF-8的一个好处是其他地区的用户(如香港台湾)无需安装简体中文支持就能正常观看你的文字而不会出现乱码。
最新文章
- TextView中的部分文字响应点击事件
- [转]IPython Notebook简介1
- iOS端项目注释规范附统一代码块
- Core Web API上使用Swagger提供API文档
- [LeetCode] Implement strStr()
- innosetup安装之前关闭进程
- serv-u and hway3.0
- 图书馆管理系统SRS
- Hibernae 的延迟加载
- android学习日记09--BitMap操作
- NetworkOnMainThreadException
- linux 路由表设置 之 route 指令详解
- zookeeper leader作用
- 标签<;a>;的注意事项1
- Asp.net Core 入门实战
- Ubuntu 16.04安装Matlab 2016b教程
- python学习之类的反射
- dense prediction问题
- Io流的使用
- Js_cookie保存登录名
热门文章
- M2postmortem
- 12.15 Daily Scrum
- ";Linux内核分析";第七周
- Linux实践一:问题及解决
- [buaa-SE-2017]个人项目
- (html4与html5分别实现)用一个表单向php界面提交不同的命令
- Intel处理器缺货将会持续到2019年第二季度!
- BZOJ2557[Poi2011]Programming Contest——匈牙利算法+模拟费用流
- BZOJ3724 PA2014Final Krolestwo(欧拉回路+构造)
- BZOJ5252 八省联考2018林克卡特树(动态规划+wqs二分)