【转】GB2312、GBK和UTF-8三种编码的简要说明
2024-09-15 07:51:23
原文地址:http://www.cnblogs.com/hust-yingjie/p/5481966.html
GB2312、GBK和UTF-8都是一种字符编码,除此之外,还有好多字符编码。只是对于我们中国人的应用来说,用这三种编码 比较多。简单的说一下,为什么要用编码,在计算机内,储存文本信息用ASCII码,每一个字符对应着唯一的ASCII码。最初计算机是由美国发明的,他们用的是英文字符使用ASCII很好表示。但我们中国的汉字编码就稍有不同,但原理相同,即都要求每个字符要唯一对应一个标识码,因此国家制定了汉字的字符编码标准:GB2312、GBK等。GB就是国标的意思,GB2312和GBK主要用于汉字的编码,GB2312是中国规定的汉字编码,也可以说是简体中文的字符集编码,GBK 是 GB2312的扩展 ,除了兼容GB2312外,它还能显示繁体中文,还有日文的假名。而UTF-8是全世界通用的。意思就是说,如果你的应用主要面对使用汉语的中国人的话,使用GB2312和GBK非常好,文字储存体积要小,有一些优点。如果你的应用是面向世界的,你再用GB2312和GBK作为应用的编码,在外国有些电脑的浏览器上很有可能就没有这种编码,那么你应用上的汉字就会变成无法识别的乱码。其他国家语言也有其对应的编码标准。
最新文章
- 异步与并行~ReaderWriterLockSlim实现的共享锁和互斥锁
- hibernate入门实例
- Only one statement is allowed per batch. A batch separator, such as 'GO', might be required between statements.
- xml文件的读写操作
- FZU2219 StarCraft(哈夫曼树)
- android genymation eclipse安装
- applicationContext.xml存放的位置
- 在SQL Server实现最短路径的搜索
- GCC优化选项-fomit-frame-pointer对于esp和ebp优化的作用
- 数学概念——E 期望(经典问题)
- JDBC 之 事务
- HTTP请求的TCP瓶颈分析[转]
- Reorder List [leetcode] 这两种思路
- xlrd(开excel表格)
- ipset和iptables配合来自动封闭和解封有问题的IP
- 新疆大学ACM-ICPC程序设计竞赛五月月赛(同步赛) H	XOR
- net core体系-web应用程序-4asp.net core2.0 项目实战(1)-6项目缓冲方案
- 概率图模型 基于R语言 这本书中的第一个R语言程序
- vs2015 加载项目的时启动:无法启动 IIS Express Web 服务器
- VS2015 调试中断点突然失效的解决办法、VS调试时关闭调试让浏览器继续保留页面