ASCII / Unicode / UTF-8 / GBK
1 ASCII
ASCII(American Standard Code for Information Interchange,美国标准信息交换代码)是基于拉丁字母的一套电脑编码系统,主要用于显示现代英语和其他西欧语言,其最多只能用 8 位来表示(一个字节),即:2**8 = 256-1,所以,ASCII码最多只能表示 255 个符号。
2 Unicode
Unicode(统一码、万国码、单一码)是计算机科学领域里的一项业界标准,包括字符集、编码方案等。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,以满足跨语言、跨平台进行文本转换、处理的要求。1990年开始研发,1994年正式公布。
Unicode(统一码、万国码、单一码)是一种在计算机上使用的字符编码。Unicode 是为了解决传统的字符编码方案的局限而产生的,它为每种语言中的每个字符设定了统一并且唯一的二进制编码,规定虽有的字符和符号最少由 16 位来表示(2个字节),即:2 **16 = 65536,
注:此处说的的是最少2个字节,可能更多
3 UTF-8
是对Unicode编码的压缩和优化,他不再使用最少使用2个字节,而是将所有的字符和符号进行分类:ascii码中的内容用1个字节保存、欧洲的字符用2个字节保存,东亚的字符用3个字节保存...
4 GBK
GBK全称《汉字内码扩展规范》(GBK即“国标”、“扩展”汉语拼音的第一个字母,英文名称:Chinese Internal Code Specification)
GBK编码,是在GB2312-80标准基础上的内码扩展规范,使用了双字节编码方案,其编码范围从8140至FEFE(剔除xx7F),共23940个码位,共收录了21003个汉字,完全兼容GB2312-80标准,支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字,并包含了BIG5编码中的所有汉字。GBK编码方案于1995年10月制定, 1995年12月正式发布,目前中文版的WIN95、WIN98、WINDOWS NT以及WINDOWS 2000、WINDOWS XP、WIN 7等都支持GBK编码方案。
最新文章
- springMVC基础controller类
- Android使用ViewPager做轮播
- ASP.NET 程序提交表单数据中带有html标签不能提交或者提交报错问题
- cocos2d-x-3.1.1 创建项目
- https封装类,支持get/post请求
- 关于设置SQLPLUS提示符样式的方法----登陆配置文件,动态加载提示符
- hdoj-2031
- JavaWeb应用中重定向与跳转的区别
- Trie 字典树
- 正则表达式与领域特定语言(DSL)
- luogu【P1144】最短路计数
- JAVA_SE基础——5.第一个Java程序HelloWorld&注释的应用
- canvas-6font.html
- javascript NaN注意事项
- P4091 [HEOI2016/TJOI2016]求和
- 绩效沟通-BEST原则
- Java中Map根据键值(key)或者值(value)进行排序实现
- js判断pc端和移动端的方法
- 对Servlet请求或响应进行JMockit测试
- HDU 4717 The Moving Points(三分法)(2013 ACM/ICPC Asia Regional Online ―― Warmup2)