国标二级字库汉字GB内码un码三合一对照表

字王2016版

汉字内码表,是制作字库的基础,简单、便利的版本很少,根据实战经验,特此制作这个三合一版本的汉字、GB内码、Unicode码对照表:

l 提供GB内码、Unicode内码两种不同格式的版本。

l 格式如下:汉字,GB内码、Unicode-16内码;中间用英文逗号符分隔,

l 每行最后的逗号符,并非多于,便于编程、批命令需要,特别是python的list列表导入。

l 国标一二级字库,源自1980年颁布的《信息交换用汉字编码字符集--基本集》,国家标准号为:GB2312-80.

l 国标一级字库3755字,是常用汉字,按拼音排序;二级字库3008字,是非常用汉字,按部首和笔画排序。

l 1975年,根据涵盖数亿、专业汉字频度统计,实际使用汉字数为6335个,其中3000多个汉字累计频度为了99.9%,另外3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。

l 截图、内码查看,使用的是软件:ultraEdit

字王国标三合一内码对照表,共收录了以下四个内码表格文件:

n 文件:gb7652_un内码版.txt,unicode内码版本,字王增强型汉字内码表,共7652个字符,除国标二级汉字外,还收录了全角/半角英文字母、数字,以及日文、制表符、常用标点符号,和部分增补汉字。

n 文件:gb7652_gb内码版.txt,除内码是GB格式外,内容同上。

n 文件:gb6763k_un内码版.txt,纯国标汉字内码表,共6763个汉字,unicode内码版本。

n 文件:gb6763k_gb内码版.txtt,除内码是GB格式外,内容同上。

【GB内码版本】截图

【Unicode内码版本】截图

注意

l unicode文件,开头两个字符内码是:FF FE,这是unicode文件的识别符号,不是正文

l Unicode内码顺序是反的,截图汉字“啊”的内码是:554A ,在截图中显示的是:4A 55

字王·中国

l  技术Blog:http://blog.sina.com.cn/zbrow

l  网盘下载:http://pan.baidu.com/s/1tY7Wq

l  QQ群:124134140 (字王云字库&zwPython,字王项目,唯一互动平台)

l  字王Git项目总览:https://github.com/ziwang-com/,

最新文章

  1. AP创建会计科目
  2. Ubuntu 14 Chrome字体设置备份
  3. Filestream(读写)
  4. ERP系统实施与企业内部控制管理实践
  5. 80X86保护模式及其编程(一)
  6. c# 重载运算符(+-|&)和扩展方法
  7. Mac终端编译运行C++
  8. 【转】android 安卓APP获取手机设备信息和手机号码的代码示例
  9. Druid :大数据实时处理的开源分布式系统(1)
  10. DM6437 C64X+ EDMA 疑惑总结记录
  11. Middleware开发入门
  12. java中的方法引用(method reference)官方文档总结
  13. Hibernate Session对象核心方法
  14. CodeSampler DX9 Full-screen initialization
  15. php获取ip地址所在的地理位置的实现
  16. 树莓派 CSI摄像头 No data received from sensor. Check all connections, including the Sunny one on the camera board
  17. 转: python requests的安装与简单运用
  18. 二级缓存EhCache在几种应用技术的配置方法和步骤总结
  19. ASP.NET Core CMS管理后台
  20. httpclient 多线程请求

热门文章

  1. Android中的动画,选择器,样式和主题的使用
  2. tableView删除功能小记
  3. linux 允许mysql用户远程访问
  4. Excel 中如何快速统计一列中相同字符的个数(函数法)
  5. SimpleDateFormat使用详解 <转>
  6. 代码片段,lucene基本操作(基于lucene4.10.2)
  7. Ajax 完整教程(转载)
  8. sqlserver字符串多行合并为一行
  9. 配置oem
  10. 'module' object has no attribute 'select'