字王·国标二级字库汉字GB内码un码三合一对照表2016版
国标二级字库汉字GB内码un码三合一对照表
字王2016版
汉字内码表,是制作字库的基础,简单、便利的版本很少,根据实战经验,特此制作这个三合一版本的汉字、GB内码、Unicode码对照表:
l 提供GB内码、Unicode内码两种不同格式的版本。
l 格式如下:汉字,GB内码、Unicode-16内码;中间用英文逗号符分隔,
l 每行最后的逗号符,并非多于,便于编程、批命令需要,特别是python的list列表导入。
l 国标一二级字库,源自1980年颁布的《信息交换用汉字编码字符集--基本集》,国家标准号为:GB2312-80.
l 国标一级字库3755字,是常用汉字,按拼音排序;二级字库3008字,是非常用汉字,按部首和笔画排序。
l 1975年,根据涵盖数亿、专业汉字频度统计,实际使用汉字数为6335个,其中3000多个汉字累计频度为了99.9%,另外3000多个累计频度不到0.1%,说明了常用汉字与次常用汉字的数量不足7000个,这就为国家制定汉字库标准提供了依据。
l 截图、内码查看,使用的是软件:ultraEdit
字王国标三合一内码对照表,共收录了以下四个内码表格文件:
n 文件:gb7652_un内码版.txt,unicode内码版本,字王增强型汉字内码表,共7652个字符,除国标二级汉字外,还收录了全角/半角英文字母、数字,以及日文、制表符、常用标点符号,和部分增补汉字。
n 文件:gb7652_gb内码版.txt,除内码是GB格式外,内容同上。
n 文件:gb6763k_un内码版.txt,纯国标汉字内码表,共6763个汉字,unicode内码版本。
n 文件:gb6763k_gb内码版.txtt,除内码是GB格式外,内容同上。
【GB内码版本】截图
【Unicode内码版本】截图
注意
l unicode文件,开头两个字符内码是:FF FE,这是unicode文件的识别符号,不是正文
l Unicode内码顺序是反的,截图汉字“啊”的内码是:554A ,在截图中显示的是:4A 55
字王·中国
l 技术Blog:http://blog.sina.com.cn/zbrow
l 网盘下载:http://pan.baidu.com/s/1tY7Wq
l QQ群:124134140 (字王云字库&zwPython,字王项目,唯一互动平台)
l 字王Git项目总览:https://github.com/ziwang-com/,
最新文章
- AP创建会计科目
- Ubuntu 14 Chrome字体设置备份
- Filestream(读写)
- ERP系统实施与企业内部控制管理实践
- 80X86保护模式及其编程(一)
- c# 重载运算符(+-|&;)和扩展方法
- Mac终端编译运行C++
- 【转】android 安卓APP获取手机设备信息和手机号码的代码示例
- Druid :大数据实时处理的开源分布式系统(1)
- DM6437 C64X+ EDMA 疑惑总结记录
- Middleware开发入门
- java中的方法引用(method reference)官方文档总结
- Hibernate Session对象核心方法
- CodeSampler DX9 Full-screen initialization
- php获取ip地址所在的地理位置的实现
- 树莓派 CSI摄像头 No data received from sensor. Check all connections, including the Sunny one on the camera board
- 转: python requests的安装与简单运用
- 二级缓存EhCache在几种应用技术的配置方法和步骤总结
- ASP.NET Core CMS管理后台
- httpclient 多线程请求
热门文章
- Android中的动画,选择器,样式和主题的使用
- tableView删除功能小记
- linux 允许mysql用户远程访问
- Excel 中如何快速统计一列中相同字符的个数(函数法)
- SimpleDateFormat使用详解 <;转>;
- 代码片段,lucene基本操作(基于lucene4.10.2)
- Ajax 完整教程(转载)
- sqlserver字符串多行合并为一行
- 配置oem
- &#39;module&#39; object has no attribute &#39;select&#39;