繁体字通常采用BIG5编码,简体字通常采用GBK或者GB18030编码,这种情况下,直接使用iconv(linux下有对应的命令,也有对应的C API供编程调用)就行。对于默认采用utf-8编码的文件或者繁简体都并存的情况(通常采用utf-8)编码的情况,iconv这种方式就不行了。这里我们可以采用一个调用 opencc 的开源库,来实现UTF-8编码环境下的简体、繁体互转的功能。参照 https://github.com/BYVoid/OpenCC 完成opencc库的安装
     
     下面是自己用C++程序调用相关的API来完成的繁体转简体的功能

//test.cpp

#include <iostream>
#include <opencc/opencc.h> using namespace std; int main ( int argc, char *argv[] )
{
string str= "中華人民共和國反分裂國家法";
//string str= "中华人民共和国反分裂国家法"; //默认的是简体转繁体即OPENCC_DEFAULT_CONFIG_TRAD_TO_SIMP, opencc.h头文件中有详细介绍
opencc_t ot = opencc_open(OPENCC_DEFAULT_CONFIG_TRAD_TO_SIMP); char buffer[512] = {'\0'};
opencc_convert_utf8_to_buffer(ot, str.c_str(), str.size(), buffer);
cout << "result is " << buffer << endl; opencc_close(ot); return 0;
}
编译 g++ test.cpp -o test -lopencc

最新文章

  1. javascript类型系统——正则表达式RegExp类型
  2. Pig 实现关键词匹配
  3. IBatis分页显示
  4. ASP.NET MVC 5 中 使用富文本编辑器 Ueditor
  5. Java基础之在窗口中绘图——移动曲线的控制点(CurveApplet 3 moving the control points)
  6. Hibernate学习(一)
  7. Linux内核如何装载和启动一个可执行程序
  8. python super
  9. 2013年7月底至8月初51Aspx源码发布详情
  10. how to forget about delta cycles for RTL design
  11. effective c++ 条款12 copy all parts of an object
  12. 在Linux安装配置Tomcat 并部署web应用 ( 三种方式 )
  13. 带你领会 线性代数 微积分的本质 3blue1brown 动画效果帅出天际
  14. DOM相关知识
  15. Mobius反演的套路
  16. Android NDK编程
  17. [转]网页实时聊天之js和jQuery实现ajax长轮询 PHP
  18. 2017.12.21-JQuery
  19. LPC-LINK 2
  20. Programming 2D Games 读书笔记(第三章)

热门文章

  1. 对象级别锁 vs 类级别锁 – Java
  2. 字符串数组与字符串之间的互转(join/split)
  3. mybatis介绍与环境搭建
  4. eclipse左侧的导航栏不见了怎么调
  5. AJAX数据请求
  6. Centos 6.x 部署pptp VPN
  7. JanaScript预解析
  8. Postgresql快速写入/读取大量数据(.net)
  9. 阿里云服务器 Windows连接不成功 提示“你的凭证不工作” 解决方法
  10. Postgresql_fqw