1.puts /[一-龥]+/.match("this is 中文")                 =>中文

2.str2="123中文"
puts /\p{Han}+/u.match(str2)

文本编码格式:utf-8

文件第一行:#encoding:utf-8

require "rubygems"
require "iconv"
print Iconv.iconv("GBK","UTF-8",/\p{Han}+/u.match("tiantianxin你好angshang天天向上")[0])       =>你好

Ruby 和部分语言可以直接 #{Han} 等方式匹配特定的语言,但是对于某些语言,如 JavaScript,是不可能如此简便的

还有常用的:

  • /\p{Word}+/u 不限于 a-z0-9 的成词字符(就是非标点制表符空格等杂类的字符)
  • /\p{Hiragana,Katakana}+/u 匹配平假名+片假名

适用于中韩日的正则表达式,参考:http://chrisyip.im/post/regular-expression-for-cjk/

学习参考:http://ruby-china.org/topics/5680

最新文章

  1. MapReduce 的架构
  2. plupload 如何控制最小宽度和文件类型及跨域
  3. Apache_proxy负载均衡和Session复制
  4. Java学习日记之 Java-其他类型
  5. javascript编程: JSON, Mapping, 回调
  6. 解决修改密码报错‘passwd:Authentication token’
  7. 项目前端技术-learn
  8. XML文件注意问题
  9. Cisco密码恢复
  10. 关于如何实现程序一天只启动一次的想法(C++实现)
  11. 开源论坛jforum的集成
  12. bios和dos中断
  13. 移动web页面支持弹性滚动的3个方案
  14. Mac之OS系统下搭建JavaEE环境 <三> 之Eclipse 与 IntelliJ IDEA 的安装配置
  15. DDD实战进阶第一波(八):开发一般业务的大健康行业直销系统(业务逻辑条件判断最佳实践)
  16. Windows 2003 Server 标准版启动问题解决(资源转贴)
  17. Vue-admin工作整理(八): BUS | | 组件通信
  18. Retrofit提交Json
  19. js -- 绑定的click addEventListener 事件只触发一次
  20. 16.纯 CSS 创作一个渐变色动画边框

热门文章

  1. forEach、for in 和for of的区别
  2. MongoDB4.0.0的安装配置—windows
  3. Sleep 比对 (Win32API 与 STL )
  4. 面向对象(this关键字)
  5. 表单enctype属性
  6. Robot FrameWork基础学习(四) 元素定位
  7. wxGlade的图标,原来是来自蒙德里安的名画!
  8. eclipse里的Maven插件安装
  9. Laravel框架的一些配置
  10. 使用MeshLab的技巧总结(自己原创总结)