ruby 正则表达式 匹配中文
2024-10-20 04:10:31
1.puts /[一-龥]+/.match("this is 中文") =>中文
2.str2="123中文"
puts /\p{Han}+/u.match(str2)
文本编码格式:utf-8
文件第一行:#encoding:utf-8
require "rubygems"
require "iconv"
print Iconv.iconv("GBK","UTF-8",/\p{Han}+/u.match("tiantianxin你好angshang天天向上")[0]) =>你好
Ruby 和部分语言可以直接 #{Han}
等方式匹配特定的语言,但是对于某些语言,如 JavaScript,是不可能如此简便的
还有常用的:
/\p{Word}+/u
不限于 a-z0-9 的成词字符(就是非标点制表符空格等杂类的字符)/\p{Hiragana,Katakana}+/u
匹配平假名+片假名
适用于中韩日的正则表达式,参考:http://chrisyip.im/post/regular-expression-for-cjk/
学习参考:http://ruby-china.org/topics/5680
最新文章
- MapReduce 的架构
- plupload 如何控制最小宽度和文件类型及跨域
- Apache_proxy负载均衡和Session复制
- Java学习日记之 Java-其他类型
- javascript编程: JSON, Mapping, 回调
- 解决修改密码报错‘passwd:Authentication token’
- 项目前端技术-learn
- XML文件注意问题
- Cisco密码恢复
- 关于如何实现程序一天只启动一次的想法(C++实现)
- 开源论坛jforum的集成
- bios和dos中断
- 移动web页面支持弹性滚动的3个方案
- Mac之OS系统下搭建JavaEE环境 <;三>; 之Eclipse 与 IntelliJ IDEA 的安装配置
- DDD实战进阶第一波(八):开发一般业务的大健康行业直销系统(业务逻辑条件判断最佳实践)
- Windows 2003 Server 标准版启动问题解决(资源转贴)
- Vue-admin工作整理(八): BUS | | 组件通信
- Retrofit提交Json
- js -- 绑定的click addEventListener 事件只触发一次
- 16.纯 CSS 创作一个渐变色动画边框