由于需要在半结构化的文本数据中提取一些特定格式的字段、数据辅助挖掘分析工作,以往都是使用Matlab工具进行结构化数据处理的建模,matlab擅长矩阵处理、结构化数据的计算,Python具有与matlab共同的特点:语法简洁、库丰富,对算法仿真来说都是一门简洁易用的语言。

Python做字符串匹配相对来说上手比较容易,且具有成熟的字符串处理库re供我们使用;

在re库的帮助下,只需简单的两步就可完成匹配工作,对做数据分析/算法的工作者来说,轻松了许多:

step1:构建正则表达式模式,并使用compile()函数生产正则表达式对象

step2:调用step1生成的正在表达式对象的方法、属性,返回匹配结果

<span style="color:#333300;"># 导入正则表达式匹配模块 Py 3.0
import re
text = "today is 01/04/2015, happy new year..." #建立日期的正则表达式
detepat = re.compile('(\d+)/(\d+)/(\d+)') #进行匹配并打印结果
result = detepat.finditer(text)
for m in result:
print(m.group())</span>

记录一下,下次用到直接翻出来就好了~

最新文章

  1. C语言程序设计进阶 第1周编程题
  2. Java基础之OOP
  3. Html之初体验
  4. hdu----(4545)魔法串(LCS)
  5. SPOJ MULTQ3 7299 Multiples of 3 (区间更新)
  6. Windows Embedded Compact 2013升级:VS2013也能编译
  7. centos中的配置文件
  8. XML.ObjTree -- XML source code from/to JavaScript object like E4X
  9. java(jdk1.7) IO系列01之InputStream和OutputStream解析
  10. 看看android基础知识,谁帮我作答
  11. Android Studio使用Lint进行代码检查
  12. 许式伟:我与Go语言的这十年[转]
  13. Hibernate 单向一对多映射
  14. 理解java容器:iterator与collection,容器的起源
  15. 莫烦theano学习自修第三天【共享变量】
  16. cocoapod Podfile use frameworks swift/oc混编 could not build module xxx
  17. springboot学习笔记-6 springboot整合RabbitMQ
  18. [转]USB之Part 4 - Protocol
  19. findHomography和perspectiveTransform
  20. dpkg使用记录

热门文章

  1. python中int的功能简单介绍
  2. jQuery简单笔记
  3. MyBatis 传入参数之parameterType
  4. JButton
  5. angular 路由的引用
  6. vue移动端组件库vux使用小记
  7. jmeter录制APP时不能登录的问题
  8. Eclipse创建Maven工程
  9. Laravel-admin 使用Layer相册功能
  10. go优化