python 文本或句子切割,并保留分隔符
2024-09-13 23:06:18
网上找了好久,都没有理想的解决方法。主要思想,利用正则表达式re.split() 分割,同时利用re.findall() 查找分隔符,而后将二者链接即可。
# coding: utf- import sys
reload(sys)
sys.setdefaultencoding("utf-8") import re def my_split(str,sep=u"要求\d+|岗位\S+"): # 分隔符可为多样的正则表达式
wlist = re.split(sep,str)
sepword = re.findall(sep,str)
sepword.insert(0," ") # 开头(或末尾)插入一个空字符串,以保持长度和切割成分相同
wlist = [ x+y for x,y in zip(wlist,sepword) ] # 顺序可根据需求调换
return wlist if __name__ == "__main__":
inputstr = "岗位:学生: \n要求1.必须好好学习。\n要求2.必须踏实努力。\n要求3.必须求实上进。"
res = my_split(inputstr)
print '\n'.join(res)
最新文章
- Nginx服务器之 Nginx的基本配置
- backup mysql
- Redis+Spring缓存实例
- win10如何让她闭嘴、按什麽建系统都要说话、如何让她闭嘴?
- Sprint会议-初步组织划分
- 如何导入ShareSDK的sample
- MHz 和 Mbps的区别
- ISO和UDF光盘格式、扩展ISO9660----Joliet和Romeo文件系统
- Junit 测试常见错误
- 查看apk包及Activity名方法
- 网站优化之Apache2.4GZIP功能
- unity 常用插件 2
- Android 菊花加载工具类
- C#图像检测开源项目
- 树莓派 3b 串口启用
- UFLDL学习笔记 ---- 主成分分析与白化
- Codeforces Round #257 (Div. 2 ) B. Jzzhu and Sequences
- [Backbone]4. Model &; View, toggle between Model and View. -- 1
- php CI框架输出空行问题排查
- ubuntu13.04更新源