3.python正则匹配不到内容时消耗大量内存
2024-08-25 02:30:42
遇到问题:正常情况获取的网页源码可以通过正则表达式快速匹配到内容,,但是如果出现问题,没有匹配到的内容,正则就会一直回溯,导致内存激增,一直循坏查找。
解决思路: 一、如果能够有特殊内容可以标记,满足标记再正则,不匹配则不正则,避免一直回溯
二、可以设置timeout的函数,如果运行超过多少时间则强制结束(下面给出了示例)
用threading.Timer的方法,通过start-》sleep-》cancel的形式,实现强制结束函数的调用
import threading
import time def fun_timer():
print('hello timer')
global timer
#重复构造定时器
timer = threading.Timer(5.8,fun_timer)
timer.start()
#定时调度
timer = threading.Timer(2,fun_timer)
timer.start() # 50秒后停止定时器
time.sleep(50)
timer.cancel()
参考文章:https://blog.csdn.net/lxcnn/article/details/4756030
参考文章:https://blog.csdn.net/Homewm/article/details/92127567 (处理函数超时的三种方式)
最新文章
- Python:list用法
- Java数据结构——用双端链表实现队列
- css 之盒子模型
- Linux防火墙规则的查看、添加、删除和修改
- (转载)CentOS6下 源代码方式安装openERP7.0
- UVa OJ 10055
- 1101. Quick Sort (25)
- 基于WebForm+EasyUI的业务管理系统形成之旅 -- 系统设置(Ⅰ)
- Miller_Rabin素数判断,rho
- pureMVC简单示例及其原理讲解一(开篇)
- Jena将owl文件持久化到数据库中
- Data Base mongodb高版本与低版本的区别
- 第2次作业:stream案例分析
- JsonCPP库使用
- HTML5之webSocket使用
- Linux下搜狗输入法和快捷键Ctrl+Space冲突的解决
- windos上安装jenkins部署springboot的jar包(未运行,只是在打包并上传linux成功了)
- Android集成人脸识别demo分享
- Selenium 查找节点
- sql 判断 数据库 表 字段 是否存在