编写代码时遇到的问题

  • 写入txt(一开始忘记了tuple类型需要转换为str)
  • 处理逻辑(一开始并没有将 body与url绑定到一起,所以或返回所有的url)
  • 关闭太早(这点是有点疑惑的,难道不用关闭文本么?加了一个f.close就错了)
  • 匹配时忘记了大小写
import requests
from bs4 import BeautifulSoup
import pandas as pd
from openpyxl import Workbook
import concurrent.futures # 读取 .txt 文件中的 URL
with open("urls.txt", "r") as file:
urls = file.read().splitlines() # 存储 URL
data = [] def detect_cvss(url):
try:
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
body = soup.find("body").text
tuple=(url,body)
if "xxxx" not in tuple[1]:
print(tuple[0])
return (tuple[0])
except:
return None with concurrent.futures.ThreadPoolExecutor(max_workers=20) as executor:
futures = [executor.submit(detect_cvss, url) for url in urls] for future in concurrent.futures.as_completed(futures):
result = future.result()
if result:
data.append(result) #将 URL 和 title 写入 txt 文件
with open("no_xxxx.txt", 'w') as f:
for i in data:
f.write(i + '\n')
f.close();

最新文章

  1. java动手动脑和课后实验型问题
  2. UWP的拖拽功能
  3. scala + intellij idea 环境搭建及编译、打包
  4. linux u-boot跟踪方法总结
  5. SQL SERVER 服务启动后停止,某些服务由其它服务或程序使用时将自动停止
  6. linux vmstat 系统结果说明
  7. ImageMagick远程命令执行工具检测工具
  8. bootstrap--双日历插件
  9. Aviary 滤镜 教程 照片编辑器
  10. Java系列--第二篇 基于Maven的Android开发HelloAndroidWorld
  11. JDWP
  12. Chapter 2 Open Book——31
  13. 日志框架SLF4J
  14. UVAlive 3708 Graveyard(最优化问题)
  15. 单选、多选框根据value值设置选中
  16. ACM 排列2
  17. (一)校园信息通微信小程序从前端到后台整和笔记
  18. jar包通过exe4j打包成exe可执行文件
  19. mysql 取名会涉及到关键字 的问题
  20. opencv: 角点检测源码分析;

热门文章

  1. Spring注解篇,学完注解深入了解SpringBoot更容易
  2. Android中drawable和mipmap到底有什么区别
  3. 记一次 .NET某家装ERP系统 内存暴涨分析
  4. H5与原生APP调了交互方式
  5. sys.argv的用法
  6. python编写程序练习-车牌摇号程序
  7. vue模板三目运算判断报错
  8. Gameframework之微信小游戏
  9. VMware-查看虚拟机版本
  10. [Unity]利用Mesh绘制简单的可被遮挡,可以探测的攻击指示器