补全爬取的url
2024-08-31 03:50:07
有时爬取到的href不全,如href=‘/11031/’
解决方法:
from urllib import parse
url=parse.urljoin(response.url,get_url)
response.url 正在爬取的网页的url
get_url 网页中条目的url
最新文章
- C#基础回顾(二)—页面值传递、重载与重写、类与结构体、装箱与拆箱
- C# 利用反射根据类名创建类的实例对象
- 页面copyright部分始终居于页面底部
- C# ~ NUnit单元测试
- 手工加载DLL
- UML精粹4 - 对象图,包图,部署图,用例
- jquery 获取radio选中的值
- 面向对象之对象,作用域及this
- bootstrap modal动态加载内容
- js 设置回车事件
- HDU4612 Warm up 边双(重边)缩点+树的直径
- PHP持续保有长连接,利用flush持续更新浏览器UI,下载进度条实现
- html响应式布局,css响应式布局,响应式布局入门
- OpenStack网络的前世今生
- 【WPF】如何获取命令行参数
- SSM-SpringMVC-08:SpringMVC中以继承AbstractController的方式实现处理器
- Docker端口映射及创建镜像演示(二)--技术流ken
- Vuex之理解Getters的用法
- python成功之道
- 最小生成树<;lct>;