python爬虫常用的库
2024-10-07 04:03:15
1,请求:requests
requests.get(url, headers)
requests.post(url, data=data, files=files)
urllib模块:
Python2
import urllib2
response = urllib2.urlopen('http://www.baidu.com');
Python3
import urllib.request
response =urllib.request.urlopen('http://www.baidu.com');
2,解析:
lxml (解析网页)
from lxml import etree
# 获取请求网页数据
html = etree.HTML(text)
3,存储:
mongodb数据库
mysql数据库
redis数据库
4,工具:
selenium自动化工具
5,框架:
scrapy和scrapy-redis
最新文章
- java中易错点(一)
- x64内联汇编注意点
- 读“日请求亿级的QQ会员AMS平台PHP7升级实践”博客心得笔记
- CF 66D. Petya and His Friends
- 如何根据IP查找计算机名
- Object.assign()
- Java中的try catch finaly先后调用顺序
- Java进阶(三十八)快速排序
- pip 升级
- Mysql linux -N命令
- linux 读取物理寄存器
- phpstorm psr2样式.xml
- rook issues
- Building microservices with ASP.NET Core (without MVC)(转)
- pycharm Tab键设置成4个空格
- STM32 PWM的输出与Keil软件仿真
- addEventListener、onclick和jquery的bind()、click()
- Treflection06_调用静态方法
- Atcoder Grand Contest 032C(欧拉回路,DFS判环)
- DetachedCriteria用法
热门文章
- 第五章Java
- nicstat命令安装与分析
- 使用jvisualvm远程监控tomcat(阿里云ECS)
- Puppet部署:安装puppet server、client
- C# JSON的序列化与反序列化
- BZOJ 4668: 冷战 并查集启发式合并/LCT
- Linux命令-磁盘管理(二)
- source和resource的区别
- [pytorch笔记] torch.nn vs torch.nn.functional; model.eval() vs torch.no_grad(); nn.Sequential() vs nn.moduleList
- JavaScript实现页面滚动到div区域div以动画方式出现