spider_使用request库进行get传参
2024-10-22 07:28:18
"""
使用requests库 在这里爬取百度搜索的端午节页面(使用request库进行get传参)
"""
import requests
import chardet
url = "https://www.baidu.com/s?"
headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:67.0) Gecko/20100101 Firefox/67.0"}
# 定义参数字典
paramsDict={"wd":"端午节"}
# 返回一个字节数组
bytesHtml= requests.get(url,params=paramsDict,headers=headers).content
print(bytesHtml)
print(type(bytesHtml))
# 判断网页编码,返回一个字典
resEncode=chardet.detect(bytesHtml)
#进行指定编码解码 获得的是一个字符串网页页面
html=bytesHtml.decode(resEncode["encoding"])
print(html)
print(type(html))
最新文章
- PHP form 表单传参明细研究
- .Net相关
- Oracle创建/删除表空间和用户(2014-3-10 记)
- 触动——beyond歌词
- 常用的I/O流类型
- find a filename from a filehandle in Perl
- 编程Tips
- 【转】Markus Persson:Minecraft 游戏背后的奇才
- 错误日志类C#
- Iptabels详解
- 关键部分CCriticalSection使用
- Java内部类的使用小结
- ";!function";,自执行函数表达式
- ASP.NET MVC5 使用MiniProfiler 监控MVC性能
- javaScript笔记详解(1)
- [JavaScript] XMLHttpRequest记录
- 【Runtime Error】打开Matlib7.0运行程序报错的解决办法
- libcurl库的http get和http post使用【转】
- Java 8 – Convert Map to LIST
- STM 软件事务内存——本质是为提高并发,通过事务来管理内存的读写访问以避免锁的使用