(25)python urllib库
2024-10-20 03:25:01
urllib包包含4个模块,在python3里urllib导入要用包名加模块名的方式。
1.urllib.request
该模块主要用于打开HTTP协议的URL
import urllib.request
抓取某个网址的所有HTML代码,返回一个request对象。(网址要带上协议)
urlobject=urllib.request.urlopen('http://www.baidu.com')
用对象的read方法
print (urlobject.read(10))#打印出前10个字符,游标向后移动10位。如果read方法里不写数字默认打印出全部代码
返回字节型数据
>>> type(urlobject.read(10))
<class 'bytes'>
>>> print (urlobject.read(10))
b'<!DOCTYPE '
>>> print (urlobject.read(15))
b'html>\n<!--STATU'
>>> print (urlobject.read(15))
b'S OK-->\n\r\n\r\n\r\n\r'
>>>
执行了三次观察了下,都已字母b开头加一个字符串,字符串里面的字符串就是read括号里的数量,\n 或 \r 占一个字符
2.urllib.parse
3.urllib.error
4.urllib.robotparser
最新文章
- jq中数组应用的错误
- centos7使用传统网卡名
- Objective-C中@property的所有属性详解
- 连接oracle jdbc
- 在A*寻路中使用二叉堆
- 网站性能评分工具Yslow 使用教程
- RocEDU.阅读.写作
- python设计模式之装饰器模式
- 5.4.2 RegExp实例方法
- 动态接口服务 webservice
- Rotate Array leetcode
- 关于DB2版本、补丁升级和回退的总结[转载]
- Navicat for MySQL11--使用经验
- vxWorks内核实现基本原理
- IntelliJ IDEA 创建 Maven简单项目
- Centos给文件设置了777权限仍不能访问解决方案
- 南邮攻防训练平台逆向maze
- 中触发一个断点 其原因可能是堆被损坏,这说明 ***.exe 中或它所加载的任何 DLL 中有 Bug
- python——数字问题之_ 变量
- ubuntu 安装 mysql 的正确姿势