urllib包包含4个模块,在python3里urllib导入要用包名加模块名的方式。

1.urllib.request

该模块主要用于打开HTTP协议的URL

import urllib.request

抓取某个网址的所有HTML代码,返回一个request对象。(网址要带上协议)

urlobject=urllib.request.urlopen('http://www.baidu.com')

用对象的read方法

print (urlobject.read(10))#打印出前10个字符,游标向后移动10位。如果read方法里不写数字默认打印出全部代码

返回字节型数据

>>> type(urlobject.read(10))
<class 'bytes'>
>>> print (urlobject.read(10))
b'<!DOCTYPE '
>>> print (urlobject.read(15))
b'html>\n<!--STATU'
>>> print (urlobject.read(15))
b'S OK-->\n\r\n\r\n\r\n\r'
>>>

执行了三次观察了下,都已字母b开头加一个字符串,字符串里面的字符串就是read括号里的数量,\n 或 \r 占一个字符

2.urllib.parse

3.urllib.error

4.urllib.robotparser

最新文章

  1. jq中数组应用的错误
  2. centos7使用传统网卡名
  3. Objective-C中@property的所有属性详解
  4. 连接oracle jdbc
  5. 在A*寻路中使用二叉堆
  6. 网站性能评分工具Yslow 使用教程
  7. RocEDU.阅读.写作
  8. python设计模式之装饰器模式
  9. 5.4.2 RegExp实例方法
  10. 动态接口服务 webservice
  11. Rotate Array leetcode
  12. 关于DB2版本、补丁升级和回退的总结[转载]
  13. Navicat for MySQL11--使用经验
  14. vxWorks内核实现基本原理
  15. IntelliJ IDEA 创建 Maven简单项目
  16. Centos给文件设置了777权限仍不能访问解决方案
  17. 南邮攻防训练平台逆向maze
  18. 中触发一个断点 其原因可能是堆被损坏,这说明 ***.exe 中或它所加载的任何 DLL 中有 Bug
  19. python——数字问题之_ 变量
  20. ubuntu 安装 mysql 的正确姿势

热门文章

  1. redhat7.3建两个网桥导致mac地址不一致解决办法
  2. 使用Xcode连接开源中国
  3. vue input 判断
  4. Linux基础学习-基本命令
  5. Django模板语言中的自定义方法filter过滤器实现web网页的瀑布流
  6. Python基础数据类型之集合
  7. 论文《Piexel Recurrent Nerual Network》总结
  8. lamp环境配置,ubunutu下
  9. 九度oj 题目1160:放苹果
  10. 九度oj 题目1130:日志排序