Beautiful Soup是一个第三方的网页解析的模块。其遵循的接口为Document Tree,将网页解析成为一个树形结构。

其使用步骤如下:

1、创建对象:根据网页的文档字符串

2、搜索节点:名称、属性、文字。

3、处理节点:

BeautifulSoup(文档字符串, 'html.parser' 解析器,from_encoding='utf8')

find_all(名称,属性,文字):可以传入字符串 也可以传入正则表达式。

node.name 名称

node['href'] 属性

node.get_text 文字

最新文章

  1. Xubuntu VNC Xfce4
  2. Linux终端下安装jdk
  3. hadoop2.6---常用命令
  4. linux 多个python版本的切换
  5. ios category,protocol理解
  6. android下面的文案重用
  7. QT中.pro文件的写法
  8. iOS开展-Xcode技巧总结(持续更新)
  9. 于ubuntu配置hadoop当问题
  10. 【Android Developers Training】 24. 保存键值对
  11. 85、flask之wtforms
  12. javaScript判断手机型号
  13. 用UE4蓝图制作FPS_零基础学虚幻4第二季
  14. Kmeanns图片压缩
  15. 王垠的40行代码,究竟diao在哪里
  16. ZenMap扫描笔记
  17. CSS【04】:CSS组合选择器
  18. node.js中path路径模块的使用
  19. hdoj:2037
  20. for语句查看js对象

热门文章

  1. 关于shared pool的深入探讨(五)
  2. jmeter 非GUI模式下测试报错An error occurred: Unknown arg:
  3. Delphi 正则表达式语法(5): 边界
  4. 12 Spring框架 SpringDAO的事务管理
  5. form:checkboxes radiobutton select用法
  6. PAT 天梯赛 L1-047. 装睡 【水】
  7. PAT 天梯赛 L1-045. 宇宙无敌大招呼 【水】
  8. Windows10安装mysql数据库
  9. React Native集成Redux框架讲解与应用
  10. react native 之异步请求