【爬虫】beautiful soup笔记(待填坑)
2024-08-26 06:49:58
Beautiful Soup是一个第三方的网页解析的模块。其遵循的接口为Document Tree,将网页解析成为一个树形结构。
其使用步骤如下:
1、创建对象:根据网页的文档字符串
2、搜索节点:名称、属性、文字。
3、处理节点:
BeautifulSoup(文档字符串, 'html.parser' 解析器,from_encoding='utf8')
find_all(名称,属性,文字):可以传入字符串 也可以传入正则表达式。
node.name 名称
node['href'] 属性
node.get_text 文字
最新文章
- Xubuntu VNC Xfce4
- Linux终端下安装jdk
- hadoop2.6---常用命令
- linux 多个python版本的切换
- ios category,protocol理解
- android下面的文案重用
- QT中.pro文件的写法
- iOS开展-Xcode技巧总结(持续更新)
- 于ubuntu配置hadoop当问题
- 【Android Developers Training】 24. 保存键值对
- 85、flask之wtforms
- javaScript判断手机型号
- 用UE4蓝图制作FPS_零基础学虚幻4第二季
- Kmeanns图片压缩
- 王垠的40行代码,究竟diao在哪里
- ZenMap扫描笔记
- CSS【04】:CSS组合选择器
- node.js中path路径模块的使用
- hdoj:2037
- for语句查看js对象
热门文章
- 关于shared pool的深入探讨(五)
- jmeter 非GUI模式下测试报错An error occurred: Unknown arg:
- Delphi 正则表达式语法(5): 边界
- 12 Spring框架 SpringDAO的事务管理
- form:checkboxes radiobutton select用法
- PAT 天梯赛 L1-047. 装睡 【水】
- PAT 天梯赛 L1-045. 宇宙无敌大招呼 【水】
- Windows10安装mysql数据库
- React Native集成Redux框架讲解与应用
- react native 之异步请求