go语言解析网页利器goquery使用教程(爬虫必备)
2024-08-29 22:50:43
某些时候需要爬取网页中指定信息时,通常需要一些框架解析网页行成dom模型,然后来操作节点来获取相应的信息。在java中很显然就是Jsoup,而在Golang里,应该就是这个goquery了吧。
goquery github地址 https://github.com/PuerkitoBio/goquery
安装
由于它依赖 Go语言的 net/html 包以及css选择库 cascadia, 因此我们要先手动安装net/html包,后者不需要我们手动安装。
运行
go get https://github.com/PuerkitoBio/goquery
之后可能会出现golang.org\x失败相关的,那里是由于被墙了导致(好像又不是o_o ....),那里自己百度下吧,具体错误我当时也没记录( ̄、 ̄)
然后应该就可以使用goquery包了
使用
语法相关这里就不过分说明,直接上用法吧(●'◡'●)
首先导入该包
import "github.com/PuerkitoBio/goquery"
加载页面
就用官方的例子吧,我比较懒
最新文章
- 利用HttpWebRequest实现实体对象的上传
- android标题栏上面弹出提示框(二) PopupWindow实现,带动画效果
- HDU1016 dfs
- Java语法结构
- 【转】Java中只有按值传递,没有按引用传递!
- Jakarta-Commons- BeanUtils学习笔记:
- 转:理解Java泛型
- css3表格隔行变色和表格选中变颜色代码
- eclipse 使用maven 创建纯spring mvc项目
- springJdbc like模糊查询,Spring namedParameterJdbcTemplate like查询
- Markdown例子
- 当git上文件名大小写重命名的修改时(git大小写敏感/默认不敏感),如何重命名并提交
- Ajax 异步请求返回集合遍历问题
- HDU1203(01背包)
- 基于Map的简易记忆化缓存
- iPhone上将短信内容发送到指定邮箱的方法
- ef 通用类
- linux 获取时间后--自定义时间格式
- 用 Java 实现一个插入排序算法
- linux 挂载硬件设备