jsoup这个工具用于抓取并解析网页,用起来也比较简单,语法上与Jquery类似,基本写法如下:

File input = new File("/tmp/input.html");
        Document doc = Jsoup.parse(input, "UTF-8", "http://www.oschina.net/");
        Elements links = doc.select("a[href]"); // 链接
        Elements pngs = doc.select("img[src$=.png]"); // 所有 png 的图片
        Element masthead = doc.select("div.masthead").first();// div with class="masthead"
        Elements resultLinks = doc.select("h3.r > a"); // direct a after h3 

最新文章

  1. js正则表达式语法
  2. Mysql无法创建外键的原因
  3. Atian inputmethod 输入法解决方案 方言与多语言多文字支持 英语汉字汉语阿拉伯文的支持 (au
  4. [deviceone开发]-do_QRCode的简单示例
  5. 怎么在eclipse里调试WebDriver的源代码(转)
  6. (转)python文件操作 seek(),tell()
  7. android dialog 原来dialog对话框也有自己的按键监听事件 onKeyDown方法
  8. UILabel自适应高度,自动换行
  9. java命令行执行带依赖jar包的main函数
  10. PHP常用配置
  11. 获取imageView的图和背景图
  12. springboot读取application.properties中自定义配置
  13. css中换行与不换行的样式
  14. 《剑指offer》栈的插入弹出序列
  15. 通过Postman进行post请求时传递X-XSRF-TOKEN
  16. fedora添加ntfs文件系统支持
  17. flume+elasticsearch+kibana遇到的坑
  18. OpenResty最佳实践
  19. 2017-2018-2 20155327『网络对抗技术』Exp5:MSF基础应用
  20. Android Holo Theme的三种表现形式

热门文章

  1. 查找文件并执行的shell命令
  2. Maven开发环境的搭建,含jetty调试[简单明了]
  3. [转]Entity Framework技术导游系列开篇与热身
  4. Winform禁止容器内控件获得焦点时改变容器显示范围坐标
  5. jdk与eclipse版本问题解决applet的启动
  6. Java Servlet(二):servlet配置及生命周期相关(jdk7+tomcat7+eclipse)
  7. asp.net mvc 后台怎么接受前端返回的array list dictionary
  8. Website English Comments
  9. F面经prepare:strstr变种
  10. PHP——生成随机数和日期时间