导入相关jar包

package jsoup.zr.com.utils;

import java.io.IOException;
import java.util.List; import org.jsoup.Jsoup;
import org.jsoup.nodes.Attribute;
import org.jsoup.nodes.Attributes;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.nodes.Node; public class TestClass { public static void main(String[] args) {
TestClass.paserHTML("https://www.baidu.com");
}
/**
* 通过URL来解析HTML
* @param url
*/
public static void paserHTML(String url){
Document document = null;
Element body = null;
Element head = null;
String title = null;
String tagName = null;
try {
// 通过URL获取HTML文档
document = Jsoup.connect(url).get();
// 获取body部分
body = document.body();
// 获取head部分
head = document.head(); // 根据标签名找节点
List<Element> links = head.getElementsByTag("link");
for (Element element : links) {
System.out.println(element.tagName()+",");
// 根据key查找相关的属性value
String value = element.attr("rel");
System.out.println("value:"+value); }
// 获取标签名
tagName = head.tagName(); // 获取标题
title = document.title(); // 通过id选择器获取标签
Element element = document.getElementById("head");
// 获取文本内容
String connent = element.text();
System.out.println("id选择器:"+element.tagName()+",内容:"+connent);
} catch (IOException e) {
e.printStackTrace();
}
System.out.println(document);
} }

最新文章

  1. ubuntu下gedit闪退,遇到问题:ERROR:../../gi/pygi-argument.c:1583:_pygi_argument_to_object: code should not be reached 已放弃 (核心已转储)
  2. ResourceManager没启动
  3. css中IE6fix问题
  4. ssh 配置自动登录
  5. Linux/Centos下清理内存和Cache方法
  6. Activator.CreateInstance 方法 (Type) 的用法
  7. BZOJ 3170: [Tjoi 2013]松鼠聚会 切比雪夫距离
  8. TFS2012常见问题及解答
  9. Schtasks 命令详解
  10. _In_ 是什么意思
  11. photoshop中rgb与索引模式的区别
  12. WNDCLASS 窗口类结构
  13. Ocelot中文文档-中间件注入和重写
  14. Visual Studio 使用 Web Deploy 发布远程站点
  15. Android串口屏(电阻,电容触摸),带AV输入,7寸LCD1(800*48...
  16. Java入门系列
  17. JavaScript实现本地图片上传前进行裁剪预览
  18. linux永久配置ip地址
  19. WinForm多线程编程与Control.Invoke的应用浅谈
  20. hdu 1231 最大连续子序列 ,1003 Max Sum;

热门文章

  1. larave 控制器中获取路由参数
  2. WC2019 T1 数树
  3. BZOJ - 2460 :元素 (贪心&amp;线性基)
  4. HihoCoder 1097 kruscal
  5. System.Web.HttpRequestValidationException: 从客户端(dbFlag=&amp;quot;&amp;lt;soap:Envelope xmlns...&amp;quot;)中检测到有潜在危险的 Request.Form 值。
  6. Socket通信简单实例(WCF调用Socket)
  7. LeetCode Design TinyURL
  8. envoy 测试试用
  9. 【android】Socket简单用法
  10. 通过IHttpModule,IHttpHandler扩展IIS