jsoup 的简单应用
2024-08-25 05:40:16
导入相关jar包
package jsoup.zr.com.utils; import java.io.IOException;
import java.util.List; import org.jsoup.Jsoup;
import org.jsoup.nodes.Attribute;
import org.jsoup.nodes.Attributes;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.nodes.Node; public class TestClass { public static void main(String[] args) {
TestClass.paserHTML("https://www.baidu.com");
}
/**
* 通过URL来解析HTML
* @param url
*/
public static void paserHTML(String url){
Document document = null;
Element body = null;
Element head = null;
String title = null;
String tagName = null;
try {
// 通过URL获取HTML文档
document = Jsoup.connect(url).get();
// 获取body部分
body = document.body();
// 获取head部分
head = document.head(); // 根据标签名找节点
List<Element> links = head.getElementsByTag("link");
for (Element element : links) {
System.out.println(element.tagName()+",");
// 根据key查找相关的属性value
String value = element.attr("rel");
System.out.println("value:"+value); }
// 获取标签名
tagName = head.tagName(); // 获取标题
title = document.title(); // 通过id选择器获取标签
Element element = document.getElementById("head");
// 获取文本内容
String connent = element.text();
System.out.println("id选择器:"+element.tagName()+",内容:"+connent);
} catch (IOException e) {
e.printStackTrace();
}
System.out.println(document);
} }
最新文章
- ubuntu下gedit闪退,遇到问题:ERROR:../../gi/pygi-argument.c:1583:_pygi_argument_to_object: code should not be reached 已放弃 (核心已转储)
- ResourceManager没启动
- css中IE6fix问题
- ssh 配置自动登录
- Linux/Centos下清理内存和Cache方法
- Activator.CreateInstance 方法 (Type) 的用法
- BZOJ 3170: [Tjoi 2013]松鼠聚会 切比雪夫距离
- TFS2012常见问题及解答
- Schtasks 命令详解
- _In_ 是什么意思
- photoshop中rgb与索引模式的区别
- WNDCLASS 窗口类结构
- Ocelot中文文档-中间件注入和重写
- Visual Studio 使用 Web Deploy 发布远程站点
- Android串口屏(电阻,电容触摸),带AV输入,7寸LCD1(800*48...
- Java入门系列
- JavaScript实现本地图片上传前进行裁剪预览
- linux永久配置ip地址
- WinForm多线程编程与Control.Invoke的应用浅谈
- hdu 1231 最大连续子序列 ,1003 Max Sum;
热门文章
- larave 控制器中获取路由参数
- WC2019 T1 数树
- BZOJ - 2460 :元素 (贪心&;线性基)
- HihoCoder 1097 kruscal
- System.Web.HttpRequestValidationException: 从客户端(dbFlag=&;quot;&;lt;soap:Envelope xmlns...&;quot;)中检测到有潜在危险的 Request.Form 值。
- Socket通信简单实例(WCF调用Socket)
- LeetCode Design TinyURL
- envoy 测试试用
- 【android】Socket简单用法
- 通过IHttpModule,IHttpHandler扩展IIS