jsop解析获得htmldome
package com.open1111.jsoup;
import org.apache.http.HttpEntity;
import org.apache.http.client.methods.CloseableHttpResponse;
import org.apache.http.client.methods.HttpGet;
import org.apache.http.impl.client.CloseableHttpClient;
import org.apache.http.impl.client.HttpClients;
import org.apache.http.util.EntityUtils;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class Demo01 {//jsopdemo
public static void main(String[] args) throws Exception{
CloseableHttpClient httpclient = HttpClients.createDefault(); // 创建httpClient实例
HttpGet httpget = new HttpGet("http://www.cnblogs.com/"); // 创建httpGet实例
CloseableHttpResponse response = httpclient.execute(httpget); // 创建httpresponse实例并用来就收httpClient实例执行get请求返回值
HttpEntity entity=response.getEntity(); // 从response中获得实体类
String content=EntityUtils.toString(entity, "utf-8");//entity转换成字符串
response.close(); // 关闭流和释放系统资源
Document doc=Jsoup.parse(content); // 解析网页 得到文档对象
Elements elements=doc.getElementsByTag("title"); // 获取tag是title的所有DOM元素
Element element=elements.get(0); // 获取第1个元素
String title=element.text(); // 返回元素的文本
System.out.println("网页标题是:"+title);
Element element2=doc.getElementById("site_nav_top"); // 获取id=site_nav_top的DOM元素
String navTop=element2.text(); // 返回元素的文本
System.out.println("口号:"+navTop);
}
}
最新文章
- 框架集(Framesets)
- occ 中绘制二维矩形
- DeviceOne 竟然做出来如此复杂的App
- C#学习系列-String与string的区别
- REOBJECT 结构
- Linux power supply class hacking
- HALCON 简介
- .NET客户端下载SQL Server数据库中文件流保存的大电子文件方法(不会报内存溢出异常)
- ASP.NET NuGet to install the mvc 5.2.2
- 编写自己的单点登录(SSO)服务
- S.O.L.I.D五大原则之单一职责SRP
- mongodb一些使用技巧或注意事项记录
- Python 二分查找
- prometheus — nginx-vts-exporter
- Tutorial中的Hello2代码
- [android] 分析setting源代码获取SD卡大小
- Hadoop生态圈-使用FreeIPA安装Kerberos和LDAP
- 对Tomcat部署web应用的方式总结
- 3ds max学习笔记(十二)-- (弯曲:实例旋转楼梯)
- PyQT的安装和配置
热门文章
- javascript 操作符小结
- EIP权限工作流平台总结-2前端框架
- linux添加软件的service start/stop快捷服务(简单版)
- <;富爸爸,穷爸爸>; 书中的好句子
- BZOJ 3211【线段树】
- MCP|XN|Decreased Antibiotic Susceptibility Driven by Global Remodeling of the Klebsiella pneumoniae Proteome(肺炎杆菌通过整体重构蛋白质组降低抗生素敏感性)
- 项目经验:Glyphicons字体图标改造,制造适合自己项目的字体图标
- Chinese Zodiac (水题)
- Linux--1 初识
- Docker从入门到实战(一)