查询数据,从链接地址中爬取文章内容jsoup
2024-08-26 11:50:36
查询数据,从链接地址中爬取文章内容
protected void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {
// TODO Auto-generated method stub
//response.getWriter().append("Served at: ").append(request.getContextPath());
int pageNum=1;
int pageSize=100;
for(pageNum=1;pageNum<101;pageNum++)
{
try {
int page1= (pageNum-1)*pageSize;
Map<Integer,String> map1 = ManageMySQL.getPageData(page1,pageSize);
for(Integer key : map1.keySet())
{
System.out.println(key+" "+map1.get(key));
String context1 = getContentByURL(map1.get(key)).replace(" ", "");
ManageMySQL.updateContext(key, context1);
}
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
} } }
最新文章
- 数百个 HTML5 例子学习 HT 图形组件 – WebGL 3D 篇
- MIT 6.828 JOS学习笔记16. Lab 2.2
- 第三方登录分享功能-ShareSDK for iOS适配问题记录
- UML类图基本元素符号
- C#与数据库访问技术总结(九)之实例
- (DFS)hdoj1198-Farm Irrigation
- PyQt4学习笔记1:PyQt4第一个程序
- 十、mysql事务的简介
- cas4.2以下取消https
- .NET西安社区 [拥抱开源,又见 .NET] 第二次活动简报
- 移动端布局:视口viewport的理解
- perl trick
- 《剑指offer》 二维数组中的查找
- mac下安装nginx及相关配置
- Python笔记初识
- 给Java新手的一些建议&mdash;&mdash;Java知识点归纳(Java基础部分)
- 04-树6. Huffman Codes--优先队列(堆)在哈夫曼树与哈夫曼编码上的应用
- 白盒测试实践项目(day6)
- 51nod 1832 先序遍历与后序遍历【二叉树+高精度】
- 浅谈Uber与滴滴快的提供差异化服务带来的商业模式思考