@Test
public void test4() throws IOException {
for (int i = 65; i <= 90; i++) {
String value = String.valueOf((char) i); FileUtil.mkdir("e://pinpai//" + value); System.out.println("***********************" + value);
String url = "https://www.autohome.com.cn/grade/carhtml/" + value + ".html";
Document document = Jsoup.parse(new URL(url), 300000);
document.getElementsByTag("dl").stream().forEach(element -> {
String imgUrl = "https:" + element.getElementsByTag("dt").get(0).getElementsByTag("img").get(0).attr("src");
String mainBrand = element.getElementsByTag("dt").get(0).getElementsByTag("a").get(1).text(); //图片LOG
System.out.println(imgUrl);
//System.out.println(HttpUtil.downloadFile(imgUrl, FileUtil.file("e://pinpai//" + value)));
//主品牌
System.out.println(mainBrand);
//子品牌
element.getElementsByTag("dd").get(0).getElementsByClass("h3-tit").tagName("a").stream().forEach(element1 -> {
System.out.println(element1.text());
//车系
List<String> seriesBrand = element1.nextElementSibling().getElementsByTag("h4").stream().map(Element::text).collect(Collectors.toList());
System.out.println(); //vehicleBrandService.save(VehicleBrand.builder().flag(value).logoBrand(imgUrl).mainBrand(mainBrand).subBrands(element1.text()).seriesBrand(JSON.toJSONString(seriesBrand)).build());
});
System.out.println("-----------");
});
}
}

最新文章

  1. IO流-----写到输出流
  2. 认识VTK工作原理
  3. swift_枚举 | 可为空类型 | 枚举关联值 | 枚举递归 | 树的概念
  4. 一道Integer面试题引发的对Integer的探究
  5. Python学习之路
  6. BZOJ 1087状态压缩DP
  7. [C++程序设计]返回指针值的函数
  8. js获得url内的参数
  9. 电脑bios到底是什么?
  10. 【新提醒】N820 N821 android 4.2 V1.1版 - 大V综合交流区 - 360官方论坛
  11. 升级后 VTE 类虚拟终端不工作
  12. python2.7 的中文编码处理,解决UnicodeEncodeError: &#39;ascii&#39; codec can&#39;t encode character 问题
  13. Gym - 101982F Rectangles (扫描线+线段树)
  14. codeforces982F
  15. kafka consumer 指定 offset,进行消息回溯
  16. 自学Aruba5.1-Aruba 基于角色(role)的策略管理(重点)
  17. Linux/shell: Concatenate multiple lines to one line
  18. 力扣(LeetCode)976. 三角形的最大周长
  19. springboot-dokcer
  20. MySql社区版和企业版的区别

热门文章

  1. 微服务减少jar包体积
  2. 【ML】序
  3. Linux命令 日记
  4. vxlan结合iptables-snat实现内网服务器公网访问
  5. IaaS--云上虚拟网络(何恺铎《深入浅出云计算》笔记整理)
  6. POD状态整理(持续更新)
  7. Angular中播放RTSP
  8. usb 2.0枚举过程
  9. 批量检测URL中的关键词,并且将不含有关键词的URL输出到txt文件当中
  10. 【笔记】archlinux缺少部分常用工具