利用了beautifulsoup进行爬虫,解析网址分页面爬虫并存入文本文档:

结果:

源码:

from bs4 import BeautifulSoup
from urllib.request import urlopen
with open("热门标题.txt","a",encoding="utf-8") as f:
for i in range(2):
url = "http://www.ltaaa.com/wtfy-{}".format(i)+".html"
html = urlopen(url).read()
soup = BeautifulSoup(html,"html.parser")
titles = soup.select("div[class = 'dtop' ] a") # CSS 选择器
for title in titles:
print(title.get_text(),title.get('href'))# 标签体、标签属性
f.write("标题:{}\n".format(title.get_text()))

  

最新文章

  1. XML组成结构以及C#通过DTD验证规范性
  2. excel2013添加坐标轴名称label
  3. OCJP-试题集合 | 对象的比较
  4. 分布式文件系统FastDFS原理介绍
  5. ArcGIS Portal 10.4 本地坐标系的web 3d地形展示制作说明
  6. Bginfo软件在域的部署和应用
  7. 拿起cl.exe,放下IDE
  8. HTML5添加背景音乐
  9. [CSS3备忘] transform animation 等
  10. JS 一条原型链扯到底
  11. python 获取utc时间转化为本地时间
  12. template模板的使用方法
  13. JAVA项目从运维部署到项目开发(二.ZooKeeper)
  14. css.aa
  15. 如何监控redis的cpu使用率
  16. excel 导入mysql
  17. AtCoder Beginner Contest 085(ABCD)
  18. POJ 2240 Arbitrage / ZOJ 1092 Arbitrage / HDU 1217 Arbitrage / SPOJ Arbitrage(图论,环)
  19. 样条之EHMT插值函数
  20. MySQL的初次见面礼基础实战篇

热门文章

  1. vue.js 使用 v-text 和 v-html
  2. 【MySQL】GTID小结
  3. vuex源码分析(二) state及strict属性 详解
  4. thymeleaf入门
  5. C# 爬虫相关的、可供参考的开源项目
  6. 5种IO模型、阻塞IO和非阻塞IO、同步IO和异步IO
  7. windows 安装gitea
  8. Asp.Net Core Mvc Razor之RazorPage
  9. 4、Ext.NET 1.7 官方示例笔记 - 树
  10. jmeter入门操作 = 接口