python 爬虫newspaper3k 新闻爬去方法 利用第三方库
2024-09-01 12:45:10
from newspaper import Article url = '你想要爬取的网站url'
news = Article(url, language='zh')
news .download() #先下载
news .parse() #再解析
print(news.text) #新闻正文
print(news.title) #新闻标题
print(news.html) #未修改的原始HTML
print(news.authors) #新闻作者
print(news.top_image) #本文的“最佳图像”的URL
print(news.movies) #本文电影url
print(news.keywords) #新闻关键词
print(news.summary) #从文章主体txt中生成的摘要
print(news.images) #本文中的所有图像url
最新文章
- Android—定位
- z-index 可以使用负值,CSS相对定位、绝对定位利器
- python Django教程 之 安装、基本命令、视图与网站
- 《On Lisp》第四章第三节图4.6中的rmapcar函数中展现的apply陷阱
- EF 连接MySQL 数据库 保存中文数据后乱码问题
- js 和 c# 方法互调
- [NOIP2011] 普及组
- 为Python添加默认模块搜索路径
- Linux命令练级初级
- 关于dynamic_cast
- Spring MVC中DispatcherServlet工作原理探究
- 那些年被我坑过的Python——第十章Broker(rabbitMQ/redis)
- UESTC_秋实大哥带我飞 2015 UESTC Training for Graph Theory<;Problem B>;
- ubuntu svn下载代码出错
- [PHP] MIME邮件协议的multipart类型
- Android greenDAO 数据库 简单学习之基本使用
- Redux Counter example
- Atitit s2018.5 s5 doc list on com pc.docx v2
- MyBatis参数传递
- lua连接redis集群