from newspaper import Article

url = '你想要爬取的网站url'
news = Article(url, language='zh')
news .download() #先下载
news .parse() #再解析
print(news.text) #新闻正文
print(news.title) #新闻标题
print(news.html) #未修改的原始HTML
print(news.authors) #新闻作者
print(news.top_image) #本文的“最佳图像”的URL
print(news.movies) #本文电影url
print(news.keywords) #新闻关键词
print(news.summary) #从文章主体txt中生成的摘要
print(news.images) #本文中的所有图像url

最新文章

  1. Android—定位
  2. z-index 可以使用负值,CSS相对定位、绝对定位利器
  3. python Django教程 之 安装、基本命令、视图与网站
  4. 《On Lisp》第四章第三节图4.6中的rmapcar函数中展现的apply陷阱
  5. EF 连接MySQL 数据库  保存中文数据后乱码问题
  6. js 和 c# 方法互调
  7. [NOIP2011] 普及组
  8. 为Python添加默认模块搜索路径
  9. Linux命令练级初级
  10. 关于dynamic_cast
  11. Spring MVC中DispatcherServlet工作原理探究
  12. 那些年被我坑过的Python——第十章Broker(rabbitMQ/redis)
  13. UESTC_秋实大哥带我飞 2015 UESTC Training for Graph Theory<Problem B>
  14. ubuntu svn下载代码出错
  15. [PHP] MIME邮件协议的multipart类型
  16. Android greenDAO 数据库 简单学习之基本使用
  17. Redux Counter example
  18. Atitit s2018.5 s5 doc list on com pc.docx  v2
  19. MyBatis参数传递
  20. lua连接redis集群

热门文章

  1. HTTP请求/响应报文结构
  2. 借助python工具从word文件中抽取相关表的定义,最后组装建表语句-非常好
  3. PAT 1009 Product of Polynomials
  4. logstash快速入门
  5. json字符串转Map、json数组
  6. Git:合并分支冲突问题
  7. 1.Liunx 文件管理
  8. Git merge && git rebase的用法
  9. SSL证书读取
  10. zabbix3.4.7之Zabbix_Trigger_Function详解