什么是RSS,它可以做什么

快2020年了,RSS日渐式微,我也是去年机缘巧合下才开始使用的,以前只是听说过。RSS,全称Really Simple Syndication,又称简易信息聚合(也叫聚合内容)是一种RSS基于XML标准,在互联网上被广泛采用的内容包装和投递协议。RSS搭建了信息迅速传播的一个技术平台,使得每个人都成为潜在的信息提供者。它简洁直接无广告,只提供内容!

说人话就是采用一种某种标准的信息数据,广泛应用于网上新闻,博客,不用打开相关网站,有新内容就会推送(当然,前提是需要有一个RSS阅读器),其实RSS用途不仅于此,你可以使用RSS订阅一切内容,例如如下场景:

  • 某个资源网站更新了想看的信息,自动推送相关信息给你
  • 喜欢的爱豆在各个平台上有新动态了,第一时间get~
  • 关注的歌手在附近有新演唱会啦,买买买~
  • 淘宝上看中的宝贝降价啦,立马提醒你
  • 明天会下雨,提前温馨通知
  • ......

可以直接食用的订阅源

简单推荐一些官方的源和各位大佬们做好的

网站 简述
FeedX 主要提供国内外新闻平台的RSS源,很良心
RSSHub DIYGod大佬的开源项目,提供了很多RSS源,种类很多,目前还在不断更新中
cnbeta 主要提供科技数码方面的新闻,官方源https://www.cnbeta.com/backend.php,但是不提供全文。
少数派 官方源https://sspai.com/feed

获取全文输出

有的官方源不支持全文输出,只有简述,例如cnbeta,将其转成有全文输出的办法也简单,利用相关网站。以下推荐一些


给指定网站制作RSS源

Feed43 国外老牌RSS定制网站,已运营多年,它能将网页转换为标准格式的 RSS 源。

优点

  • 免费(也有收费套餐,但一般用不上)
  • 容易上手,无需编程基础

缺点

  • 国外服务,不是很稳定
  • 可自定义程度略低
  • 有些网站不能抓取,报403或404
  • 免费版只会每6小时抓取一次

开始炮制

  1. 如果你想以后继续用或者更改你的feed,可以注册一个账号,不注册登录也可以用

  2. 点击create your first rss feed开始

  3. 这里以1905电影网为例,Step 1. Specify source page address (URL)在Address框输入网址,然后点击reload加载,如果出现乱码,试试Encoding框输入UTF-8

  4. 如果不幸显示404 Not Found或者403 Forbid,那么说明该网站无法转换,你可以换个姿势再试试

  5. 如果成功你就可以看到Page Source框里的html代码,Step 2. Define extraction rules,定义抓取规则。

  6. Global Search Pattern是可选的,一般留空即可,重点在Item (repeatable) Search Pattern

  7. 我要抓取1905网里的电影资讯,源代码中的资讯代码形如<a href="https://www.1905.com/news/20191225/1428107.shtml" target="_blank" data-hrefexp="fr=homepc_news_kx">奥斯卡热门影片《别告诉她》聚焦社会话题 文化差异引碰撞</a>

  8. 那么在Item (repeatable) Search Pattern框下输入<a href="{%}" target="_blank" data-hrefexp="fr=homepc_news_kx">{%}</a>

    即可,{%}表示你要获取的内容,点击Extract然后可以看到网页中符合这个模板的内容都会被抓取到。

  9. Step 3. Define output format,定义输出格式,重点在RSS item properties下的Item Title Template(标题)、Item Link Template(链接)、Item Content Template(全文内容),将第二步获取到的内容输入,{%数字}的形式

    最后点击Preview即可,然后你就能看到最后的RSS源

    Feed URL就是RSS源,你还可以修改成简单好记的名称。

全文输出

利用Feed43做的RSS源无法获取到全文内容,那么利用上文提到的相关网站就可以啦,下面我使用freefullrss进行操作。

在输入框输入相关信息,然后点击Creat Full Text RSS,成功就会显示如下成果:

最后将该网页网址复制添加到RSS阅读器即可,大功告成!本文首发于个人博客

最新文章

  1. 使用xmarks同步 chrome ie firefox safari书签
  2. web.xml的初始化参数
  3. java的一段对象数据类型映射的代码
  4. 第20章 使用LNMP架构部署动态网站环境
  5. LinuxShell脚本攻略--第九章 管理重任
  6. MySQL单表多字段模糊查询解决方法
  7. DF学Mysql(三)——Mysql数据类型
  8. dos下循环复制一张图片的bat
  9. 我们都忽略了Html5的力量,如果只看成一种技术就大错特错了!
  10. Effective Java之并发
  11. Warning: Invalid argument supplied for foreach()
  12. HTML基础总结&lt;段落&gt;
  13. English - 英文写作中的最常见“十大句式”
  14. C# Oracle insert 中文乱码
  15. UTC、GTC时间和本地时间
  16. &lt;input &gt; -- radio
  17. 【转载】 spring事物配置,声明式事务管理和基于@Transactional注解的使用
  18. Python 19 Django 详解
  19. Oracle DB
  20. 各机器学习方法代码(OpenCV2)

热门文章

  1. iOS 9整理
  2. 2019-8-31-C#-将-Begin-和-End-异步方法转-task-异步
  3. 2018-12-25-C#-使用转换语义版本号
  4. Java练习 SDUT-1200_汉诺塔
  5. Python 基础02 基本数据类型
  6. mybatis-generator1.3.6的使用
  7. include 语句中使用双引号与括号有什么区别?
  8. hdu 3068 最长回文 (Manacher算法求最长回文串)
  9. LRJ-Example-06-13-Uva1103
  10. 2019年ICPC南昌网络赛 J. Distance on the tree 树链剖分+主席树