爬取今日头条图片

这里只讨论出现的一些问题,代码在最下面github链接里。

首先,今日头条取消了“图集”这一选项,因此对于爬虫来说效率降低了很多;

在所有代码都完成后,也许是爬取下载次数太多,今日头条实行了反爬,目前还不知道解决办法。

使用json.loads(html)时报错:

json.decoder.JSONDecodeError: Expecting property name enclosed in double quotes: line 1 column 2 (char 1)

该问题在使用'replace()'后得到解决。

最新文章

  1. css-css权威指南学习笔记8
  2. HTML Meta中添加X-UA-Compatible和IE=Edge,chrome=1有什么作用
  3. android应用刷新系统多媒体库(增加or删除多媒体文件)
  4. 第1章 Sass简介
  5. 22.mongodb副本集集群
  6. LInux下修改 ~/.bashrc 文件source ~/.bashrc 后 shell 命令 失效 任何命令都显示 “ bash XX :未找到命令”
  7. git 删除远程分支
  8. tornado 学习笔记1 引言
  9. HDU 4793 Collision --解方程
  10. SpringMVC + Spring + MyBatis 学习笔记:SpringMVC和Spring一同工作的时候,AOP事务管理不起作用的解决方法
  11. jq 选项卡
  12. SVN更改登录用户(转)
  13. rpm打包工具---FPM
  14. 用python爬了自己的微信,原来好友都是这样的!
  15. [转]关于python中带下划线的变量和函数的意义
  16. springboot-aop
  17. Centos下安装破解confluence6.3的操作记录
  18. java面试题:分布式
  19. 在没有任何投票节点情况下将从节点转换为Primary节点脚本
  20. Codeforces 734C Anton and Making Potions(枚举+二分)

热门文章

  1. 数组与pandas模块
  2. 【洛谷P4552】IncDec Sequence
  3. React 服务器端渲染流程
  4. 织梦dedecms做的网站首页标题篡改跳转赌博网站解决方案
  5. 数据库范式以及ER图
  6. 数组翻转的方法(java实现)
  7. gwyh 测试赛 验题人 - 题解 (非std做法)
  8. Springboot 使用Jedis
  9. zabbix微信发送消息脚本
  10. Jmeter(四)Cookie管理器