如果你想入门数据分析,但是苦于没有数据,那就看下文如何用 10 行代码写一个最简单的自如房源爬虫

首先我们通过分析看到自如手机版有个 url 如下:http://m.ziroom.com/list/ajax-get-data  能够返回 json 数据

这个基本上包括了租房的一些重要信息,价格,小区,地铁沿线,朝向

所以要做的就是遍历这个地址得到所有的 json 数据

下面是代码:

import requests
import time with open('ziroom.txt', 'a+') as f:
for i in xrange(10, 9001, 10):
payload = {'step': i}
res = requests.post('http://m.ziroom.com/list/ajax-get-data', data=payload)
for i in res.json()['data']:
print i['id']
f.write(str(i)+'\n')
time.sleep(3)

最新文章

  1. 机器指令翻译成 JavaScript —— No.3 流程分割
  2. myeclipse2015卸载、安装、破解全过程-----myeclipse2015
  3. Berkeley DB的数据存储结构——哈希表(Hash Table)、B树(BTree)、队列(Queue)、记录号(Recno)
  4. JavaWeb学习笔记——jsp:setproperty和getproperty
  5. php 调用系统命令
  6. PHP中的文件下载
  7. Excel表数据导入数据库表中
  8. utf8转为gb2312的函数
  9. HDOJ 2071 Max Num
  10. 你使用PetaPoco必须知道的事情
  11. MySql命令——表相关
  12. java-随学随记之基础篇
  13. hdu 4465 概率称号
  14. prop与attr的区别
  15. DCNN models
  16. Html5 postMessage实现跨域消息传递
  17. jQuery-animate万能动画效果
  18. rest-framework之分页器
  19. 674. Longest Continuous Increasing Subsequence
  20. [翻译]第二天 - Visual Studio 中的 .NET Core 模版一览

热门文章

  1. python-基站位置查询
  2. python 生成随机字符串
  3. web.xml——Error:cvc-complex-type.2.4.a: Invalid content was found starting with element
  4. TP5.0验证器使用方法
  5. Git链接http转ssh
  6. 配置单机Kafka
  7. 认证(Authentication)和授权(Authorization)总结
  8. “造轮运动”之 ORM框架系列(一)~谈谈我在实际业务中的增删改查
  9. Beta冲刺——5.26
  10. Java-接口概念辨析