python自如爬虫
2024-10-09 04:10:40
如果你想入门数据分析,但是苦于没有数据,那就看下文如何用 10 行代码写一个最简单的自如房源爬虫
首先我们通过分析看到自如手机版有个 url 如下:http://m.ziroom.com/list/ajax-get-data 能够返回 json 数据
这个基本上包括了租房的一些重要信息,价格,小区,地铁沿线,朝向
所以要做的就是遍历这个地址得到所有的 json 数据
下面是代码:
import requests
import time
with open('ziroom.txt', 'a+') as f:
for i in xrange(10, 9001, 10):
payload = {'step': i}
res = requests.post('http://m.ziroom.com/list/ajax-get-data', data=payload)
for i in res.json()['data']:
print i['id']
f.write(str(i)+'\n')
time.sleep(3)
最新文章
- 机器指令翻译成 JavaScript —— No.3 流程分割
- myeclipse2015卸载、安装、破解全过程-----myeclipse2015
- Berkeley DB的数据存储结构——哈希表(Hash Table)、B树(BTree)、队列(Queue)、记录号(Recno)
- JavaWeb学习笔记——jsp:setproperty和getproperty
- php 调用系统命令
- PHP中的文件下载
- Excel表数据导入数据库表中
- utf8转为gb2312的函数
- HDOJ 2071 Max Num
- 你使用PetaPoco必须知道的事情
- MySql命令——表相关
- java-随学随记之基础篇
- hdu 4465 概率称号
- prop与attr的区别
- DCNN models
- Html5 postMessage实现跨域消息传递
- jQuery-animate万能动画效果
- rest-framework之分页器
- 674. Longest Continuous Increasing Subsequence
- [翻译]第二天 - Visual Studio 中的 .NET Core 模版一览
热门文章
- python-基站位置查询
- python 生成随机字符串
- web.xml——Error:cvc-complex-type.2.4.a: Invalid content was found starting with element
- TP5.0验证器使用方法
- Git链接http转ssh
- 配置单机Kafka
- 认证(Authentication)和授权(Authorization)总结
- “造轮运动”之 ORM框架系列(一)~谈谈我在实际业务中的增删改查
- Beta冲刺——5.26
- Java-接口概念辨析