# 抓取北京市2018年积分落户公示名单
# 'http://www.bjrbj.gov.cn/integralpublic/settlePerson' import csv
import json
import requests fw = open('luohu.csv', 'w')
writer = csv.writer(fw)
writer.writerow(['id','name','birthday','company','score']) def get_publicity(page_number):
url = 'http://www.bjrbj.gov.cn/integralpublic/settlePerson/settlePersonJson?sort=pxid&order=asc&limit=100&offset=0&name=&rows=100&page={}'.format(page_number*100) header = {
'Accept':'text/html,application/xhtml+xml,application/xml;q=0.9,image/webp,*/*;q=0.8',
'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36(KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'
} response = requests.get(url,headers=header,timeout=5) result = json.loads(response.text) for item in result['rows']:
id = item['pxid']
name = item['name']
birthday = item['csrq']
company = item['unit']
score = item['score']
print(id,name,birthday,company,score)
writer.writerow([id, name, birthday, company, score]) def main():
for i in range(0,61):
get_publicity(i) if __name__ == '__main__':
main()

最新文章

  1. 由Dapper QueryMultiple 返回数据的问题得出==》Dapper QueryMultiple并不会帮我们识别多个返回值的顺序
  2. linux yum命令详解
  3. 学习Spring——依赖注入
  4. centos在线安装svn
  5. 【温故Delphi】Win32API之GetTempFileName
  6. DEDECMS之八 漏洞错误和疑难杂症
  7. QT210 Android4.0源码编译和烧录文档整理
  8. boost解析json(2)
  9. Java数组运算
  10. opencv 金字塔图像分割
  11. oc-24-点语法
  12. Java多线程模式(二)
  13. Lucene查询条数限制
  14. redis五种数据类型的使用
  15. 【BZOJ3926】诸神眷顾的幻想乡(后缀自动机)
  16. linux操作命令之帮助命令
  17. Redis 设计与实现 (二)--数据库
  18. (转)C#读写共享文件
  19. mongodb基础环境搭建
  20. 游戏手柄(JoyStick)编程学习笔记(2)

热门文章

  1. [android] android下创建一个sqlite数据库
  2. 1.Linux电源管理-休眠与唤醒
  3. Git中的"pull request"真正比较的是什么?
  4. [转] 快速部署Tomcat项目的Shell脚本
  5. NPM测试模块之rewire教程
  6. 如何用JavaScript判断dom是否有存在某class的值?
  7. Caused by: Java.lang.NoSuchMethodError: javax.persistence.JoinColumn.foreignKey()Ljavax/persistence/ForeignKey;
  8. sublime使用Package Control不能正常使用的解决办法
  9. java----堆区、方法区和栈区
  10. shell编程-文件包含(十)