用BeautifulSoup简单爬取BOSS直聘网岗位

  • 爬取python招聘
import requests
from bs4 import BeautifulSoup def fun(path):
r1 = requests.get(url=path,
headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3676.400 QQBrowser/10.4.3469.400'},
)
soup = BeautifulSoup(r1.text,'html.parser')
div = soup.find(name='div',id='main')
info = div.find(name='div',attrs={'class':'job-list'})
li = info.find_all(name='li')
f = open('boss直聘.txt','a',encoding='utf-8')
for i in li:
job = i.find(name='div',attrs={'class':'job-title'})
red = i.find(name='span',attrs={'class':'red'})
company = i.find_all(name="a")
em = i.find_all(name='p') info = "%s|%s|%s|%s|%s"%(job.text,red.text,em[0].text,em[1].text,company[1].text)
f.write(info+'\n')
f.close()
for i in range(1,11):
path = 'https://www.zhipin.com/c101010100-p100109/?page=%d&ka=page-%d'%(i,i)
fun(path)

此代码仅供学习使用。

最新文章

  1. CodeForces 42A Guilty — to the kitchen!
  2. Android selector选择器的使用
  3. vs2013 ie10
  4. Web前端面试常识
  5. Java [Leetcode 155]Min Stack
  6. YII 小部件 yii小部件查看方法 小物件做的表单
  7. No.5 表达式中的陷阱
  8. CSS 设计彻底研究(一)(X)HTML与CSS核心基础
  9. J2SE知识点摘记(十一)
  10. 在不同版本号hdfs集群之间转移数据
  11. 利用原生JS判断组合键
  12. Redis常用命令总结
  13. Python中byte与str
  14. jQuery实现遮罩层
  15. P3327 [SDOI2015]约数个数和
  16. XSS编码与绕过
  17. luogu 1196 银河英雄传说 带权并查集
  18. uva-10700-贪心
  19. 20145122 《Java程序设计》第8周学习总结
  20. getattr的使用

热门文章

  1. Struts2中数据封装机制
  2. 电脑插入U盘后显示CD驱动器,如何还原为正常U盘?
  3. java 图形化界面 布局管理器
  4. Struts多个文件上传
  5. poj2586 Y2K Accounting Bug —— 枚举
  6. Codeforces Round #303 (Div. 2) D. Queue —— 贪心
  7. Linux init 系列一 System V风格
  8. ffmpeg: error while loading shared libraries: libavdevice.so.52
  9. 存储过程系列四: decode函数使用学习
  10. BZOJ2120:数颜色(数状数组套主席树)(带修改的莫对)