用BeautifulSoup简单爬取BOSS直聘网岗位
2024-08-29 01:32:31
用BeautifulSoup简单爬取BOSS直聘网岗位
- 爬取python招聘
import requests
from bs4 import BeautifulSoup
def fun(path):
r1 = requests.get(url=path,
headers = {'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3676.400 QQBrowser/10.4.3469.400'},
)
soup = BeautifulSoup(r1.text,'html.parser')
div = soup.find(name='div',id='main')
info = div.find(name='div',attrs={'class':'job-list'})
li = info.find_all(name='li')
f = open('boss直聘.txt','a',encoding='utf-8')
for i in li:
job = i.find(name='div',attrs={'class':'job-title'})
red = i.find(name='span',attrs={'class':'red'})
company = i.find_all(name="a")
em = i.find_all(name='p')
info = "%s|%s|%s|%s|%s"%(job.text,red.text,em[0].text,em[1].text,company[1].text)
f.write(info+'\n')
f.close()
for i in range(1,11):
path = 'https://www.zhipin.com/c101010100-p100109/?page=%d&ka=page-%d'%(i,i)
fun(path)
此代码仅供学习使用。
最新文章
- CodeForces 42A Guilty — to the kitchen!
- Android selector选择器的使用
- vs2013 ie10
- Web前端面试常识
- Java [Leetcode 155]Min Stack
- YII 小部件 yii小部件查看方法 小物件做的表单
- No.5 表达式中的陷阱
- CSS 设计彻底研究(一)(X)HTML与CSS核心基础
- J2SE知识点摘记(十一)
- 在不同版本号hdfs集群之间转移数据
- 利用原生JS判断组合键
- Redis常用命令总结
- Python中byte与str
- jQuery实现遮罩层
- P3327 [SDOI2015]约数个数和
- XSS编码与绕过
- luogu 1196 银河英雄传说 带权并查集
- uva-10700-贪心
- 20145122 《Java程序设计》第8周学习总结
- getattr的使用
热门文章
- Struts2中数据封装机制
- 电脑插入U盘后显示CD驱动器,如何还原为正常U盘?
- java 图形化界面 布局管理器
- Struts多个文件上传
- poj2586 Y2K Accounting Bug —— 枚举
- Codeforces Round #303 (Div. 2) D. Queue —— 贪心
- Linux init 系列一 System V风格
- ffmpeg: error while loading shared libraries: libavdevice.so.52
- 存储过程系列四: decode函数使用学习
- BZOJ2120:数颜色(数状数组套主席树)(带修改的莫对)