如果你还想从头学起Selenium,可以看看这个系列的文章哦!

https://www.cnblogs.com/poloyy/category/1680176.html

其次,如果你不懂前端基础知识,需要自己去补充哦,博主暂时没有总结(虽然我也会,所以我学selenium就不用复习前端了哈哈哈...)

注意,目前的实战都是流水账式写的,后面才会结合框架+PO模式

目的是为了掌握所学的Selenium基础

实战题目

  1. 登录 http://www.51job.com
  2. 点击高级搜索
  3. 输入搜索关键词 python
  4. 地区选择 杭州
  5. 职能类别 选 计算机软件 -> 高级软件工程师
  6. 公司性质 选 上市公司
  7. 工作年限 选 1-3 年
  8. 搜索最新发布的职位, 抓取页面信息。 得到如下的格式化信息

Python开发工程师 | 杭州纳帕科技有限公司 | 杭州 | 0.8-1.6万/月 | 04-27

Python高级开发工程师 | 中浙信科技咨询有限公司 | 杭州 | 1-1.5万/月 | 04-27

代码思路(人为测试时的操作步骤)

  1. 点击【高级搜索】
  2. 关键字输入python
  3. 点击城市
  4. 显式等待,定位所有默认已选中的城市
  5. 取消选中它们
  6. 点击【北京】
  7. 点击【确定】
  8. 发现关键字输入框下方出现关键字历史记录,需要点击任意地方才能取消显示,所以随便找一个可点击元素进行点击
  9. 点击【职能类别输入框】
  10. 显式等待,点击【后端开发】
  11. 点击【高级软件工程师】
  12. 点击【确定】
  13. 点击【工作年限】,选择1-3年
  14. 点击【公司性质】,选择上市公式
  15. 点击【搜索】
  16. 定位职位列表,除了第一行
  17. 循环职位列表,获取每一行的信息存入列表
  18. 格式化输出

代码

# !/usr/bin/env python
# -*- coding: utf-8 -*- """
__title__ =
__Time__ = 2020/3/25 17:52
__Author__ = 小菠萝测试笔记
__Blog__ = https://www.cnblogs.com/poloyy/
"""

from time import sleep
from selenium import webdriver
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.common.by import By
from selenium.webdriver.support import expected_conditions as ec # 加载驱动
driver = webdriver.Chrome("../resources/chromedriver.exe") def wait_element(driver, by_, element_, timeout=10):
element = WebDriverWait(driver, timeout=timeout).until(
ec.presence_of_element_located(
(by_, element_)
)
)
return element def wait_elements(driver, by_, element_, timeout=10):
element = WebDriverWait(driver, timeout=timeout).until(
ec.presence_of_all_elements_located(
(by_, element_)
)
)
return element # 加载驱动
driver = webdriver.Chrome("../resources/chromedriver.exe") # 打开网站
driver.get("http://www.51job.com")
driver.maximize_window() # 高级搜索
more_btn = wait_element(driver, By.CLASS_NAME, "more").click() # 职位框
wait_element(driver, By.ID, "kwdselectid").send_keys("python") # 城市按钮
driver.find_element_by_id("work_position_click").click() # layer
layer = wait_element(driver, By.ID, "work_position_layer")
# 城市列表
city_list = wait_elements(driver, By.CSS_SELECTOR, "div#work_position_click_center_right_list_000000 table em.on")
for city in city_list:
sleep(1)
city.click() # 杭州
wait_element(driver, By.ID, "work_position_click_center_right_list_category_000000_080200").click() # 确认
wait_element(driver, By.ID, "work_position_click_bottom_save").click() # form
wait_element(driver, By.CSS_SELECTOR, "div#historylist>div.r1").click() # 职能类别
wait_element(driver, By.ID, "funtype_click").click() # 职能弹窗
type_layer = wait_element(driver, By.ID, "funtype_layer") # 后端开发
wait_element(driver, By.ID, "funtype_click_center_right_list_category_0100_0100").click() # f如果有已选列表,取消选择
flag = wait_element(driver, By.ID, "funtype_click_multiple_selected")
if flag.text:
# 已选列表
type_list = wait_elements(driver, By.CSS_SELECTOR, "div#funtype_click_multiple_selected>span")
for types in type_list:
if types.text == "高级软件工程师":
continue
em = types.find_element_by_tag_name("em")
em.click() # 高级软件工程师
wait_element(driver, By.ID, "funtype_click_center_right_list_sub_category_each_0100_0106").click() # 确定
driver.find_element_by_id("funtype_click_bottom_save").click() # 公司性质
company = wait_element(driver, By.ID, "cottype_list")
company.click() # 列表
ctype_list = company.find_elements_by_css_selector("div.ul > span")
for ctype in ctype_list:
# 外资(欧美)没有数据
if ctype.text == "上市公司":
ctype.click()
break # 工作年限
workyear_list = wait_element(driver, By.ID, "workyear_list")
workyear_list.click() # 列表
wlist = workyear_list.find_elements_by_css_selector("div.ul > span")
for wtype in wlist:
if wtype.text == "1-3年":
wtype.click()
break # 搜索按钮
wait_element(driver, By.CSS_SELECTOR, "div.btnbox > span.p_but").click() # 职位列表
resultList = wait_elements(driver, By.CSS_SELECTOR, "div#resultList>div.el")[1:]
for res in resultList:
spans = res.find_elements_by_tag_name("span")
texts = [x.text for x in spans]
# 最终输出
print(" | ".join(texts)) sleep(10)
driver.quit()

最新文章

  1. 《LoadRunner12七天速成宝典》签售会2016-12-17北京
  2. 通用js函数集锦<来源于网络/自己> 【一】
  3. 练习:使用nmcli 配置网络连接
  4. Windows Server 2012 克隆修改SID
  5. IOS 多线程01-线程基础知识
  6. LightOj 1220 - Mysterious Bacteria (分解质因子x=b^p 中的 x 求最大的 p)
  7. 列表框QListWidget类
  8. Power Network(网络流最大流 & dinic算法 + 优化)
  9. Delphi 利用TComm组件 Spcomm 实现串行通信
  10. DevExpress控件-- Gridcontrol合并表头
  11. cocos2d-x 找不到资源文件问题
  12. 超人学院Hadoop大数据资源共享
  13. ROADS+dijkstra的灵活运用+POJ
  14. QT第三天学习
  15. python 调取 shell 命令的几种方法
  16. 【洛谷P1706全排列问题】
  17. 关于HashMap和HashTable.md
  18. 自动登录(过滤器filter的应用)
  19. Nginx中间件使用心得(一)
  20. Java基础教程(18)--继承

热门文章

  1. 痞子衡嵌入式:嵌入式Cortex-M中断向量表原理及其重定向方法
  2. mysql zip 安装
  3. Tensor:Pytorch神经网络界的Numpy
  4. docker报错Cannot connect to the Docker daemon at unix:///var/run/docker.sock. Is the docker daemon running?
  5. Android工程师所必经的三个阶段,你到哪个阶段了?
  6. Cloud-init的安装和使用 --以ubuntu-server-14.04-amd64为例
  7. 跟我一起写 Makefile(五)
  8. Redis-01-基础
  9. Java基础技术基础面试【笔记】
  10. SpringBoot开发八-会话管理