一、安装

pip install Selenium

二、初始化浏览器

  • Chrome 是初始化谷歌浏览器

  • Firefox 是初始化火狐浏览器

  • Edge 是初始化IE浏览器

  • PhantomJS 是一个无界面浏览器。

from selenium import webdriver

driver = webdriver.Chrome()

三、设置浏览器大小

  • maximize_window 最大化窗口

  • set_window_size 自定义窗口大小

from selenium import webdriver

driver = webdriver.Chrome()
driver.maximize_window()

四、访问页面

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('https://www.baidu.com')

五、定位元素

  1. 通过元素id定位

  • 定位一个元素:find_element_by_id

  • 定位多个元素:find_elements_by_id

  1. 通过元素name定位

  • 定位一个元素:find_element_by_id

  • 定位多个元素:find_elements_by_id

  1. 通过xpath表达式定位

  • 定位一个元素:find_element_by_id

  • 定位多个元素:find_elements_by_id

  1. 通过完整超链接定位

  • 定位一个元素:find_element_by_id

  • 定位多个元素:find_elements_by_id

  1. 通过部分链接定位

  • 定位一个元素:find_element_by_id

  • 定位多个元素:find_elements_by_id

  1. 通过标签定位

  • 定位一个元素:find_element_by_id

  • 定位多个元素:find_elements_by_id

  1. 通过类名进行定位

  • 定位一个元素:find_element_by_id

  • 定位多个元素:find_elements_by_id

  1. 通过css选择器进行定位

  • 定位一个元素:find_element_by_id

  • 定位多个元素:find_elements_by_id

# 找到百度首页的输入框
from selenium import webdriver driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw')

六、定位元素另一种写法

  • 需引入By模块

from selenium import webdriver
from selenium.webdriver.common.by import By driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element(By.ID, 'kw')

七、元素的交互

  • 点击某个元素:click()

  • 模拟输入:send_keys()

  • 清除操作:clear()

  • 提交表单:submit()

  • 获取元素的属性值:get_attribute(name)

  • 获取元素的位置:location

  • 获取元素的文本值:text

  • 获取元素的大小:size

  • 获取元素的id值:id

  • 获取元素的标签名:tag_name

#  在百度输入框中输入我是autofelix,并点击搜索按钮
from selenium import webdriver driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.find_element_by_id('kw').send_keys('我是autofelix')
driver.find_element_by_id('su').click()

八、执行JS

from selenium import webdriver

driver = webdriver.Chrome()
driver.maximize_window() driver.get('https://www.baidu.com') js_sql = '''
document.getElementById('kw').value = '我是autofelix'
'''
driver.execute_script(js_sql)

九、操作Frame

  • 网页中frame的话,需要执行切入切出操作

  • switch_to.from(子iframe的id名称) 切入

  • switch_to.parent_frame(父iframe的id名称) 切出

from selenium import webdriver

driver = webdriver.Chrome()
driver.maximize_window() driver.get('https://www.baidu.com') //这个网址并没有iframe,我臆测有,你们看看就行
driver.switch_to.frame('我臆测出来的iframe')

十、cookie操作

  • 删除当前页面所有cookies:delete_all_cookies()

  • 获取指定cookie值:get_cookie(name)

  • 获取当前页面所有cookies值:get_cookies()

  • 设置cookie值:add_cookie()

from selenium import webdriver

driver = webdriver.Chrome()
driver.maximize_window() driver.get('https://www.baidu.com') driver.delete_all_cookies()
driver.add_cookie({'name': 'name', 'domain': '.baidu.com', 'value': 'autofelix'})

十一、选项卡管理

  • 保存所有选项卡的元组:window_handles

  • 切换选项卡:switch_to.window()

from selenium import webdriver

driver = webdriver.Chrome()
driver.maximize_window() driver.get('https://www.baidu.com')
driver.get('https://www.taobao.com') driver.switch_to.window(driver.window_handles[0])
driver.switch_to.window(driver.window_handles[1])

十二、鼠标事件

  • 鼠标事件需要引入ActionChains模块

  • 鼠标右击:move_to_element(above)

  • 鼠标双击:double_click()

  • 左键按住拖动:drag_and_drop()

  • 动作存储:perform()

# 滑动滑块验证码
from selenium import webdriver
from selenium.webdriver import ActionChains
from selenium.webdriver.common.by import By
from selenium.webdriver.support.wait import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC # 初始化谷歌浏览器
driver = webdriver.Chrome() # 最大化窗口
driver.maximize_window() # 打开头条登陆网址
driver.get('https://sso.toutiao.com') # 等待某个元素是否出现
WebDriverWait(self.driver, 10).until(
EC.text_to_be_present_in_element((By.XPATH, '//*[@id="mobile-code-get"]/span'), u'发送')
) # 实例化鼠标操作
action = ActionChains(self.driver) # 按住滑块
action.click_and_hold(self.driver.find_element_by_xpath('//*[@id="captcha_container"]')).perform() # 将滑块移动x的距离
action.move_by_offset(xoffset=x, yoffset=0).perform() # 释放滑块
action.release().perform()

十三、等待

  • 隐氏等待:如果到一定时间,指定的元素还没有出现,进程不会阻塞,但是到指定时间还没有找到,就会抛出异常

  • 显示等待:如果在一定时间内,指定的元素没有出现,进程会阻塞在这里,如果到指定时间还没有找到,就会抛出异常

# 隐氏等待
from selenium import webdriver driver = webdriver.Chrome()
driver.implicitly_wait(10) driver.get('https://www.baidu.com')
# 显示等待
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC driver = webdriver.Chrome()
driver.implicitly_wait(10) driver.get('https://www.baidu.com')
WebDriverWait(driver, 10).until(
EC.presence_of_element_located((By.ID, 'kw'))
)

十四、前进后退刷新

  • 后退:back()

  • 前进:forward()

  • 刷新:refresh()

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
driver.get('https://www.taobao.com')
driver.get('https://www.jd.com') driver.back()
driver.forward()
driver.refresh()

十五、关闭浏览器

  • 关闭当前标签页:close()

  • 关闭整个浏览器:quit()

from selenium import webdriver

driver = webdriver.Chrome()
driver.get('https://www.baidu.com')
//打开百度页面后,关闭整个浏览器
driver.quit()

最新文章

  1. 支持coclock模式
  2. RandomAccessFile拆分合并文件
  3. Masonry使用注意篇
  4. LeetCode:Search in Rotated Sorted Array I II
  5. RequireJS入门(一) 转
  6. 部署SharePoint解决方式包时遇到的问题
  7. VirtualBox检查更新失败解决办法
  8. 「Poetize7」足球比赛
  9. PHP安全编程:防止源代码的暴露(转)
  10. Linux同平台Oracle数据库整体物理迁移
  11. java-StringTokenizer类
  12. stl_泛型的一些基本
  13. Mybatis逻辑分页原理解析RowBounds
  14. Aptana版本回滚的方法
  15. Feign源码解析
  16. 蓝桥杯 全球变暖(dfs)
  17. Git介绍及常用操作演示(一)--技术流ken
  18. Python学习(三十一)—— Django之路由系统
  19. python---RabbitMQ(3)exchange中关键字发送direct(组播)
  20. js将foo-bar转为fooBar

热门文章

  1. MATLAB基础学习(3)——数值数组及运算
  2. day3 -- 集合、文件操作、函数
  3. 7、前端--jQuery简介、基本选择器、基本筛选器、属性选择器、表单选择器、筛选器方法、节点操作、绑定事件
  4. ConcurrentHashMap (jdk1.7)源码学习
  5. Unable to register node “xxx“ with API server: Unauthorized
  6. 【转】可见性、原子性和有序性问题:并发编程Bug的源头
  7. 攻防世界Web_ics_05
  8. k8s基础环境配置:基于CentOS7.9
  9. 答疑记录:jmeter从返回的html中提取指定内容
  10. [题解]hihoCoder挑战赛18——题目1 神奇字符串