打算学习用selenium + phantomJS爬取淘女郎页面照片。

一. 先安装lxml模块

python默认的解析器是html.parser,但lxml解析器更加强大,速度更快

1. 执行 pip install virtualenv

2. 从官方网站下载与系统,Python版本匹配的lxml文件

http://pypi.python.org/pypi/lxml/2.3/

3. 执行 easy_install lxml-2.3-py2.7-win-amd64.egg

二. 安装selenium

pip install selenium

三. 使用selenium写个代码,体验一下,却出现报错

 from selenium import webdriver

 browser = webdriver.Chrome()
 browser.get('http://www.baidu.com')

运行一下,出现报错

原因是没有安装chrome浏览器的chromedriver(浏览器驱动),好了直接下载chromedriver.exe,把它放到chrome的安装目录下...\Google\Chrome\Application\ ,并配置环境变量,再次运行,又出现问题了:

原因:这是chrome浏览器版本和chromedriver版本不对应引起的,需要先查看chrome版本(可以在浏览器输入:chrome://help),我的版本是59:

再查看chrome浏览器与chromedriver的对应表,这里这个博客selenium之 chromedriver与chrome版本映射表(更新至v2.31),列出版本映射表:

我的版本59对应的chromedriver的版本是2.3.0或2.3.1,从http://chromedriver.storage.googleapis.com/index.html下载2.3.0,得以成功运行:

注:

可以去官网地址查看每个chromedriver版本对应的chrome浏览器版本:https://sites.google.com/a/chromium.org/chromedriver/downloads

下载地址:https://chromedriver.storage.googleapis.com/index.html

最新文章

  1. Photosohp 2017 已经发布!(下载地址及破解方法在文章底部)
  2. EBS中使用java进行 JavaConcurrentProgram 请求获取参数
  3. [java bug记录] java.util.zip.ZipException: invalid code lengths set
  4. MAVEN Scope使用
  5. JSP的学习(2)——语法知识一
  6. oracle_五千万数据插入测试
  7. 覆盖equals()时总要覆盖hashCode()
  8. css 图片增加模糊效果
  9. 七 Git版本控制
  10. python+SQLAlchemy+爬虫
  11. Django---forms表单使用(2)
  12. 使用Bitsadmin 命令下载文件
  13. 把vim插入状态的光标改为竖线
  14. 显式提交/隐式提交 //ajax方式的隐式提交
  15. [LintCode] 拓扑排序
  16. 【Python3】端口占用监测的程序
  17. 2018.08.28 集合堆栈机(模拟+STL)
  18. contos7忘记root密码怎么办
  19. Android 长截屏原理
  20. ansible(2)

热门文章

  1. $(document).ready() $(window).load 及js的window.onload
  2. 老铁,这年头不会点git真不行
  3. 两个offer如何做选择?年薪20万vs年薪15万
  4. 使用nose_parameterized使unitTest实现参数化
  5. ApexSQL Recover 恢复一个被drop的表的数据
  6. 【WEB HTTP】集成点:网关、隧道及中继
  7. 剑指offer 面试8题
  8. Eclipse Find/Replace
  9. PPA(Personal Package Archives)简介、兴起、使用
  10. accept= 'image/*'反映缓慢