python和scrapy的安装【转:https://my.oschina.net/xtfjt1988/blog/364577】
抓取网站的代码实现很多,如果考虑到抓取下载大量内容scrapy框架无疑是一个很好的工具。Scrapy = Search+Pyton。下面简单列出安装过程。PS:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。(我的是xp系统)
1.安装Python
安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。在cmd中输入python如果出现版本信息说明配置完毕(如下面截图)。python下载地址。
2.安装lxml
lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击 这里选择对应的Python版本安装。验证是否安装成功,如下图。
3.安装setuptools
用来安装egg文件,点击 https://pypi.python.org/pypi/setuptools#using-setuptools-and-easyinstall 下载python2.7的对应版本的setuptools。
设置环境变量:path中加入C:\Python27\Scripts
4.安装zope.interface
可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。
5.安装Twisted
Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。
备用地址:http://vdisk.weibo.com/s/yTKgWrhNCxDDM#_loginLayer_1480039489026
6.安装pyOpenSSL
pyOpenSSL是Python的OpenSSL接口,点击 这里下载。
7.安装win32py
提供win32api,点击 这里下载
8.安装Scrapy
终于轮到安装scrapy了,直接在cmd中输入easy_install scrapy回车即可。安装后在cmd命令行进行成功与否的验证如图所示。
安装完成,开始使用吧!
最新文章
- escape,encodeURI,encodeURIComponent的区别
- 在QtCreator 2.1.0 下使用opencv231库加载图片并显示
- Flex小结
- 重构Web Api程序(Api Controller和Entity)续篇
- 详解SESSION与COOKIE的区别
- IBM DB2 For Linux安装指南(转)
- 【Todo】【读书笔记】大数据Spark企业级实战版 &; Scala学习
- Oracle定义常量和变量
- String类的使用 Part1
- OpenCL 第10课:kernel,work_item和workgroup
- 【树状数组】CSU 1811 Tree Intersection (2016湖南省第十二届大学生计算机程序设计竞赛)
- PC远程调试设备(转)
- C程序浅议
- 在Spring Boot中使用数据缓存
- STREAMING HIVE流过滤 官网例子 注意中间用的py脚本
- 解密JavaScript闭包
- 构建 Owin 中间件 来获取客户端IP地址
- [Tensorflow] Object Detection API - retrain mobileNet
- React对比Vue(02 绑定属性,图片引入,数组循环等对比)
- linux内核seq_file接口