抓取网站的代码实现很多,如果考虑到抓取下载大量内容scrapy框架无疑是一个很好的工具。Scrapy = Search+Pyton。下面简单列出安装过程。PS:一定要按照Python的版本下载,要不然安装的时候会提醒找不到Python。建议大家安装32位是因为有些版本的必备软件64位不好找。(我的是xp系统)

1.安装Python

安装完了记得配置环境,将python目录和python目录下的Scripts目录添加到系统环境变量的Path里。在cmd中输入python如果出现版本信息说明配置完毕(如下面截图)。python下载地址

2.安装lxml

lxml是一种使用 Python 编写的库,可以迅速、灵活地处理 XML。点击 这里选择对应的Python版本安装。验证是否安装成功,如下图。 
      
    
    3.安装setuptools

用来安装egg文件,点击 https://pypi.python.org/pypi/setuptools#using-setuptools-and-easyinstall 下载python2.7的对应版本的setuptools。

  设置环境变量:path中加入C:\Python27\Scripts

4.安装zope.interface

可以使用第三步下载的setuptools来安装egg文件,现在也有exe版本,点击这里下载。

5.安装Twisted

Twisted是用Python实现的基于事件驱动的网络引擎框架,点击这里下载。

备用地址:http://vdisk.weibo.com/s/yTKgWrhNCxDDM#_loginLayer_1480039489026

6.安装pyOpenSSL

pyOpenSSL是Python的OpenSSL接口,点击 这里下载。 
     
    7.安装win32py 
     
    提供win32api,点击 这里下载

8.安装Scrapy

终于轮到安装scrapy了,直接在cmd中输入easy_install scrapy回车即可。安装后在cmd命令行进行成功与否的验证如图所示。

安装完成,开始使用吧!

最新文章

  1. escape,encodeURI,encodeURIComponent的区别
  2. 在QtCreator 2.1.0 下使用opencv231库加载图片并显示
  3. Flex小结
  4. 重构Web Api程序(Api Controller和Entity)续篇
  5. 详解SESSION与COOKIE的区别
  6. IBM DB2 For Linux安装指南(转)
  7. 【Todo】【读书笔记】大数据Spark企业级实战版 & Scala学习
  8. Oracle定义常量和变量
  9. String类的使用 Part1
  10. OpenCL 第10课:kernel,work_item和workgroup
  11. 【树状数组】CSU 1811 Tree Intersection (2016湖南省第十二届大学生计算机程序设计竞赛)
  12. PC远程调试设备(转)
  13. C程序浅议
  14. 在Spring Boot中使用数据缓存
  15. STREAMING HIVE流过滤 官网例子 注意中间用的py脚本
  16. 解密JavaScript闭包
  17. 构建 Owin 中间件 来获取客户端IP地址
  18. [Tensorflow] Object Detection API - retrain mobileNet
  19. React对比Vue(02 绑定属性,图片引入,数组循环等对比)
  20. linux内核seq_file接口

热门文章

  1. Fiddler模拟POST请求
  2. 一个典型的flex布局,兼容性比较好
  3. Mac上安装Node和NPM【转】
  4. Jascript原型链以及Object和Function之间的关系
  5. cdlinux
  6. shell脚本,计算1+3+5....100等于多少?
  7. NoSQL 之 Morphia 操作 MongoDB
  8. WinPcap过滤串表达式的语法
  9. NOIP 成绩
  10. 使用Spring Cloud需要了解一些概念