一般爬虫都是用urllib包,requests包 配合正则.beautifulsoup等包混合使用,达到爬虫效果,不过有框架谁还用原生啊,现在我们来谈谈SCRAPY框架爬虫,

现在python3的兼容性上来了,SCRAPY不光支持python2版本了,有新的不用旧的,现在说一下让很多人望而止步的安装问题,很多人开始都安装不明白,

当前使用的版本是PYTHON3.5,安装时用PIP3

安装步骤:

1 安装wheel

pip3 install wheel

2 安装twisted

pip3 install Twisted-17.9.0-cp35-cp35m-win_amd64.whl

3 安装lxml

pip3 install lxml-4.1.1-cp35-cp35m-win_amd64.whl

4 安装scrapy

pip3 install scrapy

这样你就成功的安装上了scrapy,你可以创建文件,但是你任然不可爬虫,一旦执行爬虫文件就会报错

5 安装pywin32

一路下一步就行

接着我们创建scrapy文件夹

进入运行环境为python3.5的文件路径,如果你的电脑同时安装2,3版本一定要注意问题。两个版本会出现环境冲突问题,一旦python3版本下的scrapy运行在python2下就会出现版本不兼容问题,就会出现NO MOUDLE的报错

路径切换到python3运行的环境:

scrapy startproject  filename

终端进入filename目录

scrapy genspider -t basic crawl1 webname.com

就会创建爬虫脚本文件

文件夹里几个文件我也就不介绍了,

我说下基本爬虫setting.py的应用

现在可以进行正常的爬取网页了

最新文章

  1. javascript 模式(1)——代码复用
  2. gen目录无法更新,或者gen目录下的R.JAVA文件无法生成
  3. mr的logs的查看
  4. [反汇编练习] 160个CrackMe之024
  5. Motan:目录结构
  6. Android Studio创建项目
  7. EasyUI datagrid 改变url属性 实现动态加载数据
  8. C# 反射之属性操作
  9. mybatis常用语句
  10. myeclipse中java文件头注释格式设置
  11. Codeforces 629D Babaei and Birthday Cakes DP+线段树
  12. 使用lamdba函数对list排序
  13. MS Sql Server 查询数据库中所有表数据量
  14. 数据库2.0改进e-r图
  15. Android UI-底部旋转菜单栏
  16. OFFLINE
  17. MongoDB DBA 实践7-----MongoDB的分片集群操
  18. 关于HttpURLConnection/HttpsURLConnection请求出现了io.filenotfoundexception:url的解决方法
  19. unity, EventType.MouseUp注意事项
  20. vue中echarts随窗体变化

热门文章

  1. Python笔记_第四篇_高阶编程_进程、线程、协程_4.协程
  2. CodeForces 382B 数学推导
  3. netty 百度网盘 密码
  4. ZJNU 1205 - 侦探推理——高级
  5. Photoshop和Halcon如何锐化彩色图像不伤其颜色
  6. Android studio 3.0安装与配置(看这一篇就够了)
  7. Golang 热编译rizla 插件
  8. mysql引擎与物理文件
  9. [ZJOI2019]麻将(DP+有限状态自动机)
  10. JDBC常用驱动和语法汇总