crawlscrapy简单使用方法

1.创建项目:
scrapy startproject 项目名
例如:
scrapy startproject wxapp

windows下,cmd进入项目路径例如
d:\pythonCode\spiderProject>scrapy startproject wxapp
将创建项目名为 wxapp

2.使用命令创建一个爬虫:
scrapy genspider 爬虫名称 需要爬取的网址
scrapy genspider -t crawl wxapp_spider "wxapp-union.com"

注意:爬虫名称不能和项目名相同
进入项目目录
d:\pythonCode\spiderProject>cd wxapp
创建爬虫
d:\pythonCode\spiderProject\wxapp>scrapy genspider -t crawl wxapp_spider "wxapp-union.com"

命令执行后将在d:\pythonCode\spiderProject\wxapp\wxapp\spiders\下,生成wxapp_spider.py

3.修改wxapp_spider.py文件

最新文章

  1. bootstrap之强调文本的类(带颜色)
  2. 再谈this
  3. Elasticsearch及java客户端jest使用
  4. centos 单独安装PHP的mysql和mysqli扩展
  5. 黄聪:PHP json_encode中文乱码解决方法
  6. MFC获取文本框字符串
  7. SQL2005/8数据库提示单个用户无法操作的解决方法
  8. 【转】Cocos2d-x 2.0 拖尾效果深入分析
  9. oracle系列索引
  10. Jacob - Outlook
  11. linux下编译原理分析
  12. python多线程--theading模块
  13. MyBatis浅尝笔记
  14. 报错 'dict' object has no attribute 'has_key'
  15. bzoj 4556 字符串
  16. 20165237 2017-2018-2《Java程序设计》课程总结
  17. 最近公共祖先(LCA)的三种求解方法
  18. python中元组与数组的区别
  19. RESTframework简介
  20. java 模拟发送post请求测试

热门文章

  1. 架构视角 - DDD、TDD、MDD领域驱动、测试驱动还是模型驱动?
  2. 「SAP技术」SAP HU上面的'Obj.to Which HU Belongs'栏位初探
  3. iOS中点击按钮复制指定内容
  4. docker-compose 使用自定义网络并绑定 IP
  5. Rewrite基本概述
  6. python xlwt写入excel操作
  7. last.jenkins 其他 一些知识点
  8. 201871010113-刘兴瑞《面向对象程序设计(java)》第十周学习总结
  9. BoW算法及DBoW2库简介(二)
  10. Codeforces Round #594 (Div. 2) B. Grow The Tree 水题