Scrapy框架: 基本命令
2024-10-07 16:44:39
1.创建爬虫项目
scrapy startproject [项目名称]
2.创建爬虫文件
scrapy genspider +文件名+网址
3.运行(crawl)
scrapy crawl 爬虫名称
# -o output 输出数据到文件
scrapy crawl [爬虫名称] -o zufang.json
scrapy crawl [爬虫名称] -o zufang.csv
4.check检查错误
scrapy check
5.list返回项目所有spider
scrapy list
6.view 存储、打开网页
scrapy view http://www.baidu.com
7.scrapy shell, 进入终端
scrapy shell https://www.baidu.com
8.scrapy runspider
scrapy runspider zufang_spider.py
最新文章
- (原创)ssm sql 例子(freemarker+jsp)
- WPF menu
- go 数据类型转换
- PHP内核探索之变量(6)- 后续内核探索系列大纲备忘
- php 二分查找
- SQL Server 用SQL语句查找某个表的触发器
- 安卓开发23:Service详细解读
- VirboxLM许可管理平台,一站式软件保护解决方案
- [JavaScript] canvas 合成图片和文字
- Windows 10 IoT Core 17115 for Insider 版本更新
- MFC 键盘响应
- Altium Designer重装后图标都变白板或都变一样的解决方法
- css3 animation 在某些浏览器中特别快 bugfix
- Java程序员必会英语单词
- flask模板应用-javaScript和CSS中jinja2
- Netty 学习资料
- 【LOJ#10131】暗的锁链
- 分布式缓存系统 Memcached 整体架构
- 整理之DOM事件阶段、冒泡与捕获、事件委托、ie事件和dom模型事件、鼠标事件
- 简单四步開始树莓派上的Docker之旅