Scrapy 提供了内置的 Telnet 终端,以供检查,控制 Scrapy 运行的进程。Telnet 仅仅是一个运行在 Scrapy 进程中的普通 Python 终端。因此你可以在其中做任何是。

Telnet 终端是一个自带的 Scrapy 扩展。该扩展默认为启用,不过你也可以关闭。

如何访问

Telnet 终端监听设置中定义的 TELNETCONSOLE_PORT,默认为 6023,访问 telnet 请输入:

telnet localhost 6023
>>>

Windows 及大多数 Linux 发行版都自带了所需的 telnet 程序。

telnet 终端中可用的变量

telnet 仅仅是一个运行在 Scrapy 进程中的普通 Python 终端。因此你可以做任何事情,甚至是导入新终端。

telnet 为了方便提供了一些默认定义的变量:

快捷名称 描述
crawler Scrapy Crawler (scrapy.crawler.Crawler 对象)
engine Crawler.engine属性
spider 当前激活的爬虫(spider)
slot the engine slot
extensions 扩展管理器(manager) (Crawler.extensions属性)
stats 状态收集器 (Crawler.stats属性)
settings Scrapy设置(setting)对象 (Crawler.settings属性)
est 打印引擎状态的报告
prefs 针对内存调试 (参考调试内存溢出)
p pprint.pprint 函数的简写
hpy 针对内存调试 (参考 调试内存溢出)     

Telnet console usage examples

查看引擎状态

在终端中你可以使用 Scrapy 引擎的 est() 方法来快速查看状态:

telnet localhost 6023
>>> est()
Execution engine status time()-engine.start_time : 8.62972998619
engine.has_capacity() : False
len(engine.downloader.active) : 16
engine.scraper.is_idle() : False
engine.spider.name : followall
engine.spider_is_idle(engine.spider) : False
engine.slot.closing : False
len(engine.slot.inprogress) : 16
len(engine.slot.scheduler.dqs or []) : 0
len(engine.slot.scheduler.mqs) : 92
len(engine.scraper.slot.queue) : 0
len(engine.scraper.slot.active) : 0
engine.scraper.slot.active_size : 0
engine.scraper.slot.itemproc_size : 0
engine.scraper.slot.needs_backout() : False

暂停,恢复和停止 Scrapy 引擎

#暂停:

telnet localhost 6023
>>> engine.pause()
>>> #恢复: telnet localhost 6023
>>> engine.unpause()
>>> #停止: telnet localhost 6023
>>> engine.stop()
Connection closed by foreign host.

Telnet 终端信号

scrapy.telnet.update_telnet_vars(telnet_vars)

在 telnet 终端开启前发送该信号。您可以挂载(hook up)该信号来添加,移除或更新 telnet 本地命名空间可用的变量。您可以通过在您的处理函数(handler)中更新 telnet_vars 字典来实现该修改。

参数: telnet_vars (dict) – telnet 变量的字典

Telnet 设定

以下是终端的一些设定:

TELNETCONSOLE_PORT

Default:[6023, 6073]

telnet 终端使用的端口范围。如果设为 None0, 则动态分配端口。

TELNETCONSOLE_HOST

默认: '127.0.0.1'

telnet 终端监听的接口(interface)。

最新文章

  1. mysql编码格式设置
  2. 高频sql语句汇总。不断更新。。
  3. VS编译器优化诱发一个的Bug
  4. Apache 配置参考
  5. 让git忽略文件模式的改变
  6. java基础之 switch
  7. c# 发送消息到Email
  8. cocos2d-x 详解之 CCLayer(触摸事件)
  9. Python PIL创建文字图片
  10. Chrome远程调试Android上Chrome的页面
  11. 基于Lucene3.5.0怎样从TokenStream获得Token
  12. Step one : 熟悉Unix/Linux Shell 常见命令行 (一)
  13. 安卓手机微信页面position: fixed位置错误
  14. caffe在windows编译project及执行mnist数据集測试
  15. 【转】高效利用Fundebug追踪Node.js日志发现问题
  16. jmeter启动报错
  17. Scrum冲刺阶段7
  18. js学习笔记--dom部分(一)
  19. CDN是如何工作的?
  20. https的名词解释

热门文章

  1. 第41章 RS-485通讯实验—零死角玩转STM32-F429系列
  2. l1,l2norm
  3. PEP8 常用规范
  4. Java +安卓 定时任务
  5. Chrome 调试工具的一些高阶功能
  6. Python 初始—(字符编码解码)
  7. 关于img底部空白
  8. GUI测试问题汇总
  9. Docker自学纪实(四)搭建LNMP部署wordpress
  10. 封装动态数组类Array