[scrapy] spider object has no attribute '_rules'
2024-10-19 02:18:31
这是因为__init__方法没有继承父类
解决办法:
# -*- coding:utf-8 -*-
from selenium import webdriver
from scrapy.contrib.spiders import CrawlSpider, Rule
from scrapy.contrib.linkextractors import LinkExtractor
from sina_comment.items import SinaCommentItem
import re class MySpider(CrawlSpider): name = "sina"
#设置下载延时
download_delay = 2
allowed_domains = ['ent.sina.com.cn']
#第一篇文章地址
start_urls = ['http://ent.sina.com.cn/'] rules = [
Rule(LinkExtractor(allow=('http://ent.sina.com.cn/.*shtml')), callback='parse_item'),
]
def __init__(self,*args, **kwargs):
super(MySpider, self).__init__(*args, **kwargs) # 这里是关键
self.driver = webdriver.Chrome()
def parse_item(self, response):
self.log('Hi, this is an article page! %s' % response.url)
try:
self.driver
最新文章
- JavaEE学习文章汇总-ssm框架
- 浩瀚PDA开单器-结束手工开单模式【百货、商超】PDA安卓智能手持POS 进销存管理系统移动收银管理软件
- 编译原理 LL1文法First集算法实现
- Eclipse 常用整理
- nodejs学习笔记<;六>;文件处理
- UIkit框架之Uivew
- python27+django1.9添加api
- 定位表的数据块并且dump出来
- 学习:java设计模式—工厂模式
- How to center a div in bootstrap3
- (原)error LNK2038: 检测到“_ITERATOR_DEBUG_LEVEL”的不匹配项: 值“0”不匹配值“2”
- OC中的类型强制转换
- lambda表达式中的排序问题
- 【原创】大叔问题定位分享(17)spark查orc格式数据偶尔报错NullPointerException
- HBase读取与写入流程
- Hadoop记录-Hadoop监控指标汇总
- 记账本微信小程序开发六
- C# ValueTuple 原理
- WINAPI实现简易扫雷游戏
- Eclipse_设置_01_自动提示