在spider类中有三个方法可以初始化startRequests。可以对这些地方进行扩展。

    /**
* create a spider with pageProcessor.
*
* @param pageProcessor pageProcessor
*/
public Spider(PageProcessor pageProcessor) {
this.pageProcessor = pageProcessor;
this.site = pageProcessor.getSite();
this.startRequests = pageProcessor.getSite().getStartRequests();
} /**
* Set startUrls of Spider.<br>
* Prior to startUrls of Site.
*
* @param startUrls startUrls
* @return this
*/
public Spider startUrls(List<String> startUrls) {
checkIfRunning();
this.startRequests = UrlUtils.convertToRequests(startUrls);
return this;
} /**
* Set startUrls of Spider.<br>
* Prior to startUrls of Site.
*
* @param startRequests startRequests
* @return this
*/
public Spider startRequest(List<Request> startRequests) {
checkIfRunning();
this.startRequests = startRequests;
return this;
}

最新文章

  1. Python学习(3)变量类型
  2. ion torrent ion proton
  3. 关于c#字典key不存在的测试
  4. Qt学习之自定义窗口部件
  5. 最短路径算法之三——Bellman-Ford算法
  6. csdn搜索技巧
  7. 【 POJ - 1204 Word Puzzles】(Trie+爆搜|AC自动机)
  8. ArrayList/List 泛型集合
  9. HDU 5534 完全背包
  10. exgcd
  11. sublime插件不能使用,提示plugin_host has exited unexpectedly
  12. js根据ip自动获取地址(省市区)
  13. win10下VS2017配置GSL库
  14. django —— MVT模型
  15. 页面框架加载完自动执行函数$(function(){});
  16. openwrt用WEB刷固件型号不对问题强行处理
  17. platform_driver_probe 函数解析
  18. 开启Virtualization Technology
  19. sql删除数据库所有表
  20. (转)Linux-HA开源软件Heartbeat(配置篇)

热门文章

  1. appium===安卓SDK下载很慢的解决办法
  2. 各种排序算法的总结、比较与Java实现
  3. 【C++】复制构造函数
  4. python 判断平年还是闰年
  5. Vue cmd命令操作
  6. [BZOJ2151] 种树 贪心
  7. set注入
  8. Macaca 自动化录制工具uirecorder使用入门
  9. selenium 难定位元素,时间插件,下拉框定位,string包含,定位列表中的一个,技巧
  10. Java中byte与(16进制)字符串的互相转换