webmagic 初始化 startRequests
2024-10-09 22:25:22
在spider类中有三个方法可以初始化startRequests。可以对这些地方进行扩展。
/**
* create a spider with pageProcessor.
*
* @param pageProcessor pageProcessor
*/
public Spider(PageProcessor pageProcessor) {
this.pageProcessor = pageProcessor;
this.site = pageProcessor.getSite();
this.startRequests = pageProcessor.getSite().getStartRequests();
} /**
* Set startUrls of Spider.<br>
* Prior to startUrls of Site.
*
* @param startUrls startUrls
* @return this
*/
public Spider startUrls(List<String> startUrls) {
checkIfRunning();
this.startRequests = UrlUtils.convertToRequests(startUrls);
return this;
} /**
* Set startUrls of Spider.<br>
* Prior to startUrls of Site.
*
* @param startRequests startRequests
* @return this
*/
public Spider startRequest(List<Request> startRequests) {
checkIfRunning();
this.startRequests = startRequests;
return this;
}
最新文章
- Python学习(3)变量类型
- ion torrent ion proton
- 关于c#字典key不存在的测试
- Qt学习之自定义窗口部件
- 最短路径算法之三——Bellman-Ford算法
- csdn搜索技巧
- 【 POJ - 1204 Word Puzzles】(Trie+爆搜|AC自动机)
- ArrayList/List 泛型集合
- HDU 5534 完全背包
- exgcd
- sublime插件不能使用,提示plugin_host has exited unexpectedly
- js根据ip自动获取地址(省市区)
- win10下VS2017配置GSL库
- django —— MVT模型
- 页面框架加载完自动执行函数$(function(){});
- openwrt用WEB刷固件型号不对问题强行处理
- platform_driver_probe 函数解析
- 开启Virtualization Technology
- sql删除数据库所有表
- (转)Linux-HA开源软件Heartbeat(配置篇)