【Nutch2.2.1基础教程之1】nutch相关异常 分类: H3_NUTCH 2014-08-08 21:46 1549人阅读 评论(2) 收藏
2024-10-01 21:03:29
1、在任务一开始运行,注入Url时即出现以下错误。
InjectorJob: Injecting urlDir: urls
InjectorJob: Using class org.apache.gora.hbase.store.HBaseStore as the Gora storage class.
InjectorJob: java.lang.RuntimeException: job failed: name=[20140000]inject urls, jobid=job_local1629320149_0001
at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54)
at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233)
at org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:251)
at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:273)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:282)
at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:54)
at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:233)
at org.apache.nutch.crawl.InjectorJob.inject(InjectorJob.java:251)
at org.apache.nutch.crawl.InjectorJob.run(InjectorJob.java:273)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:65)
at org.apache.nutch.crawl.InjectorJob.main(InjectorJob.java:282)
原因是regex-urlfilter.txt配置错误
版权声明:本文为博主原创文章,未经博主允许不得转载。
最新文章
- 学习和研究下unity3d的四元数 Quaternion
- Visual Studio 选择相同变量高亮
- Java并发编程核心方法与框架-CompletionService的使用
- apt-get -y install中的-y是什么意思?
- C#的编译
- Android InputMethodManager输入法简介
- Java 之文件IO编程 之读取
- 错误:类Byte是公共的,应在名为Byte.java 的文件中声明public class Byte{}一个错误
- sqlit使用要点之引入libsqlite3.dylib
- Git和Github的配合使用
- web前端面试集锦(自己搜集的,如有错误请不吝赐教)
- 模型的元数据Meta -- Django从入门到精通系列教程
- 10.app后端选择什么开发语言
- TeXstudio+TexLive交叉引用
- 四:(之八_Linux压力测试工具stress)Dockerfile语法梳理和实践
- Linux 下监控用户最大进程数参数(nproc)是否到达上限的步骤:
- 五、secureCRT远程连接工具的使用
- synchronized(四)
- 20135337朱荟潼 Linux第八周学习总结——进程的切换和系统的一般执行过程
- Bootstrap FileInput中文API整理