Nutch的喷油器后爬行停止。 [英] nutch crawling stops after injector.

查看:181
本文介绍了Nutch的喷油器后爬行停止。的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

这是我的cygwin的屏幕看起来...

  cygpath:不能转换空路径
喷油器:开始于2014年5月15日十六点57分50秒
喷油器:crawlDb:-dir / crawldb
喷油器:urlDir:网址
喷油器:转换注入的网址抓取数据库条目。
修补程序HADOOP-7682:解决方法实例化文件系统
喷油器:由过滤器拒绝的网址总数:1
喷油器:规范化和过滤后,注入的网址总数:0
注射:注射合并到的URL抓取分贝。
喷油器:覆盖:假的
喷油器:更新时间:假的
喷油器:收于2014年5月15日16时57分52秒,经过:00:00:02


解决方案

注入的网址总数为0,即没有什么抓取。

 喷油器:由过滤器拒绝的网址总数:1
喷油器:规范化和过滤后,注入的网址总数:0

here is my cygwin screen looks...

cygpath: can't convert empty path
Injector: starting at 2014-05-15 16:57:50
Injector: crawlDb: -dir/crawldb
Injector: urlDir: urls
Injector: Converting injected urls to crawl db entries.
Patch for HADOOP-7682: Instantiating workaround file system
Injector: total number of urls rejected by filters: 1
Injector: total number of urls injected after normalization and filtering: 0
Injector: Merging injected urls into crawl db.
Injector: overwrite: false
Injector: update: false
Injector: finished at 2014-05-15 16:57:52, elapsed: 00:00:02

解决方案

Total number of urls injected is 0. That is nothing to crawl.

Injector: total number of urls rejected by filters: 1
Injector: total number of urls injected after normalization and filtering: 0

这篇关于Nutch的喷油器后爬行停止。的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆