Nutch 2.2.1 在 Injector 工作后不会继续 [英] Nutch 2.2.1 doesnt continue after Injector job

查看:17
本文介绍了Nutch 2.2.1 在 Injector 工作后不会继续的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在学习 nutch 并尝试按照这个 教程 进行攀爬.我正在开发一个带有 bash shell 的 ubuntu 机器.但是当我运行脚本时,执行发生了,但之后没有任何反应,

I am learning nutch and trying to carawl as per this tutorial .I am working on an ubuntu machinewith bash shell. But when I run the script, the execution happens, but nothing happens after ,

InjectorJob: starting at 2014-03-23 09:28:50
InjectorJob: Injecting urlDir: urls/seed.txt

我已经等了几个小时,我尝试使用 sudo 运行相同的程序.出现同样的问题.我也尝试过使用教程中给出的默认网址.可能的错误是什么?

I have waited for hours, I tried running the same with sudo. The same issue occurs. I have tried with default urls given in the tutorial as well. What can be the probable errors?

推荐答案

我没有在 nutch-site.xml 中添加代理和端口详细信息,因为我是通过代理访问的.为 Ant 或 JVM 设置相同是不够的

What was missing was I didnt add Proxy and port details in the nutch-site.xml, as I was accessing through proxy. setting up the same for Ant or JVM is not enough

这篇关于Nutch 2.2.1 在 Injector 工作后不会继续的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆