腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
可以找到或加载主类org.apache.
nutch
.crawl.InjectorJob
、
、
我正在与Hadoop、Cloudera和HBase一起
使用
Linux。以下命令给出了错误: src/bin/
nutch
inject
浏览 4
提问于2015-03-09
得票数 8
1
回答
无法在MongoDb中删除集合中的记录
我
使用
mongodb执行以下命令产出: local 0.078GBdb.
nutch
.remove
浏览 2
提问于2015-01-28
得票数 2
回答已采纳
1
回答
Apache
Nutch
不公开其API
、
、
我正在尝试
使用
Apache
Nutch
1.x Rest API。我
使用
docker镜像来设置
Nutch
和Solr。您可以在中查看演示存储库当我<e
浏览 20
提问于2021-06-12
得票数 3
回答已采纳
1
回答
如何修复纳奇爬虫中已经存在的.locked?
我是
nutch
的初学者。当我
使用
bin/
nutch
爬行命令重新搜索时,已经存在一个.locked错误。 /home/crawler_user/apache-
nutch
-1.14/bin/
nutch
反向链接/数据/爬虫_user/
nutch
/crawler data/LinkDb /data/crawler_user/<em
浏览 1
提问于2019-04-23
得票数 0
2
回答
Nutch
显示以下错误,该怎么办?
enter code here Exception in thread "main但是当我从终端运行
nutch
时,它显示 用法:
nutch
-core命令 其中COMMAND是以下命令之一: 抓取intranets的一步爬虫 等等…… 请告诉我该怎么做 嘿Tejasp我照你说的做了,我修改了
NUTCH
_HOME=/
nutch
/runtime/l
浏览 0
提问于2012-04-22
得票数 0
1
回答
本地Eclipse中的Apache
Nutch
1.9将在Amazon EMR上远程运行
、
、
、
、
我
使用
的是32位Windows 8,运行的是Eclipse Juno。我现在正在尝试从我的Eclipse内部运行Apache
Nutch
1.9。我做了Ant构建来创建
Nutch
Eclipse项目,并且我正在成功地在Eclipse工作区中导出。您能指导我如何让我的Apache
浏览 2
提问于2015-04-20
得票数 0
3
回答
Nutch
+ HBase: hbase版本问题和java异常
、
、
、
、
我正在尝试
使用
HBase 0.94.14在Debian Squeeze上安装
Nutch
2.2.1。我仔细阅读了
Nutch
1和
Nutch
2教程以及各种文档。/
nutch
inject /root/
nutch
/apache-
nutch
-2.2.1/urls/InjectorJob
使用
strace -f,
浏览 3
提问于2014-11-27
得票数 0
2
回答
更新
Nutch
索引的最好方法是什么?
、
、
我已经有一年左右没有关注
Nutch
了,它看起来已经发生了很大的变化。关于重新爬行的文档并不清楚。更新现有
Nutch
索引的最佳方式是什么?
浏览 0
提问于2009-03-12
得票数 1
回答已采纳
1
回答
在hadoop模式下运行
nutch
时,
nutch
gora类不会
、
、
当我尝试的时候我收到以下错误...13
浏览 7
提问于2013-07-09
得票数 0
2
回答
我是用
Nutch
1x还是2x加弹力搜索?
、
几年来,我一直
使用
Nutch
1.10将数据索引到Elasticsearch中。不久前,我决定开始
Nutch
和ES更新版本的升级过程。经过大量的谷歌搜索,人们似乎越来越多地
使用
Nutch
2.x,尽管看起来
Nutch
1.x速度更快,开发更加活跃。似乎在
Nutch
1.10之后,在ES中
使用
Nutch
1x也变得更加困难。看起来最大的区别在于,您可以
使用
Nutch
2.x将爬行的数据存储到不同的数据库中。
浏览 2
提问于2018-01-19
得票数 1
回答已采纳
1
回答
纳奇没有正常工作
、
、
大家好,我是
Nutch
的网络爬虫新手,我遵循的步骤,在终端中输入了命令其中urls有种子文件,包含网站名
浏览 1
提问于2016-01-09
得票数 0
1
回答
Nutch
/Hadoop: regex-Normize.xml和regex-urlfilter.txt找不到错误,即使它们存在
、
、
我正在尝试通过eclipse运行
nutch
和hadoop,并按照几个教程进行了设置。org.apache.hadoop.conf.Configuration - regex-normalize.xml not found 4473 [LocalJobRunner Map Task Executor #0] WARN org.apache.
nutch
.net.urlnormalizer.regex.RegexURLNormalizer4477 [LocalJobRunner Map Task Executor #0] DEBUG org.apache.<em
浏览 13
提问于2019-11-08
得票数 0
回答已采纳
1
回答
Apache
Nutch
-路径问题
、
、
我正在尝试设置Apache
Nutch
抓取URL,遵循指南。作为一个较老的指南(该指南适用于1.x版,我
使用
的是2.3版),我对结构进行了必要的更改。但是,当我尝试运行爬网时,我得到以下错误:/usr/local/<
浏览 0
提问于2015-11-15
得票数 9
1
回答
在ubuntu中
使用
nutch
1.4
、
、
我尝试在ubuntu中
使用
nutch
1.4 crawler,但是当我尝试
使用
nutch
wiki中建议的所有设置来执行nutcg时,它给出了这个错误:bin/
nutch
crawl urls -dir crawl -depth 1 bin/
nutch<
浏览 2
提问于2012-03-12
得票数 0
回答已采纳
1
回答
在哪里可以找到
nutch
.war文件?
、
、
Q-1)我试图通过在eclipse ant中运行
nutch
文件夹来构建'build.xml‘,但不幸的是,我在工作场所找不到
nutch
.war。Q-2)我在某处读到,最好从
Nutch
爬行,然后通过Solr进行搜索。因此,我将Solr集成到了
Nutch
中。这是否意味着我将看到一个新的Solr替代搜索UI,而不是
Nutch
搜索UI,或者它是否与
Nutc
浏览 0
提问于2012-07-09
得票数 0
回答已采纳
2
回答
如何
使用
Apache抓取特定的网站?
、
i已经在url下面完成并成功地完成了逐步实现:反向链接。 我对这个技术很陌生,
浏览 5
提问于2016-01-12
得票数 0
回答已采纳
1
回答
如何调用带位置参数的bash脚本?
、
我有一个脚本,它将
使用
下面的命令执行,bin/
nutch
-脚本文件爬网、urls、/data/测试/-参数-dir - Option我有下面的代码来执行它,但是它没有传递位置参数, path="/home/vel/vel-home/scripting/apache-
nutch
-1.6/bin&qu
浏览 0
提问于2013-04-11
得票数 0
回答已采纳
1
回答
无法启动
Nutch
爬行
、
、
、
、
我试图在Ubuntu14.04上部署
Nutch
2.3+ ElasticSearch 1.4 + HBase 0.94,遵循这个。当我尝试开始爬行时,注入urls:我得到:
nutch
-site.xml <property> <name>h
浏览 6
提问于2017-10-12
得票数 0
1
回答
Nutch
:在Java中调用,而不是命令行?
、
、
是我太胖了,还是真的没有办法通过一些Java代码以编程方式调用Apache
Nutch
?关于如何做到这一点的文档(或指南或教程)在哪里?谷歌让我失望了。所以我真的试过Bing。(另外,如果
Nutch
是一个垃圾,还有没有其他用Java编写的爬虫,在互联网规模上被实际文档证明是可靠的?)
浏览 4
提问于2011-03-24
得票数 8
回答已采纳
1
回答
Apache
Nutch
2.3 ant运行时构建失败[找不到符号]
、
下面的教程是:sudo ant runtimeBuild Failed/
nutch
/apache-
nutch
-2.3/src/java/org/apache/
nutch
/webui/service
浏览 3
提问于2019-09-17
得票数 1
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Nutch重要命令使用说明
手把手教你写网络爬虫3:开源爬虫框架对比
分享7款开源的全文搜索引擎!
大数据开发工程师
个人博客
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券