腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
5
回答
Googlebot是用哪种编程
语言
编写
的(或任何其他高效的网络
爬虫
)?
、
有人知道谷歌机器人是用哪种编程
语言
编写
的吗? 或者,更普遍的是,高效的网络
爬虫
是用哪种
语言
编写
的?我见过很多Java
语言
,但在我看来,它不是最适合开发网络
爬虫
的
语言
,因为它产生了太多的开销(尝试使用Heritrix网络
爬虫
,它非常重)。
浏览 0
提问于2009-10-29
得票数 1
回答已采纳
1
回答
有没有一种方法可以用NCrawler提取特定的html标签信息
、
、
规格: Win7 64、VS 2010、.NET 4.0、NCrawler库 我正在写一个
爬虫
,它将从网上商店提取一些数据。应用程序可以很好地提取URL,我可以正确地导航到商店中的每一件商品。
浏览 0
提问于2014-11-30
得票数 0
3
回答
C
++网络
爬虫
、
、
、
我正在尝试并尝试制作一个最小的网络
爬虫
。我在很高的层次上理解了整个过程。那么进入下一层细节,程序如何“连接”到不同的网站来提取HTML?谢谢!
浏览 1
提问于2012-07-01
得票数 0
回答已采纳
3
回答
如何在ABOT
C
#网络
爬虫
中获取html输出页面?
、
我正在尝试用ABOT在
c
#.i中制作网络
爬虫
,我搜索了很多例子,并添加了ABOT网络
爬虫
。从那我只能得到日志输出而不是超文本标记
语言
页面输出。我想得到超文本标记
语言
页面输出only.because,超文本标记
语言
输出是超文本标记
语言
敏捷工具的输入。帮助我从ABOT网络
爬虫
在
C
#中获得超文本标记
语言
输出。谢谢。
浏览 4
提问于2013-09-12
得票数 5
1
回答
如何为我的网站编制索引
、
我刚刚遇到了Elastic Search,我已经完成了安装和示例索引以及搜索。现在我想把这个用在我的网站上。为此,如何为我的网站创建索引?我是否需要将整个网页内容存储为索引??
浏览 0
提问于2011-06-07
得票数 1
回答已采纳
3
回答
谷歌机器人信息?
、
、
有没有人知道更多关于谷歌网络
爬虫
(又称GoogleBot)的细节?我很好奇它是用什么写的(我自己做了几个
爬虫
,现在正准备做另一个),以及它是否能解析图像之类的东西。我假设它是这样做的,b/
c
images.google.com中的图像都被调整了大小。如果它都是用Python
编写
的,如果他们使用自己的库来做大多数事情,包括html/image/pdf解析,我也不会感到惊讶。也许他们不会这样做。也许它们都是用
C
/
C
++
编写
的。提前谢谢
浏览 1
提问于2010-04-14
得票数 0
回答已采纳
5
回答
如何将动态站点转换为可从CD演示的静态站点?
、
、
有没有人对
爬虫
有什么好的建议,可以处理像链接清理,flash,一些ajax,css等等?我知道机会很小,但我认为在我开始
编写
自己的工具之前,我应该在这里抛出这个问题。
浏览 3
提问于2008-09-22
得票数 9
回答已采纳
3
回答
非常简单的
C
++网络
爬虫
/蜘蛛?
、
我试图在
C
++中做一个非常简单的网页
爬虫
/蜘蛛应用程序。我一直在使用谷歌搜索一个简单的,以了解这个概念。我发现了这个: 然而,这是复杂的理解对我来说,因为我开始学习
C
++大约一个月前。
浏览 15
提问于2010-11-25
得票数 22
回答已采纳
2
回答
有效地搜索大量URL列表
、
、
、
我正在建立一个网络
爬虫
,它必须爬行数百个网站。我的
爬虫
保存了一个已经爬行的urls列表。每当
爬虫
要爬行一个新页面时,它首先搜索已经爬行的url列表,如果已经列出了,则
爬虫
跳到下一个url,以此类推。
爬虫
目前是用Python
编写
的。但我将把它移植到
C
++或其他更好的
语言
中。
浏览 5
提问于2016-06-23
得票数 0
回答已采纳
7
回答
哪些
语言
适合
编写
网络
爬虫
?
、
、
、
我有丰富的PHP经验,尽管我意识到PHP可能不是大型网络
爬虫
的最佳
语言
,因为进程不能无限运行。人们推荐的
语言
是什么?
浏览 1
提问于2010-09-08
得票数 3
回答已采纳
2
回答
带有最佳可定制
爬虫
和抓取器的建议
、
、
、
我相信
爬虫
是最好的方法吗?如果我的理解是正确的,请建议您是否有任何其他方法来获取信息,而不使用来自各种来源的
爬虫
。因为这非常耗费资源和时间。在选择
爬虫
之前,我应该考虑哪些因素。任何提供信息和研究因素的来源在创建
爬虫
或教育
爬虫
时都需要考虑,这将是很棒的。我更喜欢用java
编写
代码,但我可以用任何其他
语言<
浏览 0
提问于2010-11-11
得票数 0
2
回答
国家/地区/城市数据库
、
多
语言
意味着城市和国家的名称应该出现在当地
语言
上。 或者可能存在任何具有此功能的服务?
浏览 1
提问于2011-11-01
得票数 1
回答已采纳
2
回答
如何从dll调用向可视化界面提供反馈?
、
、
架构概述:我目前正在
编写
一个接口(UI),用于“调试”我
编写
的
爬虫
(或一组
爬虫
器)。每个
爬虫
都是一个.dll。
浏览 2
提问于2012-06-11
得票数 0
回答已采纳
1
回答
如何用Node.js创建一个网络
爬虫
?
、
、
我最近刚刚对搜索引擎的工作原理产生了兴趣,我发现它们使用的是“机器人”或“网络
爬虫
”。我立即开始想知道这些东西是如何工作的,我想要创建一个!那么,首先:如何
编写
一个从服务器请求页面的程序?如果你能用JavaScript给我一个简单的例子,那就太棒了(我用Node作为一种普通的脚本
语言
运行它)。接下来,有没有让我解释HTML的Node模块?如果我错了请纠正我,但我想它是这样做的.任何用
C
++、
C
或Python
语言
编写
的例子都是受欢迎的,尽管我更喜欢JS或Python<em
浏览 6
提问于2011-12-26
得票数 5
回答已采纳
1
回答
有一个流行的工具来抓取网络数据吗?
、
我正在做信息提取的工作,我需要一个工具从网页上抓取数据,windows中有流行的工具吗?
浏览 7
提问于2009-12-14
得票数 0
3
回答
检索包括嵌入对象的网页
、
我想取一个网页,包括图像,flash动画和其他嵌入式对象。实现这一目标的直接方法是什么?
浏览 1
提问于2010-04-19
得票数 2
5
回答
哪种
语言
最适合高效的网络
爬虫
?
、
我需要写一个网络
爬虫
,我需要哪种
语言
是性能最好的
语言
,比如内存和性能。 编辑:原名是“为速度和性能而优化的
语言
c
++或
C
#”
浏览 7
提问于2010-09-21
得票数 0
2
回答
编写
linux服务的最佳
语言
、
我想要创建一个
爬虫
扫描一个单一的网页,并给我一封电子邮件,以防有什么问题在页面上(该页面持有一些web服务器的状态/下降)。此外,
C
/
C
++不是一个选项。
浏览 0
提问于2013-02-05
得票数 0
回答已采纳
2
回答
C
# web和ftp爬网程序库
、
我需要一个库(希望是在
C
#中!)它作为web
爬虫
程序来访问HTTP文件和FTP文件。原则上,我喜欢阅读HTML,我想把它扩展到PDF,WORD等。
浏览 0
提问于2010-10-19
得票数 3
回答已采纳
2
回答
使用
C
# CLR比使用
C
#应用程序有什么优势吗?
、
、
、
为此,我在
C
#上
编写
了一个应用程序。这是我的错,但我今天第一次听说使用CLR,并在谷歌上做了一些研究。编辑:为了使问题更加清楚,我想知道在server内部使用
C
#与使用
C
#作为主要应用程序进行查询的比较。
浏览 4
提问于2013-10-22
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
编写Windows的语言可不仅有C/C+
使用VS 2015编写C语言程序步骤!
从C语言开始,教你如何编写游戏外挂
世界上第一个C语言编译器是怎么编写的?它为什么能够用C语言编写?
编写第一个C语言程序“hello world”
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券