腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
3
回答
高效
网络
爬虫
的
语言
建议
javascript
、
asynchronous
、
node.js
、
web-crawler
我正在寻找一种
语言
来编写一个
高效
的
网络
爬虫
。我所看重
的
东西:我试过node.js。Node
的
异步特性允许我在不处理线程
的
情况下并行地爬行许多urls。V8对于解析来说是很好
的
和快速
的
浏览 6
提问于2010-12-03
得票数 2
5
回答
Googlebot是用哪种编程
语言
编写
的
(或任何其他
高效
的
网络
爬虫
)?
web-crawler
、
googlebot
有人知道谷歌机器人是用哪种编程
语言
编写
的
吗? 或者,更普遍
的
是,
高效
的
网络
爬虫
是用哪种
语言
编写
的
?我见过很多Java
语言
,但在我看来,它不是最适合开发
网络
爬虫
的
语言
,因为它产生了太多
的
开销(尝试使用Heritrix
网络
爬虫
,它非常重)。
浏览 0
提问于2009-10-29
得票数 1
回答已采纳
1
回答
最有效
的
语言
来创建一个非常快
的
网络
爬虫
?
web-crawler
我正在创建一个新
的
网站,
建议
一个类别的链接。我需要快速扫描不同
的
网页。我应该使用哪种
语言
来创建一个
高效
的
网络
爬虫
?
浏览 1
提问于2014-02-19
得票数 0
5
回答
哪种
语言
最适合
高效
的
网络
爬虫
?
c#
、
c++
我需要写一个
网络
爬虫
,我需要哪种
语言
是性能最好
的
语言
,比如内存和性能。 编辑:原名是“为速度和性能而优化
的
语言
c++或C#”
浏览 7
提问于2010-09-21
得票数 0
1
回答
有没有一种方法可以用NCrawler提取特定
的
html标签信息
c#
、
.net
、
web-crawler
规格: Win7 64、VS 2010、.NET 4.0、NCrawler库 我正在写一个
爬虫
,它将从网上商店提取一些数据。应用程序可以很好地提取URL,我可以正确地导航到商店中
的
每一件商品。问题是,保存产品所有页面数据
的
每个“description”对象都是文本形式
的
,我想知道是否有办法从这个"propertyBag“中读取<-description> text <-/descriptopn>这样
的
特定标记
的
内容,或者有其他方法。
浏览 0
提问于2014-11-30
得票数 0
3
回答
如何在ABOT C#
网络
爬虫
中获取html输出页面?
c#
、
web-crawler
我正在尝试用ABOT在c#.i中制作
网络
爬虫
,我搜索了很多例子,并添加了ABOT
网络
爬虫
。从那我只能得到日志输出而不是超文本标记
语言
页面输出。我想得到超文本标记
语言
页面输出only.because,超文本标记
语言
输出是超文本标记
语言
敏捷工具
的
输入。帮助我从ABOT
网络
爬虫
在C#中获得超文本标记
语言
输出。谢谢。
浏览 4
提问于2013-09-12
得票数 5
1
回答
"web
爬虫
“、"web刮刀”、"DOM分析器“和"DOM解析器”
的
区别是什么?
web-scraping
、
web-crawler
"web
爬虫
“、"web刮刀”、"DOM分析器“和"DOM解析器”有什么区别?
浏览 6
提问于2022-10-31
得票数 0
1
回答
如果我为我
的
python脚本做了一个简单
的
gui,它会影响它
的
效率吗?
python
、
user-interface
、
tkinter
嗨,我想做一个网页
爬虫
,检查URL
的
数据,如果我做一个简单
的
Gui,使脚本更容易查找变量
的
数据,添加代码
的
gui会使我
的
网络
爬虫
效率降低吗? 我需要
爬虫
尽可能
高效
,能够尽可能快地处理数据。为这个Python脚本制作一个gui,会不会妨碍web
爬虫
的
性能?
浏览 3
提问于2015-01-27
得票数 0
回答已采纳
2
回答
C# web和ftp爬网程序库
c#
、
web-crawler
它作为web
爬虫
程序来访问HTTP文件和FTP文件。原则上,我喜欢阅读HTML,我想把它扩展到PDF,WORD等。 我对初学者
的
开源软件很满意,或者至少对文档
的
任何方向都很满意。
浏览 0
提问于2010-10-19
得票数 3
回答已采纳
2
回答
使用Jsoup遍历web
java
、
jsoup
我正在尝试使用Eclipse中
的
JSoup来遍历
网络
,查找大量关于国际足联世界杯
的
信息,以及每一届世界杯
的
球员和参赛国家。有谁能教我怎么做吗?
浏览 2
提问于2011-12-08
得票数 0
1
回答
软件/ API跟踪
网络
搜索中
的
新概念或想法
web-browser
、
search
、
search-engine
、
social-networks
、
google-search
是否有谷歌、Twitter或其他搜索引擎或社交
网络
的
软件或API来跟踪
网络
搜索中出现
的
或新
的
概念/想法(单词)或新组合,但不一定是“时髦
的
主题”?接受任何特定
的
网页
爬虫
,机器人,人工智能,新浏览器,API,软件,查询
语言
,图形软件等
的
建议
。
浏览 0
提问于2019-03-06
得票数 1
2
回答
Lucene
爬虫
(它需要建立lucene索引)
java
、
lucene
、
web-crawler
我正在寻找Apache Lucene
网络
爬虫
写在java,如果可能的话,或在任何其他
语言
。
爬虫
必须使用lucene并创建有效
的
lucene索引和文档文件,因此这就是nutch被排除
的
原因。有没有人知道这样
的
网络
爬虫
是否存在,如果答案是肯定
的
,我可以找到它。Tnx..。
浏览 0
提问于2009-10-16
得票数 1
回答已采纳
1
回答
是否有一个无处不在
的
网络
爬虫
可以生成一个良好
的
特定于
语言
的
数据集来训练一个转换器?
nlp
、
gpt
、
crawling
似乎有很多值得注意的人工智能工具正在接受由
网络
爬虫
生成
的
数据集
的
培训,而不是人工编辑
的
、人工编译
的
语料库(Facebook Translate,GPT-3)。一般来说,有一种自动和通用
的
方式生成数据集听起来更理想。 有没有任何无处不在
的
网络
爬虫
,它做
的
基本相同
的
事情,但有一个参数
的
“
语言
寻求”?换句话说,用X
语言
生成一个
浏览 0
提问于2021-11-18
得票数 0
13
回答
在“潜入python”之后会发生什么?
python
我一直想学一门比java更好
的
语言
。所以我开始尝试使用python。我已经读过了“潜入python”,所以我现在对python有了一个不错
的
了解。我听说python很适合
网络
爬行,但是我在dive into python中没有看到这一点。社区可以
建议
如何将我
的
pythong知识用于
网络
爬虫
或蜘蛛吗?
浏览 2
提问于2009-07-08
得票数 10
1
回答
用于
爬虫
应用
的
数据库系统
database
、
web-crawler
我在一个基于java
的
爬虫
上工作。我想在我
的
爬虫
恢复功能,用户可以在任何时候暂停
爬虫
,在他想要
的
情况下,
爬虫
崩溃
的
情况下,他应该能够开始从
爬虫
停止
的
点上一次爬行。为此,我必须在数据库中存储所有outlink (在任何页面找到
的
链接)。我不确定哪个数据库是最好
的
这类系统,因为它需要非常快
的
插入和检索
的
链接从数据库和频率插入和检索将非常高。很少有人<
浏览 2
提问于2012-01-06
得票数 1
回答已采纳
2
回答
您选择
的
多线程http下载应用程序
的
编程
语言
是什么?
multithreading
、
http
、
proxy
、
web-crawler
、
multiprocessing
我渴望学习一种新
的
编程
语言
。在多线程mannerinteracts中,下载数百万个URL,其中包含某种类型
的
DB来存储已下载
的
数据。注意:,我会偶尔更新这篇文章,包括每个人最好
的
答案。
浏览 2
提问于2011-01-06
得票数 2
回答已采纳
1
回答
仅带prerender.io客户端
的
Prerender 7 SPA
angular
、
seo
、
angular6
、
angular7
、
prerender
我有一个Angular 7应用程序,我正在尝试预先渲染页面以支持
网络
爬虫
/ SEO。我决定使用prerender.io来帮助这些
爬虫
预先渲染、缓存和提供静态超文本标记
语言
,但是我很难在我
的
Angular 7应用程序中安装它们
的
中间件。根据their docs
的
说法,我可以安装一个中间件,当
网络
爬虫
发出页面请求时,它会检测到,并将请求重定向到预渲染服务器。然而,我发现
的
所有示例都涉及到修改一些后端节点服务器。
浏览 19
提问于2019-02-26
得票数 1
回答已采纳
1
回答
Web Crawler
的
功能
java
、
open-source
、
web-crawler
网络
爬虫
是否只从网页中返回提取
的
文本?例如,如果web服务器中也存储了一些pdf/doc文件。
网络
爬虫
可以爬行它们并返回它们
的
内容吗?不管怎样,对于一个好
的
开源Java
网络
爬虫
有什么
建议
呢? 谢谢!
浏览 2
提问于2011-06-26
得票数 0
回答已采纳
1
回答
如何使用
网络
爬虫
从flv文件中提取内容?
parsing
、
flv
、
web-crawler
、
nutch
我
的
要求是从flv文件中提取文本和音频。请
建议
我如何使用任何
网络
爬虫
来实现这一点。如果这是不可能与
网络
爬虫
,请
建议
我任何其他工具。 谢谢你
浏览 0
提问于2013-05-14
得票数 0
回答已采纳
2
回答
无法识别附加
的
h1标记
javascript
、
jquery
、
html
、
seo
jquery添加了h1标记,如下所示:h1标记和标记
的
内容显示得很好,但是当我在各种seo工具(例如这个:)中测试我
的
页面时,我得到
的
消息是页面没有h1标记。从搜索引擎优化
的
角度来看,这当然不是那么好。有人认识这个问题吗?</div>"
浏览 2
提问于2013-04-15
得票数 2
回答已采纳
点击加载更多
相关
资讯
Go语言网络爬虫的接口设计
Go语言网络爬虫概述
R语言网络爬虫经验
Go语言网络爬虫调度器的实现
聊聊 Python 的应用-健壮高效的网络爬虫
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
腾讯会议
活动推荐
运营活动
广告
关闭
领券