腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
如何
使用
Jsoup
对
数据
进行
web
抓取
、
q=handsworth我想知道我将
如何
从它的网络刮图像,标题和描述,因为下面的代码,我能够获得网页的标题。StringBuilder newsContent = new StringBuilder(); Document page =
Jsoup
.connect
浏览 17
提问于2021-01-30
得票数 0
2
回答
以编程方式设置已解析的
jsoup
网页的值
、
我
使用
JSOUP
解析了页面,并了解了输入文本字段。我
使用
了以下代码: for (Iterator<Element> iterator = elements.iterator
浏览 7
提问于2013-08-16
得票数 0
回答已采纳
1
回答
使用
Selenium和Java从网站中
抓取
数据
、
我试图刮
数据
从板球网站,并已经写了一个方法,接受一个球员的名字,并显示他们的相应
数据
。 如果您看到此方法,则取一个播放机名称并显示其所有
数据
。我的要求是显示所有球员的完整记分卡,而不是只显示一个球员的
数据
。
浏览 0
提问于2020-03-04
得票数 0
6
回答
读取JSON内容
、
、
我正在
使用
jsoup
来
抓取
一些HTML
数据
,它工作得很好。现在我需要提取一些JSON内容(只提取JSON,不提取HTML)。我能用
jsoup
很容易做到这一点吗?还是必须用另一种方法来做?
jsoup
执行的解析是
对
JSON
数据
进行
编码,因此它不能
使用
Gson正确解析。
浏览 2
提问于2011-06-15
得票数 17
回答已采纳
2
回答
用
Jsoup
初学者
抓取
网站
、
、
、
、
我正在尝试
使用
jsoup
来
抓取
一个网站。我
使用
源超文本标记语言中的".eventTableRow“类将表行提取到Elements对象中,但我不确定
如何
访问单个单元格。我正在尝试获取单元格中的
数据
,如下图中用框突出显示的
数据
:System.out.println(row); //prints,
对
我来说很难理解,我也找不到任何基本的教程。学
浏览 1
提问于2013-06-09
得票数 0
1
回答
如何
使用
Jsoup
登录网站
进行
web
抓取
、
、
我有问题,登录到网站
使用
jsoup
。 我几乎什么都试过了。阅读不同的博客/教程,但都没有帮助。以下是我到目前为止编写的代码 Connection.Response res =
Jsoup
.connect(url) .execute(); Connection.Response login =
Jsoup
.connect(url)""
浏览 12
提问于2019-04-18
得票数 0
1
回答
Groovy中的爬虫(
JSoup
与Crawler4j)
、
、
我希望在Groovy中开发一个
web
爬虫(
使用
Grails框架和MongoDB
数据
库),它能够
抓取
网站,创建站点URL及其资源类型、内容、响应时间和重定向次数的列表。我正在就
JSoup
对
Crawler4j的问题
进行
辩论。我读过他们的基本做法,但我不明白两者之间的区别。有人能建议哪一个更适合上面的功能吗?或者将两者
进行
比较是完全不正确的? 谢谢。
浏览 2
提问于2014-06-23
得票数 8
回答已采纳
3
回答
Web
抓取
只有一半的时间可以
使用
Jsoup
、
、
我最近一直在尝试
使用
Java
Jsoup
库,试图更好地理解
web
抓取
(从网站上提取
数据
)。但看起来我拼凑起来的代码只在部分时间内实现了功能。是我的代码有问题,还是有可能某些站点有措施来阻止
web
抓取
?下面是完成所有“魔术”的类:import org.
jsoup
.*;
浏览 1
提问于2011-08-11
得票数 0
1
回答
如何
抓取
不在html源中但在浏览器中可见的
数据
?
、
、
、
、
我想要的
数据
在浏览器中是可见的,但我无法从html源代码中找到它。我怀疑
数据
是由脚本生成的。我想
对
这样的
数据
进行
评分。可以
使用
Jsoup
吗?我知道
Jsoup
不会执行Javascript。以学院为例,我想要
抓取
学院和学校下的所有学院和学校。我想要获取所有学院和学校下的学院和学校。
浏览 0
提问于2012-12-02
得票数 0
回答已采纳
10
回答
使用
Java
进行
Web
抓取
、
、
我找不到任何好的基于Java的
web
抓取
API。我需要
抓取
的站点也不提供任何API;我想
使用
一些pageID遍历所有网页,并在它们的DOM树中提取HTML标题/其他内容。除了网络
抓取
之外,还有其他方法吗?
浏览 1
提问于2010-07-08
得票数 72
回答已采纳
1
回答
Selenium Chrome错误:您
使用
的是不受支持的命令行标志:--忽略证书错误
、
、
、
、
好的,我正在学习
Web
抓取
,并且
对
Java很满意,所以我选择了
Jsoup
,这是一个
web
抓取
库。我计划
抓取
(这只是一个编码问题),但我发现很难
抓取
所有显示的内容,这是不可能的,因为大部分内容是动态源。因此,我
使用
selenium来呈现JavaScript并获得简单的HTML页面,然后将其提供给
JSOUP
。因此,我尝试打印呈现的HTML页面以
进行
验证,但在运行代码时会出现以下错误:
浏览 1
提问于2018-03-03
得票数 4
1
回答
Jsoup
抓取
网站
数据
麻烦
、
对
Java和
Jsoup
来说是全新的。我正在尝试创建一个简单的程序,它可以在
web
上
抓取
数据
,并在Java中提供股票市场的
数据
。我想从道琼斯股票开始,让它打印52周的区间
数据
。我知道错误: 线程“主”org.
jsoup
.select.Selector$SelectorParseException:中的异常无法解析查询'table.W(100%)':意外令牌在'(100%)‘我
如何
使这个代码工作?我首先从苹果
浏览 2
提问于2016-11-25
得票数 0
回答已采纳
1
回答
使用
Jsoup
对
YouTube页面
进行
抓取
、
、
我正在尝试刮YouTube视频流页面以获取视频的元
数据
。我以这 YouTube页面为例。为此,我
使用
了
Jsoup
(一个Java解析器)。我得到了我想要的内容,但我只想知道这是正确的方法吗?public VideoData getVideoData(String videoUrl) throws IOException { Document doc =
Jsoup
.connect(
浏览 0
提问于2018-03-06
得票数 0
回答已采纳
4
回答
外部库是否会使应用程序变慢?
、
、
、
我正在构建一个从网页上
抓取
信息的应用程序。为此,我选择
使用
名为的html刮板,因为它
使用
起来非常简单。
Jsoup
也依赖于Apache Commons Lang libray。因此,
Jsoup
将用于下载页面并
对
其
进行
解析。 我的问题是,
使用
这些简化库,而不是
使用
Androids内置库,是否会使我的应用程序变慢?(在下载
数据
和解析方面)。我在想,内部库应该针对Android
进行
优化。
浏览 14
提问于2010-08-11
得票数 5
回答已采纳
1
回答
如何
通过servlet获取
web
浏览器上的html代码?
、
、
我需要
使用
JSoup
获取html。我现在有: .connect("http://~~~")问题:动态网站,网页延迟加载图像当我通过
jsoup
连接到站点时,该站点代码& resource & html还没有完成。延迟加载图像:未完成代码-> ~/White.png更改为已完成代码-> something.png
如何</e
浏览 5
提问于2016-02-17
得票数 0
回答已采纳
3
回答
如何
在GWT中
使用
外部服务器端jar?
、
、
我想在GWT服务器端代码上
使用
jSoup
,以便能够
抓取
网页。GWT的文档
对
安装外部jars没有帮助。谁能告诉我
如何
在
jSoup
中安装GWT (从官方
jSoup
站点下载)并在服务器端代码中
使用
它?
浏览 1
提问于2013-01-09
得票数 5
回答已采纳
1
回答
Android:解析webservices响应并存储在本地变量中
、
、
在我的
web
服务程序中,我将以字符串值的形式获得
对
logcat的响应。如果成功,则值为1;如果失败,则值为0;如果字段为空,则值为-1。{} {} 显示警报是多么容易,但由于我是
web
服务的新手,我不知道
如何
解析结果并将其存储在局部变量中。
浏览 0
提问于2011-06-30
得票数 1
回答已采纳
2
回答
android:
使用
webview仅显示页面的一部分
、
(这部分包含我想要显示的网页上的
数据
框架)提前感谢!
浏览 5
提问于2012-05-17
得票数 0
2
回答
如何
检查网页是静态的还是动态的
、
、
我正在做一些
web
抓取
和
使用
Jsoup
来解析html文件,我的理解是
Jsoup
不能很好地处理动态网页。有没有一种方法可以检查网页是否是动态的,这样我就不用费心
使用
Jsoup
来解析它了?
浏览 0
提问于2015-08-02
得票数 1
1
回答
从html <body>元素中
抓取
数据
、
、
、
我正在
使用
JSoup
,这是一个纯Java的超文本标记语言解析器库,用来从互联网上拉取和解析纯超文本标记语言页面(好吧,
使用
非常少的JS)。到目前为止,如果我想要
抓取
的
数据
被附加到一个非常冗长的HTML元素(如<a href="...."我可以很容易地在
JSoup
中获得<body>标记,但是这个标记中的文本通常是乱七八糟的,并且不可能在我需要
抓取
的许多网页(大约250个左右)中概括它里面的内容。所以我的问题是,我
如何
浏览 0
提问于2015-05-06
得票数 1
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券