在android中使用jsoup获取html的脚本标签信息_在Android中使用Jsoup隐藏HTML标签_使用Jsoup解析android中的HTML - 腾讯云开发者社区

、

我试图从网页中获取一些数据(html标签)，但我就是做不到，因为某些原因，我只得到了一些空标签。这是网址：这是我的java代码： import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; class xyz{ public static void main (String[] args) throws IOException { Document doc = jsoup.connect("http://www.miamidade.gov/tran

浏览 1提问于2011-07-11得票数 0

1回答

如何从android服务中完整地读取包含javascript的站点？

、、、、

我正在尝试从包含java脚本的网站读取节点。在VB .NET中，我只使用了以下代码： Dim listSpan As IHTMLElementCollection = bodyel.getElementsByTagName("span") For Each spanItem As IHTMLElement In listSpan If spanItem.className & "" = "span_name" Then

浏览 1提问于2014-02-11得票数 0

1回答

jsoup connect函数不获取html代码

、

我已经在android中实现了jsoup。Jsoup.connect()正确地获取了站点"“的html内容，但没有获取url "”的任何内容。我想从www.karnatakatourism.org的html页面中存在的链接中获取数据。有谁可以帮我？?

浏览 0提问于2014-01-31得票数 0

3回答

用Android进行Jsoup解析

、、

我试图用Jsoup库解析html。然而，我没有得到我想要的。我想把标签<pre>的全部文字带到移动设备的屏幕上。请告诉我，我怎样才能从网上得到这篇文章？我要怎么修理？网站： package com.example.devanswers; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import android.app.Act

浏览 1提问于2013-08-24得票数 2

回答已采纳

3回答

Libgdx:如何在标签中显示HTML文本？

、、、

我有一个这样的字符串： "noun<br> an expression of greeting <br>- every morning they exchanged polite hellos<br> <font color=dodgerblue> ••</font> Syn: hullo, hi, howdy, how-do-you-do<be>" 希望在标签中将其显示为富文本。例如，文本必须转到下一行，而不是<br>标签。在Android中，我们可以这样做： Html.fromHt

浏览 27提问于2021-03-30得票数 1

3回答

Java-使用JSoup创建动态网站

、、

我想用JSoup刮一个网站。这个网站是动态的，大约每秒更新一次。我很确定它使用了JQuery，它更新了HTML语言中的一些标签。我使用的是JSoup，但是动态区域是空白的。JSoup有什么特别的方法来解决这个问题吗？或者这是一种限制？编辑:我计划把这个放到我网站上的Java applet中。

浏览 2提问于2013-02-11得票数 3

1回答

Android -在android_asset html文件中使用Jsoup

、

好的，我一直在使用Jsoup来解析来自远程urls的html，使用： Jsoup.connect(url).timeout(20000).get(); 我现在正在尝试读取存储在assets文件夹中的本地html文件。我已经做了很多搜索，但我找不到解决方案。在上，他们说要执行以下操作： File input = new File("/tmp/input.html"); Document doc = Jsoup.parse(input, "UTF-8", "http://example.com/"); 根据我所读到的内容，我的文件的路径是- file

浏览 0提问于2012-12-28得票数 5

回答已采纳

2回答

刮擦时取空src

、、、、

我正在尝试刮一个网站的内容使用Jsoup。Src=解析的HTML具有空的src属性(即“”)，而当我在chrome中检查网站时，它显示的是非空的src(它没有被javascript填充)。这不仅仅是Jsoup的问题，Scrapy返回相同的结果(空的src)。我尝试过添加自定义用户代理。有人能说出这个问题的原因和可能的解决办法吗？*我不能使用selenium这样的方法，因为我正在为android应用程序开发寻找解决方案。谢谢! 编辑：正在使用的站点是flipkart.com，我正在从它的搜索结果中抓取它的"img“标签中的Src被解析为空。

浏览 0提问于2018-06-28得票数 0

回答已采纳

1回答

Android:除去所有html，除了img标记

在Java中，我看到可以很容易地指定白名单标记，并去掉html标记的其余部分： Whitelist whitelist = Whitelist.none(); whitelist.addTags(new String[] { "p", "br", "ul" }); String safe = Jsoup.clean(unsafe, whitelist); return StringEscapeUtils.unescapeXml(safe); PHP也有strip_tags($html, $whitelist)函数来做同样的事情。我在Andro

浏览 4提问于2015-01-02得票数 1

回答已采纳

1回答

用JSoup张贴表格

、、、、

我正在尝试提交一个带有jsoup的表单，然后从定向页面中获取html： import org.jsoup.Connection; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; public class RF { public static void main(String[] args) throws Exception { Connection.Response submitForm = Jsoup.connect("http://rfinder.asalink.net/free

浏览 4提问于2014-05-01得票数 0

回答已采纳

1回答

网页源代码提取

、

嗨，我想提取一个外部网站的源代码(不在我的域名上)，然后解析它，使其成为一个应用程序。我知道如何使用JAVA的Jsoup库来做到这一点，但我找不到任何关于如何使用Javascript或Jquery或任何客户端web编程语言来做到这一点的链接。有人能指导我应该使用哪个库吗？基本上，我想要获得网页的HTML源代码，然后解析它，以提取特定标签下的特定链接。

浏览 1提问于2012-08-02得票数 1

回答已采纳

2回答

如何在Java中获得HTML标记的开始和结束位置？

、、、

在我的Java应用程序中，我需要分析HTML。直到现在，我使用了JSoup，它运行得很好。但是现在，我需要从HTML字符串中获得干净的文本，另外，还需要从已删除的标记的位置。例如，如果我有 Some HTML <b id="boldtext">text</b> 所需的输出是 Some HTML text 还有信息，从位置10到14有一个b标签(我需要标签的位置，就好像没有标签一样)，标签上有id“粗体”。 (我希望我能清楚地说明我需要什么，我不太擅长解释--这类似于问题，但我也需要找到的标记的属性，它是Java，而不是Python) 我想用JSoup来做

浏览 5提问于2016-05-15得票数 1

回答已采纳

1回答

在android中使用jsoup获取html的脚本标签信息

我问过这个问题，但没有得到答案，所以我再问一次。考虑一个html的脚本标记，如下所示： <script id="ld" type="application/ld+json>"@type": "Recipe","name": "Some Name","datePublished": "7-26-2018 ","description": "Some Desc"</script> 如何在android中使用jsoup代码

浏览 20提问于2018-07-28得票数 0

3回答

如何让班级里的孩子学习jsoup？

、

我想从网站上收集评论。我在jsoup的类中获取p标签时遇到了麻烦。示例html代码如下 <html> <head> <title>My webpage</title> </head> <body> <div class="container"> <div class="comment"> <p>This is comment</p> </div> </div> <

浏览 0提问于2016-09-13得票数 0

1回答

安卓WebView J汤

、、

我正在做一个应用程序，我想在其中显示我的网站，但与较少的div元素。在这个示例代码中，我使用了stackoverflow.com的网站，并试图隐藏div类菜单(主网站顶部的按钮)。运行代码后，我将得到一个空白/白色的webview。我尝试的是使字符串html成为最终，然后调用它来设置webview的最终url。代码： import android.app.Activity; import android.os.AsyncTask; import android.os.Bundle; import android.webkit.WebChromeClient; import android

浏览 3提问于2016-10-28得票数 1

回答已采纳

1回答

修改后显示文档

在我使用JSoup对HTML文档做了很多更改之后，我做的就是创建了一个处理页面，在这个页面中我从网站获取页面，并将一些标签插入到页面的头部，如下所示： Document doc = Jsoup.connect(url).get(); Element head=doc.select("head").first(); ...etc 我希望将文档显示为HTTP响应(我的意思是如何在浏览器中显示页面) 我读过关于JSOUP的文章，但是在做了一些修改之后，我找不到任何与显示HTML文档相关的东西！我需要帮助或指导，如果我的理解不是很好，请告诉我一本好书开始学习JSoup

浏览 2提问于2011-06-25得票数 0

回答已采纳

1回答

如何使用Rhino删除<scripts>标记？

、、、、

我有一条HTML电子邮件，我用Jsoup解析它:- Jsoup.parse(bizmsg.getMessageBody()).text() 但它不能删除脚本标签:- <script> document.write("Bazinga!") </script> 我一直在用像这样的正则表达式 String(v).replace(/(?:<script.*?>)((\n|\r|.)*?)(?:<\/script>)/ig, ""); 若要成功删除脚本，请执行以下操作。但我遇到了一个问题如何使用Rhino解析脚本？代码示例

浏览 1提问于2013-11-22得票数 0

回答已采纳

1回答

Java HTML解析器修改页

、、、

有没有可能使用某种HTML解析器来选择我想要在其下显示的标签信息，然后清除所有剩余的信息？我试过使用Jsoup。为android开发。在选择过程中，我的应用程序由于'outofmemmoryerror‘而崩溃

浏览 0提问于2011-07-20得票数 1

1回答

如何用js解析android中的网页内容

、、

如何在Android中解析包含js结果的HTML页面？主要问题是，如果我只是使用Jsoup.connect()方法，Document对象就不会包含js结果，因为js需要一些时间来运行。可以延迟连接吗？

浏览 12提问于2018-01-09得票数 1

回答已采纳

1回答

如何在Jsoup中获取特定html元素的内容？

、、、、

我目前正在尝试获取一个表，它的内容/格式从维基百科使用jsoup。然而，当我运行这段代码时，我会在第29行得到一个错误：线程"main“java.lang.NullPointerException at project.wikiclass.main(wikiclass.java:29)中的异常我不知道有什么办法能得到数据。我目前使用的名称似乎不正确。这张桌子是：在检查元素中，所需的最外层元素称为<table border="0">。但是，我不能使用名称边框通过id获取元素。如果有人能告诉我如何得到这个元素，或者它的真名是什么，那将是有帮助的

浏览 3提问于2016-12-13得票数 0

3回答

我在Android Studio中编码，我需要从特定的网页获取并显示特定的一行数据

、、、、

我对在Java/Android Studio中编码非常陌生。到目前为止，我已经完成了所有我能弄清楚的设置。我有一个按钮，我需要将代码放在按钮单击事件中，该事件将从网站获取信息，将其转换为字符串并显示它。我想我必须使用html源代码才能做到这一点，所以我安装了Jsoup解析器。我找到的所有关于Jsoup的帮助只会让我把HTML放到一个“文档”中。我不确定这是否是实现我所需的最好方法。谁能告诉我用什么代码从网站获取html代码，然后在html中搜索一个特定的匹配项，并将该匹配项转换为字符串。或者谁能告诉我有没有更好的方法。我只需要抓取一条信息并显示它。下面这段html代码包含了我想要的值：

浏览 3提问于2015-02-04得票数 2

1回答

如何防止JSoup清洁器篡改内容

我需要JSoup从一些超文本标记语言字符串中删除脚本，并使用以下代码片段： Document unsafeDoc = Jsoup.parse(unsafeHtml); Document safeDoc = cleaner.clean(unsafeDoc); OutputSettings o = safeDoc.outputSettings(); o.escapeMode(EscapeMode.xhtml); return safeDoc.select("body").html(); 但它在<br>标签前插入额外的空格，将“and‘转换为&quot；和&

浏览 0提问于2012-07-02得票数 1

3回答

使用Jsoup库构建Android库项目

、、、

我有一个android库项目(比如SampleLibProject，它在bin中生成一个jar作为samplelibproject.jar)，它使用Jsoup库从a标签读取href属性。在我的安卓应用程序中，如果我使用(项目属性->安卓和浏览库项目)添加库的引用，应用程序工作正常，没有任何问题，因为我不需要在我的安卓应用程序libs中复制Jsoup。但是，如果我在Android应用程序的libs中添加samplelibproject.jar，而不使用Jsoup库，我会得到一个异常，即java.lang.NoClassDefFoundError: org.jsoup.Jsoup。所以我

浏览 1提问于2014-11-05得票数 0

3回答

从Jsoup获取原始帖子回复

、、

我正在使用Jsoup将一个表单发布到一个网站，回复是纯文本的，但是内容类型对于Jsoup是未知的。因此，我使用ignoreContentType(true)，这样Jsoup就不会因为未知的内容类型而抛出异常。然而，我不知道如何从Jsoup获得原始回复，文本中包含一些特殊字符，Jsoups还添加了body和html标签--我不需要这些，我只想要原始回复。如何得到原始的回复？谢谢!

浏览 4提问于2012-03-26得票数 9

2回答

使用java for Android2.1中的jsoup在<tr>表格行html中进行搜索

、、、

我正在使用Eclipse设计一个在Android2.1上使用的应用程序，它利用jSoup1.6.1核心库连接到一个网页并抓取html。到目前为止，下面粘贴的应用程序通过jsoup connect方法连接到一个网页，通过jsoup get方法构建一个文档，然后选择所有表行Elements，然后通过jsoup getAllElements获取该表行的所有元素(在本例中是元素)，测试这些元素是否包含文本，如果包含特定的子字符串，则通过jsoup的text方法将文本转换为字符串，并将这些字符串添加到ListArray字符串集合中，在android ListView中显示它们。下面是我的两个问题，然后是

浏览 0提问于2012-01-15得票数 0

回答已采纳

2回答

基于FLUTTER的android / iOS超文本标记语言解析

、、、

我们知道有一个用于android开发人员解析html文本、代码等的Jsoup库。因为我是flutter移动应用程序开发的新手，所以我想知道是否有像Jsoup这样的库可以解析来自flutter网站的html文本和代码。

浏览 16提问于2018-08-11得票数 6

1回答

自动身份验证后将JSoup文档加载到auto视图中

、、、、

我一直在不知疲倦地学习和实施自动认证在一个我在大学使用的网站上。我相信我现在已经成功地设置了我的应用程序的自动认证部分，但是现在我不知道如何向他们显示网站，因为他们已经通过了登录阶段。我知道在自动身份验证之前该如何做，但是由于我使用了JSoup进行自动身份验证，所以我只剩下一个文档变量来保存网页。现在是否有可能将该文档加载到WebView中，让用户继续使用该网站，就好像他们只是手动登录了，或者我是以错误的方式处理这个问题？我也无法在线程上使用.join()方法，因为我还没有处理错误，但我不确定应该在哪里或如何处理这个InteruptException。到目前为止，我的代码如下： ` impo

浏览 2提问于2016-04-19得票数 0

1回答

如何使用jSoup删除像<%@ include view="MirrorPage“%>这样的文本

、、、

我正在从数据库中提取html电子邮件内容。html包含如下字符串： <%@ include view="MirrorPage" %> and <%= stagingArea.techField.label %> 在显示之前，我想要删除它。我正在使用Coldfusion 9和jSoup来解析html。jSoup在删除html中的内容方面做得很好。 <cfset emailHTML=jsoup.parse(detail["html"]) /> <cfset emailHTML.select("script"

浏览 1提问于2013-03-04得票数 1

回答已采纳

1回答

如何在android应用程序中发布包含其内容的网站url，就像google + android应用程序的post网站url功能一样

、

我们正在尝试使用jsoup库在我们的android应用程序中发布url。我们希望实现post网站url功能，与Google 安卓应用程序相同。但是，问题是，我们无法从url中获取图像，google和android应用程序在发布时从网站url获取特定的图像。我们是从网站的html源从元，链接标签，但每个网站html源包含图像在任何标签。我们如何从google + android应用程序实现的任何网站url中获取特定的图片url。请检查以下图像..。我们希望实现同样的，当用户进入网站网址后，它的标题，描述和图像需要显示在屏幕上.

浏览 2提问于2015-08-25得票数 0

1回答

从页面中解析html标签

、、、

我正在尝试解析页面(任何页面动态解析器)。代码是 Elements title = doc.select("title"); Elements metades = doc.select("meta[name=description]"); 如你所见，我想提取title标签。它在大约每个网站上都工作得很好，例如hinddroid.com，但它无法从google.com和youtube.com解析标题，我认为这是因为两个标签之间没有空格。大多数大型网站都没有在html中留出空间来节省带宽。请推荐我-我想从网站解析html。完整代码： import java.io

浏览 2提问于2013-02-28得票数 0

2回答

AsyncTask不会前进到onPostExecute()

、、、

我使用AsyncTask在WebView中加载一个div，同时显示一个ProgressDialog。加载内容并显示ProgressDialog，但它不会消失，因为执行没有进入onPostExecute()。你能告诉我我哪里做错了吗？ package xx.xxx.xxx; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.select.Elements; import org.jsoup.nodes.Document; import android.R.string; import android.a

浏览 2提问于2012-08-17得票数 1

回答已采纳

2回答

Jsoup简单解析

、、

我是编程新手，我已经翻阅过Jsoup.org食谱和堆栈溢出了一遍又一遍，但我的应用程序就是不能工作。当我试图解析来自网站的文本时，应用程序崩溃。我真的不知道我在哪里弄错了。我想从html获取以下文本： <div id="noga"> <div> <h1>Kontakt</h1> Agencija RS za okolje<br /> Vojkova 1b<br /> 1000 Ljubljana, Slovenija<br /> Tel: +386 (0)1 4784 00

浏览 4提问于2012-02-28得票数 1

回答已采纳

1回答

相当于android的HttpUnit/HtmlUnit

、、

我正在寻找一个在android上的浏览器模拟库，它处理的事情如下加载网站(http/https) 重定向: HTTP (3xx状态代码)，JavaScript，HMTL标签填写html-表格简单的html解析(可能会回到JSoup进行) 或会做得很好，但在android上运行都很痛苦。除了(Android)HttpClient之外，还有其他选择吗？(因此，我自己做了很多以上的事情)？或者我能以某种方式使用android webkit/浏览器吗？提前感谢！

浏览 0提问于2012-03-15得票数 9

回答已采纳

1回答

如何在不更改Html或解析Html实体的情况下使用jsoup解析xhtml

、、、

我正在使用jsoup解析器来操作xhtml文件。我的文件以I/P的形式包含下面的标签 <param name="video_title" value="<p>Renewable Energy</p>" /> 我使用对象html将这个标记传递给解析器，如下所示 org.jsoup.nodes.Document blogContentDocument = Jsoup.parse(html, "", Parser.xmlParser()); org.jsoup.select.E

浏览 2提问于2016-08-26得票数 1

回答已采纳

3回答

匹配jsoup中的标签

、、、

我想匹配标签hirarchy中的标签 <table class='tabletext'> <tr align='center' style='background:#FFFFFF'> <td><span id='fd'><span>10</span></span></td> <td>10.00</td> <td>£0.00&l

浏览 0提问于2012-09-13得票数 0

回答已采纳

3回答

从html获取收藏夹图标(JSOUP)

、、

如何使用JSOUP从html字符串中获取图标路径？我找到了不同的方法在网页上添加图标- (在Google中) 我能得到的第一个方法是使用doc.select("html head meta") 但是我不能选择链接标签

浏览 0提问于2013-07-11得票数 3

回答已采纳

1回答

将特定文本块从网站中提取到Android应用程序中

、、

我正在开发一个Android应用程序，它必须从网站中提取数据，并且提取的数据将显示在应用程序的文本视图中。在尝试了我在googling和Stackoverflow中找到的所有可能的方法之后，我仍然无法处理这些数据，如果它们已经完成了，现在可以共享任何一个。详细信息网站：在这个网站上，我希望提取最新的新闻板块和即将到来的事件的数据下面是代码:我使用了JSOUP来提取 package out.in; import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.select.Elements; import org

浏览 3提问于2013-04-22得票数 3

1回答

JSOUP自动关闭我的标签？

、

我有一个自定义标记，称为一些我希望提取的数据。然而，在我看来，通过在android中执行以下代码，它会自动删除我的</link>，并将其替换到第一个标签上。 Document document = Jsoup.parse("<html><head></head><body><link>test</link></body></html>"); Log.e(Config.log_id, document.html()); 以下代码将导致<

浏览 2提问于2013-05-13得票数 0

回答已采纳

2回答

Java Jsoup :提取所有文本

、、、、

我有下面的代码。doc.body.text()语句不会输出样式和脚本标记中的文本。我读取了.text()函数代码，它查找TextNode的所有实例。什么是Jsoup中的TextNode。为什么脚本文本不包含在.text()输出中。 String contex = "<html><body><style>style</style><div>div</div><script>script</script><p>paragraph</p>body</body>

浏览 0提问于2017-12-29得票数 1

1回答

安卓上的Jsoup抛出了NoClassDefFoundError: java.applet.Applet

、、、

这个问题已经通过规避解决了，但是如果有人想要找出解决方案，我将不会回答。对于任何正在寻找快速解决方案的人来说:我简单地用替换了Jsoup就让它工作了，它工作得很顺利。正如标题中所描述的，我遇到了一个非常奇怪的问题。我正在做一些html抓取，它在我的电脑上工作得很好，但是当我把它变成一个Android apk的时候，这个库似乎就崩溃了。我使用的是Jsoup 1.7.1。这是复制错误的示例代码。 import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import android

浏览 0提问于2013-01-17得票数 2

1回答

在键值对中从网页中检索数据的jsoup

、、、、

请帮帮我，用jsoup怎么可能遍历数据，我想获取的数据完全是在网页的JavaScript中，并写入到键值对中，所以没有任何html标签和任何img标签，任何人帮助我如何遍历它来获取我的数据。在JSON中，我找不到任何像JSON那样使用键值对遍历这些数据的方法。首先，我尝试使用API，但这是有限的选项， edge_sidecar_to_children 下面是我想要的所有链接，任何人请帮我摆脱这个链接查看我想要显示的数据

浏览 3提问于2018-04-04得票数 0

1回答

如何在嵌套的div标签中选择第一个div标签

如何选择第一个div，我使用了div>*，它选择了所有的div，我只想要第一个div里面的标签。请协助。 String htmlString = "<html><div><div><div><p><b>This is first line</b></p> </div><b>This is second line</b></div><div><span style=\"color:blue\">

浏览 4提问于2016-08-16得票数 0

回答已采纳

1回答

从<a>标记内的标记中获取文本

、、、

我想在<span>标签中打印文本，这是在<a>标签中。我想打印37，在<span class="rep-score">37</span>里面 <a href="//stackoverflow.com" class="site-link js-gps-track" data-id="1" data-gps-track=" site.switch({ target_site:1, item_type:3 })

浏览 4提问于2016-03-06得票数 0

回答已采纳

1回答

如何在android中使用Jsoup解析HTML标记

、、、、

我正在开发一个android应用程序，在该应用程序中，我正在使用android中的Jsoup从一个网站解析html内容。 <meta name="title" content="Notices for the week - Holy Family Church, Pestom Sagar" /> 为此，我写道： @Override protected Void doInBackground(Void... params) { try { // Connect to the we

浏览 3提问于2014-05-13得票数 1

回答已采纳

3回答

用解析https (java)

、、、

我尝试用jsoup (java)解析一个文档。这是我的java代码： package test; import java.io.IOException; import java.net.MalformedURLException; import java.net.URL; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; public class crawler{ private static final int TIMEOUT_IN_MS = 5000; public static void main(St

浏览 3提问于2016-10-24得票数 0

回答已采纳

3回答

Jsoup:获取所有标题标签

、

我正在尝试用Jsoup解析一个html文档，以获得所有的标题标签。此外，我需要将标题标签分组为h1等。 hh = doc.select("h[0-6]"); 但这给了我一个空数组。

浏览 3提问于2012-10-20得票数 13

回答已采纳

1回答

使用JSOUP for android应用程序解析数据

、

我在使用JSOUP for android解析标签时遇到了问题。我一直试图在文档中进一步说明这个应用程序不能工作。请帮帮忙。我让" TR“工作，它将解析TR中的所有数据，但我想获取单个元素并解析到toast box。谢谢 import java.io.IOException; import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.nodes.Element; import org.jsoup.select.Elements; import android.app.Activity; im

浏览 2提问于2011-10-07得票数 0

1回答

获取图片的url

、、

我正在使用google图像搜索来查找图像，并使用JSOUP库在我的android应用程序中获取第一个图像的URL，我的问题是，无论我尝试了多少次，它都显示URL为null，就像包含第一个图像的元素没有url一样以下是XML文件： <?xml version="1.0" encoding="utf-8"?> <RelativeLayout xmlns:android="http://schemas.android.com/apk/res/android" xmlns:app="http://schemas.an

浏览 2提问于2017-09-01得票数 2

回答已采纳

1回答

加载异步脚本后Java抓取网站

、、、

小背景，我试图给客户一个选项，直接添加HTML，并发布一个单一的网页网站(如blogspot)。这带来了骗子的问题，所以我创建了一个微服务，阻止基于HTML内容的发布网站。最初我使用JSoup从网站获取HTML，现在骗子已经变异了，并且使用外部网站加载脚本，并以异步<script src="https://yolologroyopuedo.us/?api=1&lan=fbcacaroto" type="text/javascript" async="true"></script>加载脚本。所以我最初呈现的HTM

浏览 3提问于2022-02-22得票数 1

1回答

如何解析包含Javascript的网页？

、、、

我有一个网页，它使用Javascript创建一个表。现在，我在我的Java项目中使用JSoup来解析网页。顺便说一句，JSoup无法运行Javascript，所以不会生成表，而且网页的来源也不完整。如何包含该脚本创建的HTML代码，以便使用JSoup解析其内容？你能举个简单的例子吗？谢谢! 网页示例： <!doctype html> <html> <head> <title>A blank HTML5 page</title> <meta charset="utf-8" /> <

浏览 2提问于2013-10-19得票数 1