我正在尝试使用JAVA中的JSoup库从网页中抓取数据。然而,这里的问题是,我想要抓取的数据是基于XML加载的,所以当我试图从HTML解析它时,它会显示出来
<div id="report-details-container">
<!-- Container where HTML template will be loaded based on XML -->
</div>
而不是完整的HTML,它只显示这个注释。
我如何抓取数据,因为在inspect元素中我可以看到完整HTML。
我正在尝试从网页中抓取java脚本对象。我按照建议尝试了JIRA API,但是我没有得到活动日志。我找到一个网站,解释如何抓取java脚本对象。例如,请参见以下内容 https://datascienceplus.com/scraping-javascript-rendered-web-content-using-r/ 我遵循了这个示例,但是我发现很难理解我需要发送什么作为xpath信息才能列出活动日志。我正在尝试抓取网页底部所有选项卡容器下的活动日志。 library(rvest)
library(V8)
#URL with js-rendered content to be scrape