如何获取所有html链接并将其存储在一个变量Jsoup中

Jsoup是一款用于解析HTML文档的Java库，它可以帮助我们获取HTML页面中的各种元素，包括链接。下面是如何使用Jsoup获取所有HTML链接并将其存储在一个变量中的步骤：

导入Jsoup库：首先，确保已将Jsoup库添加到项目的依赖中。可以从Jsoup的官方网站（https://jsoup.org/）下载最新版本的jar文件，并将其添加到项目的类路径中。
创建连接：使用Jsoup的connect()方法创建一个连接对象，并指定要解析的HTML页面的URL。例如，要解析的页面是https://example.com，可以使用以下代码创建连接对象：

Connection connection = Jsoup.connect("https://example.com");

Response response = connection.get();

Document document = Jsoup.parse(response.body());

获取所有链接：使用Jsoup的select()方法结合CSS选择器来选择所有的链接元素。CSS选择器可以根据元素的标签名、类名、ID等属性进行选择。例如，要选择所有的链接元素，可以使用以下代码：

Elements links = document.select("a");

List<String> linkList = new ArrayList<>();
for (Element link : links) {
    String href = link.attr("href");
    linkList.add(href);
}

现在，linkList变量中存储了所有HTML链接。可以根据实际需求对链接进行进一步处理或使用。

请注意，以上代码示例仅展示了如何使用Jsoup获取HTML链接，并将其存储在一个变量中。在实际应用中，可能需要处理异常、处理相对链接、过滤无效链接等。此外，还可以使用Jsoup的其他功能来进一步解析和处理HTML页面。

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云