首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Jsoup(一)Jsoup详解(官方)

一、Jsoup概述 1.1、简介     jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。...1.2、Jsoup的主要功能     1)从一个URL,文件或字符串中解析HTML     2)使用DOM或CSS选择器来查找、取出数据     3)可操作HTML元素、属性、文本     注意:jsoup...假如你使用正常的 Jsoup.parse(String html) 方法,    通常你也可以得到相同的结果,但是明确将用户输入作为 body片段处理,以确保用户所提供的任何糟糕的HTML都将被解析成body...a元素   3)说明     jsoup elements对象支持类似于CSS (或jquery)的选择器语法,来实现非常强大和灵活的查找功能。.     ...: 查找包含给定文本的元素,搜索不区分大不写,比如: p:contains(jsoup)       :containsOwn(text): 查找直接包含给定文本的元素       :matches(regex

8.6K50
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Jsoup入门学习一

    2、Jsoup 的主要功能,如下所示:   1)、从一个URL,文件或字符串中解析HTML;   2)、使用DOM或CSS选择器来查找、取出数据;   3)、可操作HTML元素、属性、文本;   4)、...parsing-a-document 5、Jsoup查找DOM元素的主要方法,如下所示: 1)、getElementById(String id) 根据 id 来查询 DOM。   ...如果满足不了自己的需求,可以使用Jsoup 的选择器语法查找 DOM 元素,如下所示: 1 package com.bie.jsoup; 2 3 import java.io.IOException...// ns|tag: 通过标签在命名空间查找元素,比如:可以用 fb|name 语法来查找 元素 15 str = doc.select("jsoup|li").first().text...36 6)、parent > child: 查找某个父元素下的直接子元素,比如:div.content > p 查找 p。 37 7)、parent > * 查找某个父元素下所有直接子元素

    2.4K10

    Jsoup解析器

    · JsoupJsoup是一款Java的HTML解析器,支持DOM思想。...// 根据标签获取元素// 根据属性获取元素// 根据属性名=属性值获取元素// 使用CSS选择器获取元素可以看得到都可以成功。...选择元素:使用类似于 CSS 或 jQuery 的选择器语法来查询和选择 HTML 元素。提供了一组方便的方法来访问元素的属性、文本内容、HTML 内容等。...提取数据:从选定的元素中提取文本、属性、HTML 内容等。提供了处理表格数据(如从 标签中提取数据)的特定方法。修改文档:修改元素的内容、属性或样式。插入、删除或替换 HTML 元素。...性能优化:提供了用于解析和选择元素的优化选项。允许你缓存文档对象以加快后续查询的速度。易于集成:作为一个纯 Java 库,Jsoup 可以轻松集成到任何 Java 项目中。

    13510

    JAVA网络爬虫之Jsoup解析

    所以这里我准备使用jsoup来爬取, jsoup是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。...可操作HTML元素、属性、文本;虽然使用Jsoup可以替代HttpClient直接发起请求解析数据,但是往往不会这样用,因为实际的开发过程中,需要使用到多线程,连接池,代理等等方式,而jsoup对这些的支持并不是很好...,所以我们一般把jsoup仅仅作为Html解析工具使用。...代理在Jsoup真中共的使用过程如下所示,在使用过程中要注意JSoup默认会关闭连接 访问HTTP网站请通过设置相同Proxy-Tunnel来保持相同的外网IP....java.net.InetSocketAddress;import java.net.PasswordAuthentication;import java.net.Proxy;import org.jsoup.Jsoup

    70150

    Jsoup选择器语法

    站在巨人的肩膀上才能看的更远 jsoup 是一款基于Java 的HTML解析器,可直接解析某个URL地址或HTML文本内容。...jsoup的强大在于它对文档元素的检索,Select方法将返回一个Elements集合,并提供一组方法来抽取和处理结果,要掌握Jsoup首先要熟悉它的选择器语法。...通过ID查找元素,比如:#logo .class: 通过class名称查找元素,比如:.masthead [attribute]: 利用属性查找元素,比如:[href] [^attr]: 利用属性名前缀来查找元素...”body”元素下的所有 p元素 parent > child: 查找某个父元素下的直接子元素,比如:可以用div.content > p 查找 p 元素,也可以用body > * 查找body标签下所有直接子元素...(text): 查找包含给定文本的元素,搜索不区分大不写,比如: p:contains(jsoup) :containsOwn(text): 查找直接包含给定文本的元素 :matches(regex):

    1.7K30

    Java网络爬虫技术《二》Jsoup

    Jsoup 当我们成功抓取到页面数据了之后,还需要对抓取的数据进行解析,而刚好,Jsoup 是一款专门解析 html 页面的技术。...Jsoup是一款基于 Java 的HTML 解析器,可直接解析某个 URL 地址、HTML 、文本内容。可以通过DOM、CSS以及类似于JQuery的操作方法来取出和操作数据。...getElementsByAttribute document.getElementsByAttribute("abc").first(); 使用选择器语法查找元素 Jsoup elements 对象支持类似于...查找某个元素下子元素:比如;.class_a li 就是查找 .class_a 下的所有 li 标签的内容 查找某个父元素下的直接子元素:比如 div#J_goodsList > ul > li...查找 div id为 J_goodsList 第一级(直接子元素)的ul,再找所有ul下的第一级li 父元素>*: 比如 ul > * 查找 ul 标签下所有直接子元素

    71120
    领券