美丽的汤-在带有字符串的标签中找到标签？第n个孩子？

美丽的汤（Beautiful Soup）是一个Python库，用于从HTML或XML文档中提取数据。它提供了一种方便的方式来遍历、搜索和修改文档树，使得数据提取变得简单而灵活。

在带有字符串的标签中找到标签可以使用Beautiful Soup的find()方法。该方法接受两个参数，第一个参数是标签的名称，第二个参数是一个字典，用于指定标签的属性和属性值。例如，要找到所有名称为"div"且class属性为"container"的标签，可以使用以下代码：

soup.find("div", {"class": "container"})

第n个孩子可以使用Beautiful Soup的contents属性和nth-of-type选择器来实现。contents属性返回标签的所有子节点列表，可以通过索引来获取特定位置的子节点。例如，要获取第2个孩子节点，可以使用以下代码：

soup.contents[1]

需要注意的是，索引是从0开始的。

美丽的汤的优势在于它的简单易用性和灵活性。它提供了多种方法来遍历和搜索文档树，使得数据提取变得非常方便。此外，它还支持CSS选择器和正则表达式等高级搜索功能，可以根据具体需求进行灵活的数据提取。

美丽的汤适用于各种场景，包括网页爬虫、数据挖掘、数据清洗等。它可以帮助开发人员快速有效地从HTML或XML文档中提取所需的数据，并进行进一步的处理和分析。

腾讯云相关产品中，与美丽的汤类似的是腾讯云的Web+服务。Web+是一款支持多种编程语言的云端Web开发工具，提供了可视化的界面和丰富的组件库，可以帮助开发人员快速搭建和部署Web应用。您可以通过以下链接了解更多关于腾讯云Web+的信息：

腾讯云Web+产品介绍

希望以上信息能够对您有所帮助！

美丽的汤-在带有字符串的标签中找到标签？第n个孩子？

、、、

我在使用下面的HTML抓取时遇到了一些问题 res = <div class="gunDetails"> <ul class="features，这样我就可以将它导出到具有我自己的头的CSV中。每当我这样做的时候，我都可以把它们都放在一个字符串中，或者什么都不做。输出 GamoNo Licen

浏览 6提问于2019-09-21得票数 1

回答已采纳

1回答

删除html (标记)中保持风格的部分- python

、、、、

在保存该字符串之前，我希望删除包含特定字符串的html的一部分。该标签包含一个人的名字，我想删除整个标签，以便使它匿名。</div>我探索了使用美丽的汤，但没有找到解决办法。谢谢!

浏览 1提问于2015-07-02得票数 0

回答已采纳

1回答

Python3BeautifulSoup-在特定字符串模式后用<br>替换新行

、、、

我对美丽汤的web抓取非常陌生，在特定字符串后插入<br>标签时遇到了一些问题。我已经在StackOverflow上彻底搜索过了，但还是有问题。'Random text here. \r\n\r\n More

浏览 0提问于2017-12-29得票数 0

1回答

在html中插入注释

、、、

我试着用漂亮的汤在html中插入一个注释，我想在头关闭之前插入它，我正在尝试这样的东西它在</head>之前插入，但是值得到实体编码的。美丽的汤文档标签，但我应该如何插入评论，因为它是。

浏览 1提问于2014-03-14得票数 2

回答已采纳

1回答

美丽的汤-在原始文本中找到识别标签

、

在识别了原始文档中的文本之后，我需要操作HTML中的某些文本。我可以使用BeautifulSoup识别特定的标记，但是由于它改变了原始文档的格式，所以我也不能搜索/替换字符串。我不想只写BeautifulSoup的输出，而是希望在原始文档中标识标记，并将其替换为<a href="link">。知道怎么继续吗？回答提出的几个问题：这是一个巨大的现有代码库

浏览 1提问于2013-05-09得票数 1

1回答

从美丽汤中提取标签“提取”中的内容

、

我在xml中有一个语料库，其中一个标记被命名为提取<EXTRACT>。但这个词是“美丽汤”中的一个关键词。如何提取这个标签的内容。据我所知，美丽汤，它执行案例折叠的标签。如果有什么方法来克服这一点，那也可能对我有帮助。absts.wri

浏览 2提问于2014-03-01得票数 3

回答已采纳

1回答

如何使用“美丽汤”检查p标签中是否存在电子邮件？

、、

我正在使用“美丽汤”来尝试检查在div标签中的段落标签中是否有电子邮件地址。我要循环看一张div的列表：如果每个部门： <p>Hello</p>在for循环中，我有： email = div.find(name="

浏览 0提问于2019-05-21得票数 1

回答已采纳

1回答

为什么在漂亮的none中使用find或find_all时，即使标签确实包含其他标签和数据，我也会得到none或空列表

、、

我正在尝试做一个冠状病毒跟踪器用美丽的汤，只是为了一些练习。我的代码是，from bs4 import BeautifulSoup soup=BeautifulSoup(page.content,'html.parser') table=soup.find("div",class_="ZDcxi&quo

浏览 2提问于2020-05-17得票数 0

1回答

如何使用美丽的汤提取链接的最后修改日期

、

使用此代码：以下是我用“美丽汤”提取的数据： <a href="0.1.0/">0.1.0/</a></pre> 我正在尝试获取与'a‘

浏览 0提问于2020-12-19得票数 1

3回答

如何使用python解析ld+json

、、、

我一直在尝试一些网络抓取，我偶然发现了这个标签中的一些有趣的数据：我已经能够用美丽的汤分离出那个标签 p = soup.find('script', {'type':'applicat

浏览 2提问于2017-04-27得票数 9

1回答

使用BeautifulSoup从<cite>标记中抓取URL

、、、

我试图从谷歌抓取网址使用请求和美丽的汤网络抓取库。for URL in soup.find_all('cite'):我以前试图通过搜索链接，然后获得链接的href来获取URL，但这种方法的问题似乎是这些URL被我注意到Google使用cite标签来保存URL。虽然这适用于绝大多数URL，但有时页面上的其他文本也包含在引用标记中。大多数标签都有一个class = "

浏览 4提问于2017-08-25得票数 0

1回答

用k-均值将标记聚类为类别

、

我对此很陌生，但我想我是在寻找K-的方法来做这个。你‘品味’，你‘健康’，你‘食谱’，你‘’vietnam‘，你’蛋‘，你’汤‘，. 你‘孩子’，你‘品味’，你‘健康’，你‘学校’，你‘食谱’，你‘家庭’，.你的饮食，你的舌头，你的

浏览 3提问于2017-06-30得票数 0

回答已采纳

2回答

在美丽的汤中找到下一个div标签

、、

关于蟒蛇汤美的问题<div class="content">Somedata</div><div classcontent">THE DATA I WANT</div><div cla

浏览 3提问于2020-06-22得票数 1

回答已采纳

4回答

使用CSS针对具有重复类的元素。

、、、

在我的HTML中，有2行具有相同的类。我希望能够只针对第一个元素，但似乎无法弄清楚。我能够针对这两个元素，但是当我更改CSS以选择第一个子元素时，它不会返回任何内容。下面是CSS和重复的类如果我使用svg g.highcharts-axis-labels，它将选择这两个元素。有

浏览 2提问于2014-09-05得票数 1

回答已采纳

1回答

在特定数量的事件后隐藏全部

、、

我有一个带有"list“类的div。在列表中，我有24个类为"listItem“的p标签。我想确定“显示:无；”在第六个p.listItem中的div，我已经尝试与第n个孩子没有成功，谁可以帮助我？

浏览 0提问于2014-05-06得票数 0

2回答

如何对脚本标签的内容进行编码和解码

、、

我试着用漂亮汤来解析html，但是每当我点击一个带有内联脚本标签的页面时，美丽汤都会对内容进行编码，但最终并没有解码回来。这是我使用的代码： htmlData = '<html> <head> <script

浏览 0提问于2012-12-03得票数 4

2回答

在Python语言中使用BeautifulSoup从脚本标签中提取文本

、、

我希望提取电子邮件，电话和姓名从脚本标签(而不是在身体)使用美丽汤(Python)下面的代码。我看到美丽的汤可以用来提取。(urllib2.urlopen('http://www.example.com').read())此Ajax请求代码不会再次在页面中重复phone: '9999999999',

浏览 1提问于2014-08-04得票数 6

1回答

使用“另存为”下载的HTML与使用Python请求下载的HTML略有不同

、、、

但是，当我在实际网站上测试我的网络爬行器时，输出略有偏差。', 'w') as fid:fid.close() 并注意到我想要webscrape (表格)的相关部分是相同的，直到几个未闭合的标签。，当我使用Inspect时，所有标签都是关闭的。但是当我使用View Page Source时，我看到了缺少的标签。当在Chrome中打开时，Req

浏览 0提问于2019-05-13得票数 0

1回答

如何在HTML文档中找到一个忽略空格的字符串？

、、

我试图在一些HTML页面中找到一个字符串"USB 2端口“。问题是，字符串前面有大量的空白--有时是4、20甚至50个空白字符。下面使用的是字符串前面的单个空格字符：注意USB前的单个空间。我如何告诉美丽汤的find()找到我的字符串

浏览 9提问于2013-08-21得票数 2

回答已采纳

2回答

使用<div>匹配html BeautifulSoup标记中的确切类

、

我正在使用美丽汤从一个网站上刮信息。page_url = https://www.autotrader.co.uk/car-search?page_url) 现在，我只想在<div class="vehicle-price"></div>标记中打印页面上的每一个价格div class="vehi

浏览 0提问于2019-03-12得票数 3

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

美丽的汤-在带有字符串的标签中找到标签？第n个孩子？

相关·内容

美丽的汤-在带有字符串的标签中找到标签？第n个孩子？

删除html (标记)中保持风格的部分- python

Python3BeautifulSoup-在特定字符串模式后用<br>替换新行

在html中插入注释

美丽的汤-在原始文本中找到识别标签

从美丽汤中提取标签“提取”中的内容

如何使用“美丽汤”检查p标签中是否存在电子邮件？

为什么在漂亮的none中使用find或find_all时，即使标签确实包含其他标签和数据，我也会得到none或空列表

如何使用美丽的汤提取链接的最后修改日期

如何使用python解析ld+json

使用BeautifulSoup从<cite>标记中抓取URL

用k-均值将标记聚类为类别

在美丽的汤中找到下一个div标签

使用CSS针对具有重复类的元素。

在特定数量的事件后隐藏全部

如何对脚本标签的内容进行编码和解码

在Python语言中使用BeautifulSoup从脚本标签中提取文本

使用“另存为”下载的HTML与使用Python请求下载的HTML略有不同

如何在HTML文档中找到一个忽略空格的字符串？

使用<div>匹配html BeautifulSoup标记中的确切类

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐