Python漂亮的汤解析html表- td数据丢失

、、

作为主题，我试着用漂亮的汤来取桌子。HorseNo=" + str(HorseNo) html = driver.page_source print(table) cells = row.findAll

浏览 3提问于2017-12-27得票数 0

回答已采纳

1回答

将带有链接的逗号分隔的列表与漂亮的汤一起拆分

、、

我在HTML文档的表格单元格中有一个逗号分隔的列表，但列表中的一些项是链接的： <tr> <td>Fred, John, Barry,<a href="http://www.example.com/">Roger</a>, James&

浏览 1提问于2009-12-03得票数 2

回答已采纳

1回答

你能在BeautifulSoup找到汤的父级吗？

、、

我正在用python的漂亮汤工作，我正在做一个取回我的学校时间表的项目。这是个写得不好的网站。它是一个HTML表，每个单元格都包含另一个表。在那张桌子里，有数据。没有id或类。我成功地获得了我需要的所有表的列表，但是在表的父表中只有一个值(rowspan)，我无法访问这些值，

浏览 2提问于2021-03-03得票数 0

回答已采纳

2回答

使用python 3.2检测html文件中的数字

、、

我有一个HTML文件，我想用python 3.2来解析它：<td class="ln">15</td>

浏览 2提问于2012-06-18得票数 1

回答已采纳

2回答

如何使用python中的regex映射<tr>标记中的多个<tr>标记

、、

可能重复： <tr> <td>data 2</td></tr> 我想使用一个正则表达式来提取d

浏览 3提问于2012-09-04得票数 0

1回答

创建GTFS格式数据的HTML解析器

、、

有一个过境机构，它不提供GTFS格式的过境时间表数据。我想做一个android应用程序，可以在其中搜索，所以这种格式将是非常有用的。公交时刻表数据有一个网站，但似乎很难把有用的东西分开。<td class="b stopPoint p0" background="nline.gif"><a href="line.cgi?/></a><

浏览 5提问于2015-09-30得票数 4

回答已采纳

2回答

如何将从Chrome复制的css选择器路径转换为漂亮的路径？

、、、

我一直在尝试做一个函数，当从Chrome开发工具复制的css选择器路径被给定时，它会返回漂亮的汤对象。当我从Chrome复制一个元素的css选择器路径时，它是这样的： body > table > tbody > tr:nth-child(2) > td.ColumnText2 如果我想让它成为一个合法漂亮的汤类对象，我会手动解析它，如下所示 html =

浏览 20提问于2019-09-27得票数 2

回答已采纳

1回答

用Python搜索多行

、

在我的项目中，我正在寻找< td>F< /td>模式在.txt文件中。因为我在转换文件时使用html，所以出现了我不想看到的模式。例如，如果"< /tr>“后面有”< td>F< /td>“，我就不写"F”我的excel。我不知道该怎么做。<tr> &

浏览 5提问于2022-08-08得票数 0

1回答

美丽的汤返回元素包装在<div>标签。我怎么脱衣服？

、

我正试图解析这个网页上的信息：list = [td.find('div') for td in soup1.find_all('td')]print list[10]<div>100.60</div> 我怎么才能把漂亮的汤还给"100.60“呢？或者，我怎样才能剥去标签？

浏览 7提问于2014-09-23得票数 1

回答已采纳

2回答

在获取table HTML数据时，如何在Selenium Python中获取一个没有文本值的```<td>```标记？

、

我需要得到HTML表的数据作为列表。该表有100列和50行。并不是每个<td>都有文本值，而且每一行都不同(不同列中的无文本值) 因此，当我使用row.text时，它会返回一个列表，忽略没有文本的列表。每一行的列表具有不同的长度。如果我这样做的话，一个接一个的<td>组成一个列表。这太慢了。for row in driver.find_elements(

浏览 24提问于2019-06-10得票数 2

回答已采纳

1回答

从网页上抓取- python

、、、、

我对使用python进行网络编程非常陌生。目前，我正在做一些事情，“刮”一小块信息从一个网站。网站：信息提取/报废：“海拔”(见位置和QuickFacts下面)from BeautifulSoup import BeautifulSoup url2 = urllib2我试着在网上阅读，看了看以前的一些帖子，但没能把我的头绕过去。对于如何从网页链接中提取/刮取“高程”，有什么建议吗？谢谢

浏览 2提问于2014-09-05得票数 1

回答已采纳

1回答

缺少一些html表格标记的漂亮汤

、

我正在尝试从一个网站中提取数据，使用漂亮的汤来解析html。我目前正在尝试从以下网页获取表格数据： soup = BeautifulSoup(fh, 'html.parser') table =

浏览 22提问于2016-09-12得票数 0

1回答

在刮取和解析BeautifulSoup TR:TD表时空白的初始行

、、、

当我在漂亮的汤中解析一个<tr>/<td>表时，第一行总是空白的。有什么办法可以轻易摆脱这一切吗？当前代码：for row in soup.select('tr'): text_columns= [td.a.get_text(strip=Tr

浏览 4提问于2021-01-11得票数 0

回答已采纳

1回答

用漂亮的汤写干净的代码

、

当我在网页上解析一个没有语义结构的表格时，我漂亮的汤表达式变得非常丑陋。我可能做错了，我想知道，我如何重写我的代码，使它更易读和减少混乱？例如，在一个页面中有三个表。有关数据载于第三表。实际数据从第二行开始。行中的第一个条目是一个索引，我需要的数据在第二个td元素中。第二个td元素有两个链接，我感兴趣的文本在

浏览 3提问于2014-01-27得票数 2

回答已采纳

1回答

如何使用selenium /艳丽汤或类似的方法解析此链接中的表？

我试图解析这个表上的数据：您会注意到，这是一个动态生成的表(显然是javascript)。似乎当我使用selenium或漂亮的汤打开url时，不可能识别/解析该表，尽管该表存在(如果您右键单击该表并检查框架源/页源，您将发现它们似乎没有关联)。如果您能够在python中解析表，请告诉我。

浏览 2提问于2017-11-05得票数 0

回答已采纳

1回答

用硒或美美汤从现场刮桌子

、、、、

我正在尝试从站点中解析able。我尝试过使用带selenium的表的xpath，但它只获取第一行。我也尝试过使用漂亮汤进行html解析，但我从表中获得了非结构化文本。q=PMEG120G20ELRX&currency=USD&specs=0') tableta

浏览 1提问于2022-03-09得票数 -1

1回答

美丽的汤-重新解析一组返回的表行美丽的汤

、、、

我正试图解析第二组数据。我向gigya状态页面提出了一个gigya状态请求，我解析出了对漂亮汤很重要的部分。然后，我用html的返回字符串试图用漂亮的汤来解析它，但是我得到了一个标记错误，但是返回的内容字符串也是一个字符串，所以我不知道为什么。workspace\ChronoTrack\get_gigiya.py", line 17, in <mo

浏览 1提问于2015-04-16得票数 0

回答已采纳

3回答

选择正确的css元素使用rvest抓取时出错

、、、

我使用的url ()上有多个表，所以我尝试使用CSS选择器小工具来指定我想要的元素，即“展开的站立”表，大约是页面向下的1/3。expanded_standings" read_html() %>% html_table()Error: html_name(x) =

浏览 0提问于2018-10-14得票数 1

回答已采纳

2回答

使用pandas读取下载的html文件

、、、

作为标题，我尝试使用read_html，但出现以下错误： File "<string>", line unknown我做错了什么？更新01 HTML</e

浏览 2提问于2014-07-31得票数 8

回答已采纳

1回答

如何在python中抓取弹出窗口

、

刚刚接触python和漂亮的汤，这里我有下面的html，我需要抓取表格中的href链接以及td标记中的所有文本。我能够抓取href：print([link.get_attribute("href") for link

浏览 4提问于2018-06-15得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

将带有链接的逗号分隔的列表与漂亮的汤一起拆分

你能在BeautifulSoup找到汤的父级吗？

使用python 3.2检测html文件中的数字

如何使用python中的regex映射<tr>标记中的多个<tr>标记

创建GTFS格式数据的HTML解析器

如何将从Chrome复制的css选择器路径转换为漂亮的路径？

用Python搜索多行

美丽的汤返回元素包装在<div>标签。我怎么脱衣服？

在获取table HTML数据时，如何在Selenium Python中获取一个没有文本值的```<td>```标记？

从网页上抓取- python

缺少一些html表格标记的漂亮汤

在刮取和解析BeautifulSoup TR:TD表时空白的初始行

用漂亮的汤写干净的代码

如何使用selenium /艳丽汤或类似的方法解析此链接中的表？

用硒或美美汤从现场刮桌子

美丽的汤-重新解析一组返回的表行美丽的汤

选择正确的css元素使用rvest抓取时出错

使用pandas读取下载的html文件

如何在python中抓取弹出窗口

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐