腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4277)
视频
沙龙
1
回答
Python
漂亮
的
汤
解析
html
表
-
td
数据
丢失
、
、
作为主题,我试着用
漂亮
的
汤
来取桌子。HorseNo=" + str(HorseNo)
html
= driver.page_source print(table) cells = row.findAll
浏览 3
提问于2017-12-27
得票数 0
回答已采纳
1
回答
将带有链接
的
逗号分隔
的
列表与
漂亮
的
汤
一起拆分
、
、
我在
HTML
文档
的
表格单元格中有一个逗号分隔
的
列表,但列表中
的
一些项是链接
的
: <tr> <
td
>Fred, John, Barry,<a href="http://www.example.com/">Roger</a>, James&
浏览 1
提问于2009-12-03
得票数 2
回答已采纳
1
回答
你能在BeautifulSoup找到
汤
的
父级吗?
、
、
我正在用
python
的
漂亮
汤
工作,我正在做一个取回我
的
学校时间
表
的
项目。这是个写得不好
的
网站。它是一个
HTML
表
,每个单元格都包含另一个
表
。在那张桌子里,有
数据
。没有id或类。我成功地获得了我需要
的
所有
表
的
列表,但是在
表
的
父
表
中只有一个值(rowspan),我无法访问这些值,
浏览 2
提问于2021-03-03
得票数 0
回答已采纳
2
回答
使用
python
3.2检测
html
文件中
的
数字
、
、
我有一个
HTML
文件,我想用
python
3.2来
解析
它:<
td
class="ln">15</
td
>
浏览 2
提问于2012-06-18
得票数 1
回答已采纳
2
回答
如何使用
python
中
的
regex映射<tr>标记中
的
多个<tr>标记
、
、
可能重复: <tr> <
td
>data 2</
td
></tr> 我想使用一个正则表达式来提取d
浏览 3
提问于2012-09-04
得票数 0
1
回答
创建GTFS格式
数据
的
HTML
解析
器
、
、
有一个过境机构,它不提供GTFS格式
的
过境时间
表
数据
。我想做一个android应用程序,可以在其中搜索,所以这种格式将是非常有用
的
。公交时刻
表
数据
有一个网站,但似乎很难把有用
的
东西分开。<
td
class="b stopPoint p0" background="nline.gif"><a href="line.cgi?/></a><
浏览 5
提问于2015-09-30
得票数 4
回答已采纳
2
回答
如何将从Chrome复制
的
css选择器路径转换为
漂亮
的
路径?
、
、
、
我一直在尝试做一个函数,当从Chrome开发工具复制
的
css选择器路径被给定时,它会返回
漂亮
的
汤
对象。当我从Chrome复制一个元素
的
css选择器路径时,它是这样
的
: body > table > tbody > tr:nth-child(2) >
td
.ColumnText2 如果我想让它成为一个合法
漂亮
的
汤
类对象,我会手动
解析
它,如下所示
html
=
浏览 20
提问于2019-09-27
得票数 2
回答已采纳
1
回答
用
Python
搜索多行
、
在我
的
项目中,我正在寻找<
td
>F< /
td
>模式在.txt文件中。因为我在转换文件时使用
html
,所以出现了我不想看到
的
模式。例如,如果"< /tr>“后面有”<
td
>F< /
td
>“,我就不写"F”我
的
excel。我不知道该怎么做。<tr> &
浏览 5
提问于2022-08-08
得票数 0
1
回答
美丽
的
汤
返回元素包装在<div>标签。我怎么脱衣服?
、
我正试图
解析
这个网页上
的
信息:list = [
td
.find('div') for
td
in soup1.find_all('
td
')]print list[10]<div>100.60</div> 我怎么才能把
漂亮
的
汤
还给"100.60“呢?或者,我怎样才能剥去标签?
浏览 7
提问于2014-09-23
得票数 1
回答已采纳
2
回答
在获取table
HTML
数据
时,如何在Selenium
Python
中获取一个没有文本值
的
```<
td
>```标记?
、
我需要得到
HTML
表
的
数据
作为列表。该
表
有100列和50行。并不是每个<
td
>都有文本值,而且每一行都不同(不同列中
的
无文本值) 因此,当我使用row.text时,它会返回一个列表,忽略没有文本
的
列表。每一行
的
列表具有不同
的
长度。如果我这样做的话,一个接一个
的
<
td
>组成一个列表。这太慢了。for row in driver.find_elements(
浏览 24
提问于2019-06-10
得票数 2
回答已采纳
1
回答
从网页上抓取-
python
、
、
、
、
我对使用
python
进行网络编程非常陌生。目前,我正在做一些事情,“刮”一小块信息从一个网站。网站:信息提取/报废:“海拔”(见位置和QuickFacts下面)from BeautifulSoup import BeautifulSoup url2 = urllib2我试着在网上阅读,看了看以前
的
一些帖子,但没能把我
的
头绕过去。对于如何从网页链接中提取/刮取“高程”,有什么建议吗?谢谢
浏览 2
提问于2014-09-05
得票数 1
回答已采纳
1
回答
缺少一些
html
表格标记
的
漂亮
汤
、
我正在尝试从一个网站中提取
数据
,使用
漂亮
的
汤
来
解析
html
。我目前正在尝试从以下网页获取表格
数据
: soup = BeautifulSoup(fh, '
html
.parser') table =
浏览 22
提问于2016-09-12
得票数 0
1
回答
在刮取和
解析
BeautifulSoup TR:
TD
表
时空白
的
初始行
、
、
、
当我在
漂亮
的
汤
中
解析
一个<tr>/<
td
>
表
时,第一行总是空白
的
。有什么办法可以轻易摆脱这一切吗?当前代码:for row in soup.select('tr'): text_columns= [
td
.a.get_text(strip=Tr
浏览 4
提问于2021-01-11
得票数 0
回答已采纳
1
回答
用
漂亮
的
汤
写干净
的
代码
、
当我在网页上
解析
一个没有语义结构
的
表格时,我
漂亮
的
汤
表达式变得非常丑陋。我可能做错了,我想知道,我如何重写我
的
代码,使它更易读和减少混乱? 例如,在一个页面中有三个
表
。有关
数据
载于第三
表
。实际
数据
从第二行开始。行中
的
第一个条目是一个索引,我需要
的
数据
在第二个
td
元素中。第二个
td
元素有两个链接,我感兴趣
的
文本在
浏览 3
提问于2014-01-27
得票数 2
回答已采纳
1
回答
如何使用selenium /艳丽
汤
或类似的方法
解析
此链接中
的
表
?
我试图
解析
这个
表
上
的
数据
: 您会注意到,这是一个动态生成
的
表
(显然是javascript)。似乎当我使用selenium或
漂亮
的
汤
打开url时,不可能识别/
解析
该
表
,尽管该
表
存在(如果您右键单击该
表
并检查框架源/页源,您将发现它们似乎没有关联)。如果您能够在
python
中
解析
表
,请告诉我。
浏览 2
提问于2017-11-05
得票数 0
回答已采纳
1
回答
用硒或美美
汤
从现场刮桌子
、
、
、
、
我正在尝试从站点中
解析
able。我尝试过使用带selenium
的
表
的
xpath,但它只获取第一行。我也尝试过使用
漂亮
汤
进行
html
解析
,但我从
表
中获得了非结构化文本。q=PMEG120G20ELRX¤cy=USD&specs=0') tableta
浏览 1
提问于2022-03-09
得票数 -1
1
回答
美丽
的
汤
-重新
解析
一组返回
的
表
行美丽
的
汤
、
、
、
我正试图
解析
第二组
数据
。我向gigya状态页面提出了一个gigya状态请求,我
解析
出了对
漂亮
汤
很重要
的
部分。然后,我用
html
的
返回字符串试图用
漂亮
的
汤
来
解析
它,但是我得到了一个标记错误,但是返回
的
内容字符串也是一个字符串,所以我不知道为什么。workspace\ChronoTrack\get_gigiya.py", line 17, in <mo
浏览 1
提问于2015-04-16
得票数 0
回答已采纳
3
回答
选择正确
的
css元素使用rvest抓取时出错
、
、
、
我使用
的
url ()上有多个
表
,所以我尝试使用CSS选择器小工具来指定我想要
的
元素,即“展开
的
站立”
表
,大约是页面向下
的
1/3。expanded_standings" read_
html
() %>%
html
_table()Error:
html
_name(x) =
浏览 0
提问于2018-10-14
得票数 1
回答已采纳
2
回答
使用pandas读取下载
的
html
文件
、
、
、
作为标题,我尝试使用read_
html
,但出现以下错误: File "<string>", line unknown我做错了什么?更新01
HTML</e
浏览 2
提问于2014-07-31
得票数 8
回答已采纳
1
回答
如何在
python
中抓取弹出窗口
、
刚刚接触
python
和
漂亮
的
汤
,这里我有下面的
html
,我需要抓取表格中
的
href链接以及
td
标记中
的
所有文本。我能够抓取href:print([link.get_attribute("href") for link
浏览 4
提问于2018-06-15
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
数据分析师的编程之旅——Python爬虫篇(2)HTML解析器
Python实例:爬取网页中的一列数据
大数据数据采集基础教程 五行代码爬取豆瓣电影本周排行榜 具体步骤详解
简单爬虫教你理解BeautifulSoup库
用Python做网页爬虫
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券