腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
BeautifulSoup
中
"findAll“和"
find_all
”
的
区别
、
、
、
我想用Python解析一个HTML文件,我使用
的
模块是
BeautifulSoup
。import urllib, urllib2, cookielibsite = "http://share.dmhy.orgteam_id%3A407" r
浏览 5
提问于2012-09-09
得票数 39
回答已采纳
1
回答
bs4正确地分析了页面,但是
find_all
没有返回任何内容。
、
我正试着刮这个网站如果我打印lxml解析
的
结果,我就可以在结果中看到我想要
的
结果。但是,
find_all
不返回任何内容。我已经尝试了以下所有内容(所有这些都返回了一个空
列表
): 'https://www.automationanywhere.com/reso
浏览 3
提问于2021-01-18
得票数 0
2
回答
无法从python
中
的
html页面提取文本
、
、
我读到了关于
BeautifulSoup
的
文章,并试图使用它。但我无法提取具有给定类名“company-desc-and-排序容器”
的
文本。我甚至不能从html页面中提取标题。这是我尝试过
的
代码:import requests r = requests.ge
浏览 5
提问于2016-12-20
得票数 1
回答已采纳
1
回答
获取错误AttributeError: ResultSet对象没有属性“
find_all
”
嗨,我试图找出所有的链接下
的
分页
的
东西和分页部分
的
代码已经提取。但是,当我试图捕获所有
列表
项时,我会得到以下错误:from bs4 import
BeautifulSoup
url = "https://scrapi
浏览 0
提问于2020-01-25
得票数 0
回答已采纳
1
回答
如何在美丽
的
汤中分离tds和获得第n位td?
、
、
bob</a></td><td>2</td><td>4</td> 我想跳过第一个td align=“左”,因为它没有标题,我想把标题和第三个td放在一个元组
列表
中
我已经看到了使用soup.findAll()和片获取第n行
的
答案,但是我如何获得特定
的
tds呢?所有的建议将是有用
的
,并
浏览 2
提问于2020-02-12
得票数 0
回答已采纳
2
回答
beautifulsoup
4获取第二段和格式
、
我想打印第二个<p>
的
段落和网页
中
的
表单方法。然而,我只能找到一种打印第一段
的
方法。我
的
HTML结构如下所示: <p> part1 </p> <form method="post"> <p> content insideform </p> </form> <
浏览 4
提问于2015-11-09
得票数 0
回答已采纳
2
回答
如何遍历HTML文件
中
的
元素
、
、
这就是我正在查看
的
页面:https://www.nytimes.com/topic/destination/russia 我已经导入了
BeautifulSoup
和请求。我想创建一个文本文件
的
所有标题从这个页面。我可以得到其中
的
一个,使用 from bs4 import
BeautifulSoup
source = requests.get('https://www.nytimes.com
浏览 17
提问于2020-04-13
得票数 1
3
回答
使用从URL
中
刮取
列表
、
我是
BeautifulSoup
的
新手,所以请原谅这里任何初学者
的
错误。我试图刮一个网址,并希望存储
的
电影
列表
下
的
一个日期。下面是我到目前为止拥有的代码:from bs4 import
BeautifulSoup
page = requests.get("https://www.imdb.com您可能是将一个项目
列表
当作单个项来处理。当您打算调用
find_all
()时,是否
浏览 1
提问于2020-05-29
得票数 0
回答已采纳
2
回答
使用greatschools.org刮擦
BeautifulSoup
返回空
列表
、
我一直在学习如何使用greatschools.org来刮
BeautifulSoup
网站。尽管我在这里和其他地方找到了不同
的
解决方案,但我还是遇到了一个死胡同。通过使用chrome上
的
“检查”功能,我可以看到该网站有表标记,但是
find_all
('tr')或
find_all
(' table ')或
find_all
('tbody')返回一个空
列表
。下面是我使用
的
代码块: import reques
浏览 1
提问于2019-01-03
得票数 3
回答已采纳
2
回答
如何通过
beautifulSoup
获取类属性?
、
attribute-value"><i class="icon icon_female_symbol"></i>我希望得到这样
的
结果
浏览 21
提问于2020-05-13
得票数 0
回答已采纳
0
回答
BeautifulSoup
.find_all()方法不能与命名空间标记一起使用
、
、
、
今天,我在使用
BeautifulSoup
时遇到了一个非常奇怪
的
行为。让我们来看看一个非常简单
的
html代码片段:我正在尝试使用
BeautifulSoup
('ix:nonfraction') >>> <ix:nonfraction>lele<
浏览 2
提问于2017-06-21
得票数 9
回答已采纳
3
回答
为什么ResultSet对象没有属性“查找”?
、
我试图在维基百科头版“维基百科
的
其他领域”部分
中
删除文本。但是,我遇到了错误ResultSet object has no attribute 'find'。我
的
代码有什么问题,我如何让它工作?import requestsurl = 'https://en.wikipedia.org/'soup =
BeautifulSou
浏览 4
提问于2020-07-15
得票数 1
回答已采纳
1
回答
使用机器人浏览器点击
列表
、
我有一个浏览器,我需要从浏览器
中
抓取数据。首先,我尝试遍历第一个
列表
。我
的
代码如下: for link in soup1.find_all(class_="combo").
浏览 9
提问于2020-03-11
得票数 0
1
回答
我应该如何在一个<em>
中
刮掉所有的<ul>标签,并使它们成为熊猫
的
数据文件?
、
、
、
、
我目前正试图从一个网站上搜集我想要
的
信息。我应该如何刮取我想要
的
信息?此外,我想知道是否有一种方法可以在<em>中生成所有的内部文本,并将它们放入dataframe
中
。 <ul>基本上是这样
的
。
浏览 6
提问于2022-03-18
得票数 0
回答已采纳
1
回答
美汤结果缺失
的
部分
、
我试图在下面的html代码
中
检索几个<p>标记。这里只是它
的
一部分 <a class="fBlackLink"></a> <span> … </我
的
Python代码如下div = soup.find(
浏览 3
提问于2013-09-04
得票数 9
回答已采纳
1
回答
Python -从HTML页面捕获所有表
、
、
、
我有带有嵌入HTML表格
的
电子邮件,还有使用
BeautifulSoup
提取表和表
中
数据
的
代码,我
的
问题是有时只有当有更多
的
表时,它才能成功捕获一个表。with open(file_path) as in_f: body = html_msg.get_payload(decode=True
浏览 3
提问于2017-06-06
得票数 0
回答已采纳
2
回答
如何在python脚本中导入.py
、
我试图在python脚本中直接导入
BeautifulSoup
库,但我无法安装它,因为我在语法DS213+中使用它,所以我尝试这样做: soup =
BeautifulSoup
(html) for link in soup.find_all('a'):line 17, in <module> sou
浏览 3
提问于2014-02-24
得票数 0
回答已采纳
2
回答
列表
中
的
BeautifulSoup
find_all
、
我正在尝试使用
BeautifulSoup
find_all
命令两次。我第一次使用它来查找所有的表标签。然后,我在一个循环中使用了几个if语句,以缩小添加到
列表
中
的
表标签
的
数量。最后,我尝试在我
的
list上使用
find_all
命令,并收到错误"'list‘对象没有属性'find'“。 我知道这个错误基本上是说
find_all
不能查看
列表
,但我想不出任何其他方法来整理我
的<
浏览 15
提问于2019-07-29
得票数 0
回答已采纳
2
回答
检索Python网页
中
的
所有字符串
、
我试图使用
BeautifulSoup
从网页
中
检索所有字符串,并返回所有检索到
的
字符串
的
列表
。 查找所有具有非空文本
的
元素,将文本追加到结果
列表
并返回它。我很难实现这一点,因为我无法在
BeautifulSoup
中找到任何方法来实现它。使用
BeautifulSoup
的
"
find_all
“方法查找我正在寻找
的
所有属性,如"p”表示段落,&qu
浏览 2
提问于2021-11-24
得票数 0
回答已采纳
1
回答
如何使用美汤为我
的
刮刀
中
的
每个项目获取链接文本?
、
、
、
我正在为黄页建立一个刮刀,我正在试图弄清楚如何在CSV输出
中
包括
的
搜索结果
中
的
每个
列表
的
网站。网站就列在每个
列表
的
旁边。sys.setdefaultencoding('utf-8') import csv from bs4 import
Beautif
浏览 0
提问于2017-01-10
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
BeautifulSoup常用解析库-爬虫干货系列5
Python爬虫之BeautifulSoup详解
Python爬虫从入门到精通(3):BeautifulSoup用法总结及多线程爬虫爬取糗事百科
——BeautifulSoup
干了这碗汤,你也可以愉快地爬虫了
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券