腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Webscraping
w
/
BeautifulSoup
返回
类
值
、
、
所以我开始学习如何使用
BeautifulSoup
进行网络抓取,我遇到了一个我似乎无法克服的疑问。我尝试保存每篇文章的id并将其打印出来,但是我的程序总是不
返回
任何内容。
浏览 9
提问于2021-04-11
得票数 0
回答已采纳
1
回答
Python抓取: soup.select的问题
、
我正在开发一个python脚本,用于从特定站点( )中刮取数据这次我使用soup.select方法,
类
名为
W
(100%) M(0),我的代码如下所示:import pandas as pd url = "https://finance.yahoo.com/quote/AUDUSD%3DX/history
浏览 4
提问于2022-09-13
得票数 0
4
回答
网络抓取NBA比赛结果
、
、
我想在python中学习
webscraping
,但我不知道如何或从哪里开始。我的代码运行,但它只
返回
一个空字符串。import requestsfrom urllib.request import urlopen#importpandas as pd soup=
Beauti
浏览 9
提问于2021-10-22
得票数 0
回答已采纳
1
回答
webkitbrowser注入javascript修改输入文本
值
时出错
、
、
、
、
我在使用Python2.7中的WebkitBrower从网页获取输入文本的
值
时遇到了问题。下面是示例代码:
w
.get(url) token = xpath.get(').v
浏览 2
提问于2015-01-01
得票数 1
回答已采纳
1
回答
如何完全删除python中包含
类
的HTML标记?
、
、
、
我有一个网络刮刀,从CNN,福克斯,和英国广播公司在
BeautifulSoup
的文章。然后,在进行了一些预处理之后,我将原始文章
返回
给API。但是,我不知道如何完全删除包含Python中令人讨厌的
类
的HTML标记。我尝试了lxml清理器,但是我可以删除标记,但不仅仅是包含某个
类
的标记。帮助”,我想要一个脚本,该脚本将转换如下所示的HTML:<p>
浏览 1
提问于2022-03-08
得票数 0
回答已采纳
1
回答
FindNextSibling()函数不能正常工作
、
、
我尝试删除h_span、
w
_span变量,并在循环中调用soup.findNextSibling函数而不是h_span.findNextSibling,它只
返回
一个空字符串,代码就会工作。from selenium import webdriverimport requests driver = webdriver.Chrome(executable_path= r'E:/Summer/FirstThings/Web
浏览 0
提问于2019-04-11
得票数 0
回答已采纳
1
回答
我如何才能只提取内锚标签内的祝福汤的文本?
、
、
我目前正在开发我的第一个网络抓取应用程序,我使用的是
BeautifulSoup
。这一切都很好的工作,尽管我有困难的时候,我正在抓取的网站,它不使用
类
名的HTML元素。>Keflavik
W
. - Thor Akureyri
W
. </ a>source = requests.get(URL, headers=headers).text soup =
Beaut
浏览 2
提问于2021-07-06
得票数 1
回答已采纳
2
回答
BeautifulSoup
WebScraping
问题:找不到这个特定网站的特定
类
(Python3.7)
、
、
我对
webscraping
有点陌生,以前我已经用下面的方法创建了webscrapers,但是在这个特定的网站上,我遇到了一个问题,解析器无法找到特定的
类
('mainTitle___mbpq1') --这是引用声明文本的
类
每当我运行代码时,它都不会
返回
任何内容。对于大多数其他
类
来说也是如此。我想在不使用selenium的情况下捕获这些信息,因为这会减慢我所理解的过程。from bs4 import
BeautifulSoup
import reque
浏览 0
提问于2021-04-19
得票数 1
回答已采纳
1
回答
Web抓取循环python问题
、
我是一名python新手,想知道是否有人能够用下面的
webscraping
脚本指出我哪里出了问题。我已经尝试添加注释来解释我的每个观点,感谢任何帮助。#use Selenium & Beautiful Soupimport time #allow a sl
浏览 40
提问于2018-09-16
得票数 2
1
回答
CSV模块查找代码中未提及的文件(Python)
、
、
以下是错误消息: Traceback (most recent call last): File "/xxx/Python/mac/
webscraping
_2.py", line 3, in <Frameworks/Python.framework/Versions/3.7/bin/python3', '-u', '/Users/michelhofman/Dropbox/Py
浏览 12
提问于2020-08-22
得票数 0
1
回答
如何在dataframe中检索和存储第2行和第3行元素
、
、
、
我对Python中的Pandas、
Webscraping
和
BeautifulSoup
都很陌生。当我正在学习使用requests和
BeautifulSoup
进行一些基本的网页抓取时,我对将html表的第2和第3元素分配到熊猫数据框架中的任务感到困惑。假设我有一张桌子: 到目前为止,我的代码如下:from bs4 import
BeautifulSoup
html_data= requests.get('https:/
浏览 0
提问于2021-10-19
得票数 1
2
回答
为什么这个CSS选择器不
返回
结果?
、
、
、
我正在跟随一个自动使用python的
webscraping
示例,但是我的CSS选择器没有
返回
任何结果。q=' + ' '.join(sys.argv[1:])) soup = bs4.
BeautifulSoup
(res.text, "html.parser
浏览 6
提问于2020-06-01
得票数 0
回答已采纳
2
回答
如何使用Python在bs4.ResultSet (list)中找到字符串?
、
、
为此,我使用Selenium和
BeautifulSoup
获取页面的代码。driver.maximize_window() #
Webscraping
with
浏览 26
提问于2022-03-09
得票数 0
回答已采纳
1
回答
-“商业周刊”上的美丽汤--寻找公司成立的一年和地点
、
、
例如,从以下公司,我想
返回
"1989“和”爱尔兰“ import csvimport urllib2 import business_week_testwriter.writerow(first_row)
浏览 0
提问于2014-03-10
得票数 1
回答已采纳
2
回答
Python3 UnicodeEncodingError
、
、
from selenium import webdriver soup =
BeautifulSoup
追溯(最近一次调用):文件"E:\
浏览 0
提问于2018-05-14
得票数 0
回答已采纳
1
回答
如何使用<p>标记查找
BeautifulSoup
4的内容?.content和.string对此标记无效。
、
、
、
我一直在用
webscraping
在Python中使用
BeautifulSoup
4进行实验,而且我很难找到如何使用BS4找到标记的这一部分?
浏览 0
提问于2018-12-27
得票数 0
回答已采纳
1
回答
如何使用Python从包含"show more“的网页中提取所有urls?
、
我在
webscraping
领域相当新手,我以前使用代码从包含多个页面的网站提取urls,然后将它们保存在txt文件中。我想把它应用到一个新的网站,但它只有一个页面,但有一个“显示更多”按钮。这是网页:http://sdg.iisd.org/news/ 下面是我的代码: import requestsimport time if
浏览 23
提问于2021-02-03
得票数 1
回答已采纳
3
回答
网页抓取后无法从字典中检索
值
、
、
、
下面是经过多次调试之后的代码:#### - Archdaily - from bs4 import
BeautifulSoup
object, as nested data structureimg = soup.find('div'img_list = img.attrs['data-images
浏览 6
提问于2020-06-10
得票数 1
回答已采纳
1
回答
我如何从一篇文章中抓取所有段落,而不仅仅是一个段落?
、
、
文章:import requests 'User-Agent': 'Mozilla/angry-squirrel-attacks-queens_n_5fee30b1c5b6ec8ae0b242d2" soup =
BeautifulSoup
, class_='content-li
浏览 11
提问于2021-01-02
得票数 0
回答已采纳
2
回答
使用
BeautifulSoup
访问网页中的网页?
、
、
我正在做的链接是:from bs4 import
BeautifulSoup
import csv ##################### URL ####################### CSV File csv_file =
浏览 6
提问于2021-01-28
得票数 0
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
对象存储
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券