美丽的汤网刮_美丽的汤刮_Python美丽的汤刮刮href - 腾讯云开发者社区

、

我正在尝试刮this1网页。我想提取字符串‘工作，从家里，包装’。我无法使用下面的代码找到强标记，我使用的是“美丽汤”。 job = soup.find('li', class_='clearfix job-bx wht-shd-bx') job_name = job.header.h2.a.find_all('strong',_class="blkclor") print(job_name) 结果= 预期结果:在家工作这是链接

浏览 0提问于2021-07-14得票数 0

回答已采纳

3回答

如何使用Beautiful从python代码中获得javascript函数的结果？

、、、、

我想从一个使用Python中的“美丽汤”的网站上抓取数据。网站根据用户的选择更改下拉菜单的值。在更改下拉菜单的值时没有api调用。仔细看一下，我注意到有一个javascript函数在内部调用，以获取下拉菜单的值。我的问题是下拉菜单的值不在页面源中。它们是通过调用js函数获得的，但是没有api调用，我不能请求那个值。有人能告诉我如何从python代码中调用javascript函数吗？我在用漂亮汤刮网。谢谢

浏览 7提问于2014-04-06得票数 1

回答已采纳

1回答

漂亮的汤-选择没有类的下一个span元素的文本

、、

我试图使用美丽的汤刮从rottentomatoes.com的电影引号。页面源很有趣，因为引号是由span类“粗体quote_actor”直接进行的，但是引号本身没有类，例如()：。我想使用美丽汤的find_all捕捉所有的引号，没有演员的名字。我尝试过很多没有成功的事情，例如： moviequotes = soup(input) for t in web_soup.findAll('span', {'class':'bold quote_actor'}): for item in t.parent.next_siblings:

浏览 2提问于2017-10-04得票数 1

回答已采纳

3回答

Regex检查给定字符串是否为相对URL

、

首先，我读过关于如何检查字符串是绝对的还是相对的URL。我的问题是，我需要一个regex来检查给定的字符串是否是一个相对 URL，也就是说，我需要一个regex来检查一个字符串是否以任何协议或双斜杠//开头。事实上，我正在做与美丽汤的网页刮，我想检索所有相关的链接。“美丽汤”使用以下语法： soup.findAll(href=re.compile(REGEX_TO_MATCH_RELATIVE_URL)) 所以我才需要这个。测试用例是 about.html tutorial1/ tutorial1/2.html / /experts/ ../ ../experts/ ../../

浏览 5提问于2015-07-15得票数 2

回答已采纳

2回答

如何使用相同的标记刮取html数据

、、

我如何提取代理费用，卧室和浴室的信息使用美丽的汤在蟒蛇。这是我正在刮的网页。 <ul class="important-fields"> <li class=""> <span> Agency Fees: </span> <strong> AED 5000 </strong> </li> <li class=""> <span> Bedrooms: </span&

浏览 0提问于2014-02-02得票数 0

回答已采纳

1回答

soup.prettify和打印(soup.prettify)有什么区别？

、

嗨，我正在尝试美丽的汤，为网络刮擦，我正在使用朱皮特笔记本。我编写了soup.prettify()和print(soup.prettify())，当我使用第一个时，html没有得到很好的打印，但是当我将它与print一起使用时，HTML是以结构化的方式打印的？可能是什么原因？

浏览 1提问于2017-10-06得票数 1

回答已采纳

1回答

如何使用Python登录亚马逊子公司Audible.com

、

我想要刮声音网站使用Python美丽的汤。有一些数据我无法访问，除非我登录到我的音频帐户。它是Amazon.com的子公司。我一直没有成功。我只想使用Python登录并抓取html。我已经尝试了各种代码，比如这个。有人会认为，在这段代码中简单地替换我的凭据就可以了。

浏览 0提问于2019-02-11得票数 2

1回答

美汤混淆了刮擦时选择的元素。

、

我想刮表中的所有项目，但是，即使我选择了正确的元素，美丽的汤也不返回，有什么想法吗？这是 url = 'https://www.bursamalaysia.com/market_information/announcements/company_announcement/announcement_details?ann_id=3171857' response = requests.get(url) soup = BeautifulSoup(response.text, "html.parser") table = soup.find('table

浏览 4提问于2021-07-01得票数 0

回答已采纳

1回答

BeautifulSoup给出一个空列表

、、、、

我试着用美丽的汤刮网站。打印容器后，它给了我一个空列表。我怎么才能解决这个问题？ import requests from bs4 import BeautifulSoup import lxml URL = 'https://www.monster.com/jobs/search/?q=Software-Developer&where=Australia' page = requests.get(URL) soup = BeautifulSoup(page.content, 'lxml') container = soup.find_all(

浏览 5提问于2021-06-18得票数 0

3回答

从coinmarketcap.com网上抓取历史比特币数据

、、

我有一些问题，网络刮一些数据与美丽的汤，我想知道你们中的任何一个刮刀专业人士可以给我一些指导。这是我想刮的确切的网页：具体来说，我想获取历史价格表，并以某种方式将信息提取到DataFrame中。但是首先，我需要在原始html中找到它。 import requests from bs4 import BeautifulSoup data = requests.get('https://coinmarketcap.com/currencies/bitcoin/historical-data/?start=20130428&end=20171013') soup =

浏览 2提问于2017-10-13得票数 0

回答已采纳

1回答

使用python的Webscraping元素

、、、、

我目前正在使用漂亮的汤尝试和网络刮一个网站的数据，但是python模块正在阅读该页面的源代码。但是，在页面的源代码中，我所需要的信息并不存在，但是，如果我在chrome中右键单击页面并检查元素，它就是。我想知道python模块是否可以从网页中抓取元素，而不是源代码。在“美丽的汤”中，我试图搜索像这样的元素，但是它们没有出现或出现，因为它在源代码中搜索。我也不知道为什么或者为什么它不出现在那里。

浏览 2提问于2020-08-28得票数 0

回答已采纳

3回答

如何使用漂亮的汤从商店中刮取数据

、、

我现在是一个学生，我现在学习的是美丽的汤，所以我的讲师就像我一样从商店里收集数据，但是我不能擦拭产品的细节。目前，我正在尝试从中抓取数据。我只想弄清楚产品的名称和价格。有人能告诉我为什么我不能用漂亮汤刮数据吗？这是我的代码： from requests import get from bs4 import BeautifulSoup url = "https://shopee.com.my/shop/13377506/search?page=0&sortBy=sales" response= get (url) soup=BeautifulSoup(response

浏览 2提问于2020-05-28得票数 3

回答已采纳

2回答

关于网络抓取的问题

、、

我有一个问题，在网络刮刮使用美丽汤，这是网址，我试图在网上刮公司信息的细节。 from selenium import webdriver import bs4 import pandas as pd from bs4 import BeautifulSoup import re driver = webdriver.Chrome(executable_path=r"C:/Users/Chandra Sekhar/Desktop/chrome-driver/chromedriver.exe") titles=[] driver.get("http://desiopt.

浏览 1提问于2019-11-29得票数 0

回答已采纳

1回答

如何向数组中的每个部分添加值

、、、、

我需要为数组的每个部分添加不同的值。 array1 = [[1,2,3], [4,5,6], [7,8,9], [10,11,13]] array2 = [["a"], ["b"], ["c"], ["d"]] 期望产出： array3 = [["a",1,2,3], ["b",4,5,6], ["c",7,8,9], ["d",10,11,13]] 第一个数组是通过使用“美丽之汤”来创建的，所以它是不定义的，直到附加到刮擦。不确定这是否很重要，但上面是正确的尺寸，一

浏览 1提问于2016-04-20得票数 0

回答已采纳

2回答

一个网站有没有可能在刮的时候隐藏部分美丽的汤汁呢？

、、

我遇到了一个问题，当我试图刮一个网站与python包美丽的汤。不知何故，除了我感兴趣的那部分之外，我从它得到了一切。我正在尝试从这个网站的抓取实时数据。我真的得到了除了实时数据之外的每一个部分，我认为它以某种方式连接到了与数据相同的容器中的脚本块。Firefox和Chrome可以很容易地检查这一部分，但美汤不知何故不了解这一点。感谢您的每一条建议！

浏览 15提问于2017-12-21得票数 1

1回答

在div标记中刮取文本

、

我正在用美丽的汤刮一些基本的数据。我需要的源代码的部分如下： <div class="header-team">Team name 1</div> <div class="header-team">Team name 2</div> 这两条线不是相邻的。我正在尝试这样做： for team in soup.findAll('div', 'header-team') print team 但是把所有的代码都拿回来。我尝试在.text上添加，但它返回了一个错误。

浏览 0提问于2016-01-29得票数 0

回答已采纳

1回答

页面需要2次加载才能完成

、、、

在这个网站上，我试着刮卖跨文本，但这个网站需要2次加载来完成网站。这就是为什么数据不被刮掉的原因。我的守则： import requests from bs4 import BeautifulSoup url = "https://toptees.store/linux-funny-cloud-computing" reqs = requests.get(url) soup = BeautifulSoup(reqs.text, 'lxml') sold = soup.find_all("span", class_='ng-bindin

浏览 6提问于2022-09-15得票数 -1

2回答

python请求中的连接错误

、、

我试着用水蟒的美丽汤搜索python 3.6。我正试着在特拉维夫刮accuweather.com以了解天气情况。这是我的密码： from bs4 import BeautifulSoup import requests data=requests.get("https://www.accuweather.com/he/il/tel- aviv/215854/weather-forecast/215854") soup=BeautifulSoup(data.text,"html parser") soup.find('div',('

浏览 0提问于2018-08-23得票数 1

回答已采纳

1回答

刮除不包含在任何元素中的文本

、

我正在用“美丽的汤4”刮一个写得很差的网站，除了用户的电子邮件地址之外，我已经得到了所有的东西，它没有包含任何能区分它的元素。有什么想法吗?如我所料，强元素的next_sibling跳过了它。 <div class="fieldset-wrapper"> <strong> E-mail address: </strong> useremail@yahoo.com <div class="field field-name-ds-user-picture field-type-ds field-label-hidden&

浏览 1提问于2015-03-08得票数 0

回答已采纳

1回答

如何使用美汤获取CSS链接

、、、

我有一个，我是用美丽汤刮的。我有HTML，但现在我需要CSS。我尝试过使用soup.findAll('link', {'rel': 'stylesheet'})，但我知道如何从返回列表的第一个索引<link href="styles.css" rel="stylesheet"/>中获取文件名我试过使用正则表达式，但我不太擅长，但我不确定如何让它工作。那么，有没有可以使用的BeautifulSoup函数，或者我必须走我已经采用的路线？

浏览 2提问于2018-02-23得票数 2

2回答

不统计文件中的正确字符

、

我有以下代码，它按预期运行，但在计算字符数和最长行的长度时有一些问题。下面是我的代码： def stats(file_name): n_chars = 0 n_words = 0 n_lines = 0 longest_line = 0 with open(file_name) as f: lines = f.readlines() n_lines = len(lines) longest_line = max([len(line) for line in lines]) words = [

浏览 11提问于2018-08-13得票数 0

回答已采纳

2回答

如何使用“美丽的汤”和“熊猫”或任何其他方法从网站上获取结构化格式的表？

、、、、

我想从这个网站上刮表‘摘要语句持有指定的证券’--我尝试过使用selenium抓取数据，但是它都在一个列中，没有任何表，而且这个表没有唯一的标识符。如何使用熊猫和美丽汤，以结构化的格式或任何其他方法刮表。这是我想弄明白的代码，但没有成功。 import requests import pandas as pd headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:80.0) Gecko/20100101 Firefox/80.0" } params = {

浏览 2提问于2020-09-23得票数 1

回答已采纳

1回答

使用python从维基百科中刮表？

、、、

我试着从维基百科的页面上抓取表格数据：，我试过使用pd.read_html语法，但它不适用于我试图刮的表(尼泊尔按地区分列的新冠肺炎确诊病例)。我试着用“美丽汤”和“熊猫”来收集数据，但是它不起作用 url = 'https://en.wikipedia.org/wiki/2020_coronavirus_pandemic_in_Nepal' r = requests.get(url) soup = BeautifulSoup(r.text,'html.parser') table = soup.find('table', {'clas

浏览 0提问于2020-04-06得票数 1

回答已采纳

2回答

使用<div>匹配html BeautifulSoup标记中的确切类

、

我正在使用美丽汤从一个网站上刮信息。相关守则： page_url = https://www.autotrader.co.uk/car-search?sort=sponsored&radius=1500&postcode=&onesearchad=Used&onesearchad=Nearly%20New&onesearchad=New&make=Vauxhall&model=Corsa&year-from=2008&year-to=2010&minimum-mileage=82376&maximum-m

浏览 0提问于2019-03-12得票数 3

回答已采纳

2回答

Python2.7-漂亮的Soup抓取find_all命令不起作用

、

我正在测试漂亮的汤网刮工具。下面的代码只需连接到一个subreddit，并尝试打印用户在第一页上发布的所有图片的链接。 import requests from bs4 import BeautifulSoup url = "https://www.reddit.com/r/pics" r = requests.get(url) if r.status_code != 200: print "failed to connect" exit() sourcecode = r.text soup = BeautifulSoup(sourceco

浏览 2提问于2017-01-17得票数 1

回答已采纳

1回答

问题:如何使用漂亮汤获取标记属性值的列表

、、、、

我想从当地一家电影院的网站上刮点东西，当某部电影在运行时，我会一直拍下去。我找到了一张表格，其中列出了如下形式的时间： [<time datetime="2020-01-31T21:15:00+01:00">21:15</time>]. 如果我用漂亮汤作为x.find_all(“时间”)。我得到了上面所示的所有时间。但我只想要“日期时间”，所以在本例中，2020-01-31T21: 15: 00 + 01: 00。现在当我搜索x.find_all(‘time’)‘日期时间’时，我得到以下错误： TypeError: list indices must

浏览 3提问于2020-01-30得票数 0

回答已采纳

2回答

Scrapy‘知道’什么时候它爬行了整个网站？

、、、

当我在一个网站的单个页面上爬行时，我已经成功地使用了“美丽汤”，但是我有一个新的项目，在这个项目中，我必须检查一个大的网站列表，看看它们是否包含一个提到或链接到我的网站。因此，我需要检查每个网站的整个网站。对于BS，我只是还不知道如何告诉我的刮板，它是用一个站点完成的，所以我达到了递归限制。是从盒子里拿出来的什么东西吗？

浏览 0提问于2017-09-12得票数 1

回答已采纳

3回答

如何在python3.x中修正“在函数中找不到引用'x‘”？

、

我目前正在编写我的第一个python脚本，它应该每XX秒检查一次URL，并通知我url上的文本是否有变化。我的问题是，我找不到一种方法来引用函数之外的变量。我试图使用全局变量，但这也会导致错误。当前版本引用了scrape函数中的变量汤(scrape.soup =不返回错误，而“soup =确实”)。但是，在第15行中，它仍然存在查找变量汤的问题，因为它给了我这个通知：找不到“函数”中的引用“soup” from bs4 import BeautifulSoup import requests import time sleeptime = 15 def scrape():

浏览 0提问于2019-04-19得票数 0

1回答

用漂亮汤解析css选择器

、、、

我正在使用CSS选择器从网上刮数据与美丽汤4模块。参见示例代码： # pull website res = requests.get('https://dailystoic.com/epictetus/') #parse file soup = bs4.BeautifulSoup(res.text, 'html.parser') # CSS selector elems = soup.select('body > div.wrap.container > div > main > article > div.entry

浏览 1提问于2018-03-11得票数 0

回答已采纳

1回答

BS4导入在eclipse中不起作用

、

我是python的新手。我想在eclipse中运行python脚本，因为我对此有点适应。我正在尝试导入和运行美丽汤在eclipse oxygen.Import是成功的，但我得到一个错误(未解决的导入汤)与以下code.However美丽汤是工作良好与anaconda.enter图像描述在这里从bs4导入BeautifulSoup as soup

浏览 4提问于2017-12-11得票数 0

1回答

在html映像src中查找子字符串的正则表达式

、

我用美丽的汤刮不同的数据在网站上。我试着刮源，但不是所有的源，只是子字符串，这对我来说很重要。例如，在本项中，我只想选择/和.png之间的字符串(在本例中是"nyt")，并将其保存在列表中。 <image width="185" height="26" xmlns:xlink="http://www.w3.org/1999/xlink" xlink:href="https://a1.nyt.com/assets/shell/20160613-034030/images/foundation/logos/nyt-

浏览 2提问于2017-10-07得票数 1

回答已采纳

1回答

如何将CSS选择器的输出传递给漂亮的汤？

、、、、

我想刮一些网页，我正在使用一个名为"SelectorGadget“的Chrome扩展。这是个CSS选择器。例如，对于这个URL：，CSS选择器给我这个文件列表的输出: tr~ tr+ tr td+ td a Now，问题是我不知道如何将这个输出传递给美丽的汤。在下面的行中，.select()不识别这些选择器！ import requests page = requests.get("http://www.www2015.it/documents/proceedings/forms/proceedings.htm") import bs4 soup = bs4.Beaut

浏览 1提问于2016-02-11得票数 1

回答已采纳

2回答

使用漂亮汤的web抓取:分离值

、、

我用漂亮的汤刮网。该网页有以下来源： <a href="/en/Members/"> Courtney, John (Dem) </a>, <a href="/en/Members/"> Clinton, Hilary (Dem) </a>, <a href="/en/Members/">

浏览 1提问于2015-09-07得票数 1

回答已采纳

3回答

用Python中的特定文本对HTML表进行Web抓取

、、、

我正在尝试使用python在web上刮取一个HTML表。HTML页面中有很多表，但是我只想刮一个特定的表。我正在用漂亮的汤做这个网刮。我的代码如下所示： page = get("http://uobgoldprice.com/history/2018/September/10/") html = BeautifulSoup(page.content, 'html.parser') for p in html.select('tr'): if p.text == "ARGOR CAST BAR": pri

浏览 0提问于2018-09-14得票数 3

回答已采纳

1回答

使用urllib2和BeautifulSoup不接收我在浏览器中查看的数据

、、

我正试着刮一个网站：我知道上面的链接会显示没有搜索结果，但是当我手动进行搜索时，就会有结果。我遇到的问题是，当我在浏览器中打开这个链接时，我能够像预期的那样看到一个页面，但是当我在漂亮的汤中打开它时，我得到了一些类似于这个搜索不可用的内容。我是新手，所以不太确定这是如何工作的，网站是否有内置的东西使这样的事情(urllib2 2/美丽汤)不起作用？ File = urllib2.urlopen("http://www.gabar.org/membersearchresults.cfm?start=26&id=E640EC74-9C8E-9913-79DB5D9C3765

浏览 7提问于2014-02-04得票数 0

回答已采纳

2回答

如何删除网页上的重复标题

、

我想删除重复的titles从输出中删除，我正在使用美丽的汤刮的标题。 #!/usr/bin/python from bs4 import BeautifulSoup import requests source = requests.get('https://itrevolution.com/book-downloads-extra-materials/') source = source.text soup = BeautifulSoup(source, 'lxml') for tl in soup.f

浏览 3提问于2020-02-25得票数 1

回答已采纳

2回答

Python，Beautifoulsoup多个同名div标记

、、

soup = BeautifulSoup(html, "html.parser") # BeautifulSoup(markup, "lxml") items = soup.find_all("div","_3u1 _gli _uvb", recursive=True) for item in items: abouts = item.find_all("div", {"class":"_glo"}, recursive = True)[0].text

浏览 3提问于2017-11-15得票数 0

1回答

Beatiful + Python的编码问题

、、

我一直在阅读“美丽汤”编码的，尝试用特殊的字符来解析我的html。但是那里的用例与我的不匹配。这个html <p>Kimi Räikkönen</p>是在Kimi RÃ¤ikkÃ¶nen被刮掉后返回的，我的应用程序不能处理这个。当实际的标记中包含unicode (我没有)时，文档指示如何将内容转换为<p>Sacr\xc3\xa9 bleu!</p>到<p>Sacré bleu!</p>。奇怪的是，当我进入soup.original_encoding时，我总是得到None，即使是正常的内容。我试过这里的文档和其他问题中

浏览 1提问于2019-07-29得票数 2

回答已采纳

1回答

提取非本地链接-美丽的汤

、、

我试图提取非本地链接(链接不是自我引用或不属于相同的领域，我正在从网页上刮出)在美丽的汤。下面是允许我做相反操作的代码： import re from bs4 import BeautifulSoup from urllib import parse, request def get_links(root, html): soup = BeautifulSoup(html, 'html.parser') for link in soup.find_all('a', href=re.compile('https://www\.eecs\.

浏览 0提问于2018-04-17得票数 2

回答已采纳

1回答

在安装了两个版本的pyCharm的情况下进行漂亮的汤类安装

、

我使用PyCharm编写Python，首先我用python2.7.12配置了PyCharm，在2.7.12环境下安装了Beautiful Soup包。然而，我现在已经在PyCharm中安装了Python3.5.2，并且我想在3.5.2的PyCharm中使用美丽汤，但我不能导入bs4，因为解释器无法找到2.7.12包文件夹中的美丽汤包。所以我尝试在3.5.2控制台中pip install bs4，但它告诉我包已经安装在2.7.12文件夹中。那么，现在如何在PyCharm中导入3.5.2中的美丽汤呢？

浏览 24提问于2016-07-28得票数 0

回答已采纳

1回答

美汤问题-找不到正确的问题

、、

我对美汤有意见。我正在尝试刮Kayak，但是当我打印find_all的长度时，它将返回0。我正在使用硒与美丽汤，以及。 from selenium import webdriver from selenium.webdriver.chrome.options import Options chrome_options = Options() chrome_options.add_argument("--headless") from bs4 import BeautifulSoup from webdriver_manager.chrome import ChromeDrive

浏览 4提问于2022-06-07得票数 0

2回答

如何删除美汤中特定模式中的html标记

、、、

<p> A <span>die</span> is thrown \(x = {-b \pm <span>\sqrt</span> {b^2-4ac} \over 2a}\) twice. What is the probability of getting a sum 7 from both the throws? </p> 在上面的html中，我只需要删除“(标记)”中的标记，即\(x = {-b \pm <span>\sqrt</span> {b^2-4ac} \

浏览 5提问于2017-02-04得票数 2

回答已采纳

2回答

如何将漂亮的汤文本转换为列表或可迭代

、、、、

如何将beautifulsoup文本转换为list或dictionary 我想从我从美丽的汤刮来的信息中得到一个可迭代的列表。例如，现在我刮了一个引用网站，得到了文本，然后我想把这个文本引用到一个列表中，这样我就可以迭代它们。 from bs4 import BeautifulSoup import requests r = requests.get("http://www.great-quotes.com/quotes/category/Motivational") data = r.text soup = BeautifulSoup(data, 'html.par

浏览 2提问于2018-05-19得票数 2

回答已采纳

1回答

为什么汤(‘桌子’)[4]正在变成无型？TypeError：“NoneType”对象不可调用

、、

我在用美汤刮网。所以，我有HTML代码，它有8个表。我在试着从这些桌子上提取内容。 for row in soup('table')[4].tbody('tr'): tds = row('td') print tds[0].string, tds[1].string 它给出了错误： for row in soup('table')[4].tbody('tr'): TypeError: 'NoneType' object is not callable 据我所知，soup('t

浏览 1提问于2013-05-28得票数 0

回答已采纳

1回答

解析美汤时转换为<( &lt；)

、、

我使用漂亮的汤来解析一个包含<br>的字符串，美丽的汤将其解释为<br>。有没有办法让漂亮的汤停止这样做，这样当<br>被正常解析时，<br>不会被触及，并被视为普通字符串？

浏览 0提问于2019-04-01得票数 0

1回答

刮破的汤和漂亮的汤有什么区别？

我读过刮痕是一个网络爬行工具和美丽的汤是一个图书馆的刮痕。但我的朋友说，这两者是不同的，我们可以完成相同的任务，在美丽的汤，这是通过刮擦。我朋友的观点是真的吗？我也怀疑美丽的汤是刮刮的一部分，还是另一种？请告诉我

浏览 1提问于2015-02-25得票数 2

回答已采纳

2回答

使用漂亮的汤python访问html源代码中的不可见元素

、、

我正在尝试刮的所有按钮的链接(EP 212,211,210，.)在这个页面上，使用了漂亮的汤4和python 3。这是我用来检索网页源代码的代码： from bs4 import BeautifulSoup import requests as rq webpage=rq.get('https://gogoanime.pe/category/boruto-naruto-next-generations').text SourceCode=BeautifulSoup(webpage,'html.parser') print(SourceCode.prettify

浏览 0提问于2021-08-22得票数 1

回答已采纳

1回答

转到403页面时的Web抓取

、、

我是一个网络抓取的初学者，并被要求用美丽的汤刮https://mirror-h.org/archive/page/1。但它给出了一个错误，并转到403页。我该如何解决这个问题呢？我真的很感谢你的帮助。下面是我的代码： import requests from bs4 import BeautifulSoup import pandas url = "https://mirror-h.org/archive/page/1" page = pandas.read_html(url) headers = { 'user-agent:' 'Mozi

浏览 23提问于2021-08-26得票数 0

回答已采纳

1回答

我怎样才能用美丽的汤锁定下一个子元素文本呢？

使用美丽汤，我试图提取在下图突出显示的数字。我能够锁定和输出整个span类，但我只想要锚定文本字符串。我如何告诉美丽汤，我想要的下一个子元素只值？我期望输出是90NBHA138J2C255D431U 我的尝试到目前为止， target=soup.findAll('span',{'class':'data data_mpn'}) print target 目标字符串的图像

浏览 1提问于2013-08-19得票数 0

回答已采纳

1回答

查找并单击脚本元素中的元素

、

我正试图用python和selenium在一个网站上改变商店的位置。Firefox的Selenium IDE插件给了我一个序列。这个序列在Firefox的selenium中工作，但我无法让它在Python (Spyder)中工作。我想单击的元素在脚本中，没有任何工具能够在脚本中找到元素。美丽的汤做不到，硒也做不到。使用下面的代码，我尝试在每一家商店中获得产品价格，因此我需要将商店(左上角的黄色按钮，然后是下拉列表)从下拉列表中的每个商店更改为每个商店，并从下拉列表中刮除产品价格的页面源。但是，每当我尝试"driver.find_element_by_“时，我就会”无法找到元素：“ 点击

浏览 0提问于2019-06-19得票数 1