Webscraping w/BeautifulSoup返回类值

文章/答案/技术大牛

发布

1回答

、、

所以我开始学习如何使用BeautifulSoup进行网络抓取，我遇到了一个我似乎无法克服的疑问。我尝试保存每篇文章的id并将其打印出来，但是我的程序总是不返回任何内容。

浏览 9提问于2021-04-11得票数 0

回答已采纳

1回答

Python抓取: soup.select的问题

、

我正在开发一个python脚本，用于从特定站点( )中刮取数据这次我使用soup.select方法，类名为W(100%) M(0)，我的代码如下所示：import pandas as pd url = "https://finance.yahoo.com/quote/AUDUSD%3DX/history

浏览 4提问于2022-09-13得票数 0

4回答

网络抓取NBA比赛结果

、、

我想在python中学习webscraping，但我不知道如何或从哪里开始。我的代码运行，但它只返回一个空字符串。import requestsfrom urllib.request import urlopen#importpandas as pd soup= Beauti

浏览 9提问于2021-10-22得票数 0

回答已采纳

1回答

webkitbrowser注入javascript修改输入文本值时出错

、、、、

我在使用Python2.7中的WebkitBrower从网页获取输入文本的值时遇到了问题。下面是示例代码：w.get(url) token = xpath.get(').v

浏览 2提问于2015-01-01得票数 1

回答已采纳

1回答

如何完全删除python中包含类的HTML标记？

、、、

我有一个网络刮刀，从CNN，福克斯，和英国广播公司在BeautifulSoup的文章。然后，在进行了一些预处理之后，我将原始文章返回给API。但是，我不知道如何完全删除包含Python中令人讨厌的类的HTML标记。我尝试了lxml清理器，但是我可以删除标记，但不仅仅是包含某个类的标记。帮助”，我想要一个脚本，该脚本将转换如下所示的HTML：<p>

浏览 1提问于2022-03-08得票数 0

回答已采纳

1回答

我尝试删除h_span、w_span变量，并在循环中调用soup.findNextSibling函数而不是h_span.findNextSibling，它只返回一个空字符串，代码就会工作。from selenium import webdriverimport requests driver = webdriver.Chrome(executable_path= r'E:/Summer/FirstThings/Web

浏览 0提问于2019-04-11得票数 0

回答已采纳

1回答

我如何才能只提取内锚标签内的祝福汤的文本？

、、

我目前正在开发我的第一个网络抓取应用程序，我使用的是BeautifulSoup。这一切都很好的工作，尽管我有困难的时候，我正在抓取的网站，它不使用类名的HTML元素。>Keflavik W. - Thor Akureyri W. </ a>source = requests.get(URL, headers=headers).text soup = Beaut

浏览 2提问于2021-07-06得票数 1

回答已采纳

2回答

BeautifulSoup WebScraping问题:找不到这个特定网站的特定类(Python3.7)

、、

我对webscraping有点陌生，以前我已经用下面的方法创建了webscrapers，但是在这个特定的网站上，我遇到了一个问题，解析器无法找到特定的类('mainTitle___mbpq1') --这是引用声明文本的类每当我运行代码时，它都不会返回任何内容。对于大多数其他类来说也是如此。我想在不使用selenium的情况下捕获这些信息，因为这会减慢我所理解的过程。from bs4 import BeautifulSoupimport reque

浏览 0提问于2021-04-19得票数 1

回答已采纳

1回答

Web抓取循环python问题

、

我是一名python新手，想知道是否有人能够用下面的webscraping脚本指出我哪里出了问题。我已经尝试添加注释来解释我的每个观点，感谢任何帮助。#use Selenium & Beautiful Soupimport time #allow a sl

浏览 40提问于2018-09-16得票数 2

1回答

CSV模块查找代码中未提及的文件(Python)

、、

以下是错误消息： Traceback (most recent call last): File "/xxx/Python/mac/webscraping_2.py", line 3, in <Frameworks/Python.framework/Versions/3.7/bin/python3', '-u', '/Users/michelhofman/Dropbox/Py

浏览 12提问于2020-08-22得票数 0

1回答

如何在dataframe中检索和存储第2行和第3行元素

、、、

我对Python中的Pandas、Webscraping和BeautifulSoup都很陌生。当我正在学习使用requests和BeautifulSoup进行一些基本的网页抓取时，我对将html表的第2和第3元素分配到熊猫数据框架中的任务感到困惑。假设我有一张桌子：到目前为止，我的代码如下：from bs4 import BeautifulSoup html_data= requests.get('https:/

浏览 0提问于2021-10-19得票数 1

2回答

为什么这个CSS选择器不返回结果？

、、、

我正在跟随一个自动使用python的webscraping示例，但是我的CSS选择器没有返回任何结果。q=' + ' '.join(sys.argv[1:])) soup = bs4.BeautifulSoup(res.text, "html.parser

浏览 6提问于2020-06-01得票数 0

回答已采纳

2回答

如何使用Python在bs4.ResultSet (list)中找到字符串？

、、

为此，我使用Selenium和BeautifulSoup获取页面的代码。driver.maximize_window() # Webscrapingwith

浏览 26提问于2022-03-09得票数 0

回答已采纳

1回答

-“商业周刊”上的美丽汤--寻找公司成立的一年和地点

、、

例如，从以下公司，我想返回"1989“和”爱尔兰“ import csvimport urllib2 import business_week_testwriter.writerow(first_row)

浏览 0提问于2014-03-10得票数 1

回答已采纳

2回答

Python3 UnicodeEncodingError

、、

from selenium import webdriver soup = BeautifulSoup追溯(最近一次调用)：文件"E:\

浏览 0提问于2018-05-14得票数 0

回答已采纳

1回答

如何使用<p>标记查找BeautifulSoup4的内容？.content和.string对此标记无效。

、、、

我一直在用webscraping在Python中使用BeautifulSoup4进行实验，而且我很难找到如何使用BS4找到标记的这一部分？

浏览 0提问于2018-12-27得票数 0

回答已采纳

1回答

如何使用Python从包含"show more“的网页中提取所有urls？

、

我在webscraping领域相当新手，我以前使用代码从包含多个页面的网站提取urls，然后将它们保存在txt文件中。我想把它应用到一个新的网站，但它只有一个页面，但有一个“显示更多”按钮。这是网页：http://sdg.iisd.org/news/ 下面是我的代码： import requestsimport time if

浏览 23提问于2021-02-03得票数 1

回答已采纳

3回答

网页抓取后无法从字典中检索值

、、、

下面是经过多次调试之后的代码：#### - Archdaily - from bs4 import BeautifulSoupobject, as nested data structureimg = soup.find('div'img_list = img.attrs['data-images&#

浏览 6提问于2020-06-10得票数 1

回答已采纳

1回答

我如何从一篇文章中抓取所有段落，而不仅仅是一个段落？

、、

文章：import requests 'User-Agent': 'Mozilla/angry-squirrel-attacks-queens_n_5fee30b1c5b6ec8ae0b242d2" soup = BeautifulSoup, class_='content-li

浏览 11提问于2021-01-02得票数 0

回答已采纳

2回答

使用BeautifulSoup访问网页中的网页？

、、

我正在做的链接是：from bs4 import BeautifulSoupimport csv ##################### URL ####################### CSV File csv_file =

浏览 6提问于2021-01-28得票数 0

回答已采纳

点击加载更多