使用bs4进行Web抓取:将结果追加到csv时，仅显示最后两个值

使用bs4进行Web抓取是指使用Python库BeautifulSoup4（简称bs4）来解析网页HTML结构，从中提取所需的数据。通过bs4可以方便地遍历、搜索和修改HTML标记，以及提取文本和属性等信息。

将结果追加到CSV时，仅显示最后两个值可以通过以下步骤实现：

导入必要的库：

from bs4 import BeautifulSoup
import csv

创建一个CSV文件，并打开以追加模式写入数据：

with open('output.csv', 'a', newline='', encoding='utf-8') as csvfile:
    writer = csv.writer(csvfile)

解析网页HTML结构，并找到目标数据：

# 假设已经通过某种方式获取到了HTML页面内容，存储在变量html中
soup = BeautifulSoup(html, 'html.parser')

# 使用bs4的选择器查找最后两个值的元素
values = soup.select('选择器')

提取最后两个值，并将它们追加到CSV文件中：

last_two_values = values[-2:]

# 写入CSV文件
writer.writerow(last_two_values)

在这个例子中，你需要根据实际情况替换"选择器"为合适的CSS选择器或其他选择器，以便准确地选取到目标数据。

需要注意的是，使用bs4进行Web抓取时，需要注意网页的版权和使用限制，遵守相关的法律法规。此外，为了提高效率和稳定性，可以使用适当的反爬虫策略，如设置合理的请求头、使用代理IP等。

腾讯云相关产品推荐：

云服务器（CVM）：可弹性扩展、安全可靠的云计算服务，适用于各种业务场景。详情请访问：云服务器
云数据库 MySQL 版：高可用、灵活扩展的云数据库服务，适用于各种规模的应用。详情请访问：云数据库 MySQL 版
腾讯云对象存储（COS）：可扩展、高可用的云存储服务，适用于存储和处理各种类型的数据。详情请访问：腾讯云对象存储（COS）
人工智能平台（AI Lab）：提供丰富的人工智能能力和开发工具，帮助开发者快速构建和部署 AI 应用。详情请访问：人工智能平台（AI Lab）
腾讯云区块链服务（BCS）：提供稳定、高效的区块链服务，用于构建可信、安全的分布式应用。详情请访问：腾讯云区块链服务（BCS）

请注意，以上推荐的腾讯云产品仅供参考，具体选择还需根据项目需求和实际情况进行评估和决策。

页面内容是否对你有帮助？

有帮助

没帮助

使用bs4进行Web抓取:将结果追加到csv时，仅显示最后两个值

、、、

我是Python e BS4的初学者。我已经阅读了Stack Overflow中的其他帖子，但我不能让它工作！我使用的代码是从学校使用的代码改编的。我正在尝试抓取以下网站:带有BS4和Python3的https://boards.euw.leagueoflegends.com/en/search?query=improve。，但是在将数据附加到csv文件时，我得到了不同的结果：

浏览 8提问于2019-02-19得票数 0

回答已采纳

1回答

未正确地使用python从给定网站中抓取数据

、、、

这是我的剧本：import requests address='' courses_list.append(course) writer=csv</e

浏览 1提问于2015-06-30得票数 0

回答已采纳

1回答

运行一个Flask服务器是否可以防止Node.JS中的web抓取？

、、、

我有兴趣尝试一个网络抓取项目。目标站点使用Javascript动态加载和更新内容。大多数在线讨论都表明，在尝试这样一个项目时，node.js、casper.js、phantom.js和nightmare.js都是相当流行的工具。Node.js似乎是最常用的。如果我正在运行一个烧瓶服务器，并且希望显示一个node.js的结果，例如，在我的站点上以表格格式刮擦，这是可能的吗？我会遇到兼容性问题吗？或者，为了保持一致性，我应该尝试使用基于python的方法来进行BS4

浏览 6提问于2017-04-19得票数 0

回答已采纳

3回答

难以从清单中创建熊猫数据

、、、、

我在从网上抓取数据的时候，很难从我生成的列表中创建一个熊猫df。在这里，我使用漂亮汤从localharvest.org (农场名称、城市和描述)中提取一些关于本地农场的信息。我能够有效地抓取数据，在每次传递时创建一个对象列表。我遇到的麻烦是将这些列表输出到表格df中。('farmdata.csv') 有趣的是，print(df)函数显示这三个列表都被传递给了dataframe。但是，得到的.CSV输出仅包含一列<e

浏览 5提问于2016-08-18得票数 0

回答已采纳

1回答

WebAPI和razor视图引擎

、、、

我使用的是Visual Studio2012中的MVC4。从VS项目模板创建Web API项目时，向导对话框仅显示Razor视图引擎是可选择的。我的问题是，为什么Web API项目需要View，为什么只有Razor？我尝试将API控制器添加到Razor和ASPX engine web应用程序中，结果显示这两个应用程序都可以工作。那么，这是Web API项目模板的问

浏览 0提问于2012-11-17得票数 3

回答已采纳

1回答

发布多个URLs NFL投注数据

、、

我有两个代码:第一:在博彩网站上提取当前的NFL游戏第二:提取游戏URL上的所有投注然而，最大的问题是，我设置的多个URL刮伤是错误的--因为我只从第一次刮取数据。URL抓取：from bs4 import BeautifulSoup result = requests.get(&q

浏览 1提问于2019-08-29得票数 0

回答已采纳

1回答

如何在逻辑应用程序中处理输出到csv的数据

、、、、

我创建了一个逻辑应用程序来将一些数据导出到一个*.csv文件中。我将所有需要的值读取到变量中，然后将这些变量连接起来并添加到数组中。最后，我得到了一个分号分隔字符串数组，其中包含了其中的值。然后将此结果作为文件附件添加到电子邮件中：所有的值在Logic中都是正确处理的，在*.csv文件中也是正确的，但是当我用Excel打开

浏览 3提问于2022-09-21得票数 0

2回答

如何使用Python从BeautifulSoup打印多个值

、

我正在尝试使用BeautifulSoup从一个网页中抓取两个值。当只打印一个值时，内容看起来很好。但是，当打印两个值(到同一行)时，html-代码将显示在其中一个值的周围。这是我的代码：import urllib.request as urllib2 list_open = open("s

浏览 4提问于2016-02-15得票数 1

回答已采纳

1回答

如何使用API网关在WordPress站点上构建基本的web应用程序

、、、、

我想要构建一个简单的软件即服务web应用程序来执行web抓取-每次执行的结果将是一个有几行和几列的结果表。对于前端，我想使用WordPress构建网站，因为我熟悉那里的基本网站，喜欢插件。用户将登录到站点，然后当他们想使用该服务时，将通过表单输入一些关键字，这将发送HTTP请求到AWS API网关，AWS API网关连接到我的Lambda函数。不过，我目前最大的两个难题是：如何使用</

浏览 6提问于2021-05-11得票数 0

回答已采纳

2回答

如何使用Python、Selenium和BeautifulSoup在网上抓取JSP？

、、、、

我绝对是一个用Python进行web抓取的初学者。import the necessary libraries (to be installed if not available): from bs4file named 'branches.csv' df.to_csv</em

浏览 51提问于2020-01-07得票数 0

回答已采纳

2回答

有人能帮我弄清楚如何将这个.txt文件导入到我的代码中吗？

、、、

我在Github的一个存储库上使用VS。我将这个stats.csv文件导入到我的代码中，但是.readlines()调用没有打印任何内容。有人知道为什么吗？os stath

浏览 0提问于2019-07-23得票数 0

0回答

为什么要在javascript中的JSON对象数组中创建额外的数组数组

、、

我使用push命令将JSON对象添加到数组中。添加该数组后，仅显示两个JSON对象。然后我将整个数组添加到另一个包含7个其他数组的数组中。最后，当我访问JSON对象数组时，它显示了两个JSON对象和另一个包含相同对象和数组的数组。在这里我附加了结果的代码和结果。我该如何解决这个问题？

浏览 4提问于2017-06-13得票数 3

回答已采纳

1回答

Flask没有显示我列表的全部内容

、、、、

我正在创建一个web应用程序，它从我的学校网站上抓取课程代码、名称和学分。当我“返回render_template(...)”我只拿回了最后一个课程的名字。但是，当我自己运行for循环并告诉它打印时，我得到了所有东西。这就是代码本身的样子。我吐出我想要的信息：import csv im

浏览 0提问于2019-04-23得票数 0

1回答

BeautifulSoup get_text返回NoneType对象

、、

我正在尝试BeautifulSoup进行网页抓取，我需要从这个中提取标题，特别是从“更多”标题部分。这是我到目前为止尝试使用的代码。import requestsfrom csv import writer {{{*HEADLINE

浏览 12提问于2018-08-05得票数 4

回答已采纳

9回答

BeautifulSoup和Scrapy crawler有什么区别？

、、、

我想做一个网站，显示亚马逊和易趣产品价格的比较。其中哪一个会工作得更好?为什么？我对BeautifulSoup比较熟悉，但对Scrapy crawler不太熟悉。

浏览 323提问于2013-10-30得票数 146

回答已采纳

2回答

使用python比较/从矩阵中提取数据(2.6.1)

、、

我有两个包含相关矩阵的.csv文件，一个文件包含P值，一个文件包含R值。行和列标题在这两个文件之间完全匹配。 Species1 Species2 Species1我尝试过一些策略，包括使

浏览 8提问于2012-02-13得票数 1

回答已采纳

2回答

循环Webscraping与csv的编写

、、、、

我试图从一个网站上的多个URL中抓取非结构化数据。我使用BeautifulSoup成功地提取了我需要的块。然后，为了帮助构造数据集，在将值写入csv文件之前，我将这些值添加到列表中。但是，当试图传输数据时，仅传输列表中的最后一个值。我想这是因为每次调用循环时，列表都会获得新的值。如何不断地向文件中添加新值，以便我的csv

浏览 0提问于2020-06-04得票数 2

回答已采纳

1回答

将大型数组变量(type = object)导出到CSV文件

、

我在Python中使用了APM的Gekko来解决一个优化问题。两个主要的决策变量(DVs)是大数组。问题已经成功地收敛了，但是，我需要在excel工作表中获得这些表的结果，以便进行进一步的工作。由于在Gekko中创建的数组是GKVariable/Object变量类型，所以我不能简单地使用：因为结果给出了数组中每个单元格在模型中定义

浏览 0提问于2019-08-08得票数 5

回答已采纳

1回答

使用Powershell compare_object添加筛选器

、、

我有两个.csv文件，需要对它们进行比较。第一个是Active Directory的摘录，另一个是注册表配置文件列表的摘录。当我比较它们时，我希望仅显示配置文件列表中存在的用户，但在Active Directory中禁用，并添加筛选器以仅显示域中的用户(“域\用户名”)。，但没有结果，因为它不是一个有效的命令： compare-object -referenceobject $(get-content C:\Temp\UsersAD.

浏览 0提问于2018-10-22得票数 0

5回答

用Javascript/jQuery不断返回ajax结果？

、、、

我想知道是否可以使用jQuery的ajax函数不断地将结果返回到页面并相应地进行更新。这背后的想法是，假设你的用户搜索有10,000个结果。用户查看前25个结果所花费的时间，我们可能已经加载了下

浏览 0提问于2009-12-15得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

使用bs4进行Web抓取:将结果追加到csv时，仅显示最后两个值

相关·内容

使用bs4进行Web抓取:将结果追加到csv时，仅显示最后两个值

未正确地使用python从给定网站中抓取数据

运行一个Flask服务器是否可以防止Node.JS中的web抓取？

难以从清单中创建熊猫数据

WebAPI和razor视图引擎

发布多个URLs NFL投注数据

如何在逻辑应用程序中处理输出到csv的数据

如何使用Python从BeautifulSoup打印多个值

如何使用API网关在WordPress站点上构建基本的web应用程序

如何使用Python、Selenium和BeautifulSoup在网上抓取JSP？

有人能帮我弄清楚如何将这个.txt文件导入到我的代码中吗？

为什么要在javascript中的JSON对象数组中创建额外的数组数组

Flask没有显示我列表的全部内容

BeautifulSoup get_text返回NoneType对象

BeautifulSoup和Scrapy crawler有什么区别？

使用python比较/从矩阵中提取数据(2.6.1)

循环Webscraping与csv的编写

将大型数组变量(type = object)导出到CSV文件

使用Powershell compare_object添加筛选器

用Javascript/jQuery不断返回ajax结果？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐