首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Python批量复制Excel中给定数据所在的行

Python批量复制Excel中给定数据所在的行

作者头像
疯狂学习GIS
发布于 2023-10-06 12:30:25
发布于 2023-10-06 12:30:25
1K00
代码可运行
举报
文章被收录于专栏:疯狂学习GIS疯狂学习GIS
运行总次数:0
代码可运行

  本文介绍基于Python语言,读取Excel表格文件数据,并基于其中某一列数据的值,将这一数据处于指定范围那一行加以复制,并将所得结果保存为新的Excel表格文件的方法。

  首先,我们来明确一下本文的具体需求。现有一个Excel表格文件,在本文中我们就以.csv格式的文件为例;其中,如下图所示,这一文件中有一列(也就是inf_dif这一列)数据比较关键,我们希望对这一列数据加以处理——对于每一行,如果这一行的这一列数据的值在指定的范围内,那么就将这一行复制一下(相当于新生成一个和当前行一摸一样数据的新行)。

  知道了需求,我们就可以开始代码的书写。其中,本文用到的具体代码如下所示。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# -*- coding: utf-8 -*-
"""
Created on Thu Jul  6 22:04:48 2023

@author: fkxxgis
"""

import pandas as pd

df = pd.read_csv(r"E:\Train_Model.csv")

result_df = pd.DataFrame()
for index, row in df.iterrows():
    value = row["inf_dif"]
    if value <= -0.1 or value >= 0.1:
        for i in range(10):
            result_df = result_df.append(row, ignore_index=True)
    result_df = result_df.append(row, ignore_index=True)

result_df.to_csv(r"E:\Train_Model_Oversampling_NIR_10.csv", index=False)

  其中,上述代码的具体介绍如下。

  首先,我们需要导入所需的库;接下来,我们使用pd.read_csv()函数,读取我们需要加以处理的文件,并随后将其中的数据存储在名为dfDataFrame格式变量中。接下来,我们再创建一个空的DataFrame,名为result_df,用于存储处理后的数据。

  随后,我们使用df.iterrows()遍历原始数据的每一行,其中index表示行索引row则是这一行具体的数据。接下来,获取每一行中inf_dif列的值,存储在变量value中。

  此时,我们即可基于我们的实际需求,对变量value的数值加以判断;在我这里,如果value的值小于等于-0.1或大于等于0.1,则就开始对这一行加以复制;因为我这里需要复制的次数比较多,因此就使用range(10)循环,将当前行数据复制10次;复制的具体方法是,使用result_df.append()函数,将复制的行添加到result_df中。

  最后,还需要注意使用result_df.append()函数,将原始行数据添加到result_df中(这样相当于对于我们需要的行,其自身再加上我们刚刚复制的那10次,一共有11行了)。

  在最后一个步骤,我们使用result_df.to_csv()函数,将处理之后的结果数据保存为一个新的Excel表格文件文件,并设置index=False,表示不保存行索引。

  运行上述代码,我们即可得到结果文件。如下图所示,可以看到结果文件中,符合我们要求的行,已经复制了10次,也就是一共出现了11次。

  至此,大功告成。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-10-05 22:00,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 疯狂学习GIS 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python筛选、删除Excel不在指定范围内的数据
  本文介绍基于Python语言,读取Excel表格文件,基于我们给定的规则,对其中的数据加以筛选,将不在指定数据范围内的数据剔除,保留符合我们需要的数据的方法。
疯狂学习GIS
2023/09/19
1K0
Python筛选、删除Excel不在指定范围内的数据
Python按需将表格中的每行复制不同次的方法
  本文介绍基于Python语言,读取Excel表格文件数据,并将其中符合我们特定要求的那一行加以复制指定的次数,而不符合要求的那一行则不复制;并将所得结果保存为新的Excel表格文件的方法。
疯狂学习GIS
2024/01/10
5640
Python按需将表格中的每行复制不同次的方法
Excel按条件筛选、去除数据并绘制直方图:Python
  本文介绍基于Python语言,读取Excel表格文件数据,以其中某一列数据的值为标准,对于这一列数据处于指定范围的所有行,再用其他几列数据的数值,加以数据筛选与剔除;同时,对筛选前、后的数据分别绘制若干直方图,并将结果数据导出保存为一个新的Excel表格文件的方法。
疯狂学习GIS
2023/10/19
7740
Excel按条件筛选、去除数据并绘制直方图:Python
Python截取Excel数据并逐行相减、合并文件
  本文介绍基于Python语言,针对一个文件夹下大量的Excel表格文件,基于其中每一个文件,首先依据某一列数据的特征截取我们需要的数据,随后对截取出来的数据逐行求差,并基于其他多个文件夹中同样大量的Excel表格文件,进行数据跨文件合并的具体方法。
疯狂学习GIS
2024/05/13
5000
Python截取Excel数据并逐行相减、合并文件
Python将表格文件的指定列依次上移一行
  本文介绍基于Python语言,针对一个文件夹下大量的Excel表格文件,对其中的每一个文件加以操作——将其中指定的若干列的数据部分都向上移动一行,并将所有操作完毕的Excel表格文件中的数据加以合并,生成一个新的Excel文件的方法。
疯狂学习GIS
2024/04/19
1.1K0
Python将表格文件的指定列依次上移一行
Python随机抽取多个Excel的数据从而整合为一个新文件
  本文介绍基于Python语言,针对一个文件夹下大量的Excel表格文件,基于其中每一个文件,随机从其中选取一部分数据,并将全部文件中随机获取的数据合并为一个新的Excel表格文件的方法。
疯狂学习GIS
2024/05/14
6260
Python随机抽取多个Excel的数据从而整合为一个新文件
Python按要求提取多个txt文本的数据
  本文介绍基于Python语言,遍历文件夹并从中找到文件名称符合我们需求的多个.txt格式文本文件,并从上述每一个文本文件中,找到我们需要的指定数据,最后得到所有文本文件中我们需要的数据的合集的方法。
疯狂学习GIS
2023/11/27
1.2K0
Python按要求提取多个txt文本的数据
Python基于Excel中的分类规则批量重分类遥感影像
  本文介绍基于Python中的ArcPy模块,以Excel表格内的信息,对遥感影像加以重分类的方法。
疯狂学习GIS
2025/06/17
1940
Python基于Excel中的分类规则批量重分类遥感影像
使用Python读取Excel将命令行命令批量运行
我们知道使用Alibaba Cloud CLI是可以列出信息甚至可以做修改。但是如果我有批量的修改需求,那么我怎么去做呢
繁华是客
2024/05/10
4630
Python求取Excel指定区域内的数据最大值
  本文介绍基于Python语言,基于Excel表格文件内某一列的数据,计算这一列数据在每一个指定数量的行的范围内(例如每一个4行的范围内)的区间最大值的方法。
疯狂学习GIS
2024/06/04
7200
Python求取Excel指定区域内的数据最大值
Python统计汇总Grafana导出的csv文件到Excel
原始文件是多个csv表格,第一列为时间戳,每10分钟统计生成一行,其余列为ip地址在该时间段内的访问次数
公众号: 云原生生态圈
2021/05/11
4.7K0
Python统计汇总Grafana导出的csv文件到Excel
Python Excel数据简单处理记录
正在备研的大三把不少东西忘的一干二净的我,花了两个小时对Python的pandas库进行复健最后实现老师那边提出的要求,这里是一些记录
十二惊惶
2024/02/28
4660
玩转数据处理120题|Pandas版本
Pandas进阶修炼120题系列一共涵盖了数据处理、计算、可视化等常用操作,希望通过120道精心挑选的习题吃透pandas。并且针对部分习题给出了多种解法与注解,动手敲一遍代码一定会让你有所收获!
刘早起
2020/04/22
8.4K0
Pandas进阶修炼120题,给你深度和广度的船新体验
本文为你介绍Pandas基础、Pandas数据处理、金融数据处理等方面的一些习题。
数据派THU
2020/07/17
6.8K0
AI批量将英文参考文献中的图书和杂志分开
现在有一大堆英文参考文献,要将其中的图书和杂志分开,在deepseek中输入提示词:
AIGC部落
2024/11/13
3710
AI批量将英文参考文献中的图书和杂志分开
20个经典函数细说Pandas中的数据读取与存储
大家好,今天小编来为大家介绍几个Pandas读取数据以及保存数据的方法,毕竟我们很多时候需要读取各种形式的数据,以及将我们需要将所做的统计分析保存成特定的格式。
用户6888863
2021/12/10
3.8K0
20个经典函数细说Pandas中的数据读取与存储
Pandas入门教程
大家好,我是皮皮。其实这个pandas教程,卷的很严重了,才哥,小P等人写了很多的文章,这篇文章是粉丝【古月星辰】投稿,自己学习过程中整理的一些基础资料,整理成文,这里发出来给大家一起学习。
前端皮皮
2022/08/17
1.6K0
Pandas入门教程
我被百万行 CSV 逼疯时,CodeBuddy 丢给我一个 “作弊级” 优化方案
上周我接了个 “小活”:处理一份120 万行的设备运行日志 CSV,统计每个设备 ID 的日均运行时长,还要按小时段拆分分析。我信心满满打开 PyCharm,写了段 “看起来没问题” 的 Python 代码,然后… 见证了什么叫 “从希望到绝望的两分钟”。
用户9690718
2025/09/12
2620
Pandas 高性能优化小技巧
Pandas 对于Pythoner的搞数据分析的来说是常用的数据操作库,对于很多刚接触Pandas的人来说会发现它是一个很方便而且好用的库,它提供了各种数据变化、查询和操作,它的dataframe数据结构和R语言、Spark的dataframe的API基本一样,因此上手起来也非常简单。但是很多新手在使用过程中会发现pandas的dataframe的性能并不是很高,而且有时候占用大量内存,并且总喜欢将罪名归于Python身上(lll¬ω¬),今天我这里给大家总结了在使用Pandas的一些技巧和代码优化方法。
机械视角
2019/10/23
3.4K0
Pandas 高性能优化小技巧
通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!
这篇万字长文,是黄同学辛苦为大家辛苦翻译排版。希望大家一定从头到尾学习,否则,可能会找不到操作的数据源。
小F
2021/08/20
24.5K0
通宵翻译Pandas官方文档,写了这份Excel万字肝货操作!
推荐阅读
相关推荐
Python筛选、删除Excel不在指定范围内的数据
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档