首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

用当前子目录名填充dataframe中的列值

,可以通过以下步骤实现:

  1. 首先,需要导入所需的库和模块,例如pandas库用于数据处理和操作。
  2. 读取包含子目录名的数据集,并将其存储在一个dataframe中。
代码语言:txt
复制
import pandas as pd

# 读取数据集
df = pd.read_csv('dataset.csv')
  1. 创建一个新的列,用于存储子目录名。
代码语言:txt
复制
# 创建新列
df['subdirectory'] = ''
  1. 使用循环遍历dataframe中的每一行,获取当前子目录名,并将其填充到新列中。
代码语言:txt
复制
import os

# 遍历每一行
for index, row in df.iterrows():
    # 获取当前子目录名
    subdirectory_name = os.path.basename(os.path.dirname(row['filepath']))
    # 填充到新列中
    df.at[index, 'subdirectory'] = subdirectory_name
  1. 最后,可以查看更新后的dataframe,或将其保存到新的文件中。
代码语言:txt
复制
# 查看更新后的dataframe
print(df)

# 将dataframe保存到新文件中
df.to_csv('updated_dataset.csv', index=False)

这样,dataframe中的列值就被当前子目录名填充了。请注意,以上代码仅为示例,实际应用中可能需要根据具体情况进行适当的修改。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • linux 常用命令 杂记

    1.cat cat 命令用于连接文件并打印到标准输出设备上。 使用权限 所有使用者 2.Linux chgrp命令用于变更文件或目录的所属群组。 3.Linux/Unix 的文件调用权限分为三级 : 文件拥有者、群组、其他。 利用 chmod 可以藉以控制文件如何被他人所调用。 u 表示该文件的拥有者, g 表示与该文件的拥有者属于同一个群体(group)者, o 表示其他以外的人, a 表示这三者皆是。 + 表示增加权限、 - 表示取消权限、 = 表示唯一设定权限。 r 表示可读取, w 表示可写入, x 表示可执行, X 表示只有当该文件是个子目录或者该文件已经被设定过为可执行。 实例见:https://blog.csdn.net/jiangyu1013/article/details/79656591 4.Linux cmp命令用于比较两个文件是否有差异。 当相互比较的两个文件完全一样时,则该指令不会显示任何信息。 若发现有所差异,预设会标示出第一个不同之处的字符和列数编号。 若不指定任何文件名称或是所给予的文件名为"-", 则cmp指令会从标准输入设备读取数据。 5.Linux file命令用于辨识文件类型。 通过file指令,我们得以辨识该文件的类型。 如执行:file install.log 会输出文件的类型数据:UTF-8 Unicode text file install.log install.log: UTF-8 Unicode text

    02
    领券