,可以通过以下步骤实现:
import pandas as pd
# 读取数据集
df = pd.read_csv('dataset.csv')
# 创建新列
df['subdirectory'] = ''
import os
# 遍历每一行
for index, row in df.iterrows():
# 获取当前子目录名
subdirectory_name = os.path.basename(os.path.dirname(row['filepath']))
# 填充到新列中
df.at[index, 'subdirectory'] = subdirectory_name
# 查看更新后的dataframe
print(df)
# 将dataframe保存到新文件中
df.to_csv('updated_dataset.csv', index=False)
这样,dataframe中的列值就被当前子目录名填充了。请注意,以上代码仅为示例,实际应用中可能需要根据具体情况进行适当的修改。
领取专属 10元无门槛券
手把手带您无忧上云