在python中，有没有办法将原始输入存储在应用于数据帧的函数中？

在Python中，如果你想在应用于数据帧（例如Pandas DataFrame）的函数中存储原始输入，你可以通过几种方式实现。以下是一些常见的方法：

方法一：使用闭包

闭包是一种函数，它可以记住并访问其词法作用域中的变量，即使这个函数在其词法作用域之外被调用。

import pandas as pd

def store_input(func):
    def wrapper(df, *args, **kwargs):
        wrapper.original_df = df  # 存储原始数据帧
        return func(df, *args, **kwargs)
    return wrapper

@store_input
def process_dataframe(df):
    # 这里可以进行数据处理
    return df.dropna()

# 使用示例
df = pd.DataFrame({'A': [1, 2, None], 'B': [4, None, 6]})
processed_df = process_dataframe(df)

# 访问原始数据帧
print(processed_df.original_df)

方法二：使用类和方法

通过定义一个类并在其中定义方法，你可以将数据帧作为类的属性存储。

import pandas as pd

class DataFrameProcessor:
    def __init__(self, df):
        self.original_df = df  # 存储原始数据帧

    def process(self):
        # 这里可以进行数据处理
        return self.original_df.dropna()

# 使用示例
df = pd.DataFrame({'A': [1, 2, None], 'B': [4, None, 6]})
processor = DataFrameProcessor(df)
processed_df = processor.process()

# 访问原始数据帧
print(processor.original_df)

方法三：使用全局变量

虽然不推荐，但在某些情况下，你可以使用全局变量来存储原始数据帧。

import pandas as pd

original_df = None  # 全局变量用于存储原始数据帧

def process_dataframe(df):
    global original_df
    original_df = df  # 存储原始数据帧
    return df.dropna()

# 使用示例
df = pd.DataFrame({'A': [1, 2, None], 'B': [4, None, 6]})
processed_df = process_dataframe(df)

# 访问原始数据帧
print(original_df)