我正在与许多托管在AWS S3桶中的CSV一起工作,它们有许多不同的原理图(例如,一个CSV可能有标题'Name‘、’身高‘、’体重‘,还有一个可能有标题'Name’、‘道布’、'Sex')。我有一个AWS MySQL Sex无数据库实例,在它上有一个包含模式的数据库表(例如,使用上面的例子,它的模式可能是'Name‘、’身高‘、’体重‘、’道布‘、’性别‘)。我编写了一个函数,它连接到数据库,作为一个列表获取相关表<e
我正在尝试用两个不同数据集中的正确值填充我的主数据集中缺少的和不正确的值。我创建了一个完整数据集的缩略版,如下所示(请注意,实际数据集有几千行长): import pandas as pd
data = {'From':['GA0251','GA5201','GA5551'对于From和To,我都有两个</em