如何使用Python巧妙地匹配两个数据帧(使用pandas或其他方式)？

、、、

我有一个熊猫数据框架，由世界城市的名称以及城市所属的国家的名称组成，0 Qal eh-ye Now Afghanistan1 Chaghcharan Afghanistan和另一个由世界大学地址组成的数据帧，如下图所示： university我想把城市的名字和世界上大学的地址匹配起来。也就是说，我想知道每所大学都位于哪个城市。希望匹配的城

浏览 36提问于2016-09-06得票数 4

3回答

如何使用Python中的在同一y轴上绘制多行

、、、

我只是巧妙地安装了快车。我试着做一些简单的事情-把我的数据帧的每一列都画在相同的y轴上，索引是x轴。以下是问题/意见：请注意，我不是想用巧妙的方式添加痕迹，而是尝试使用巧妙的表达方式</

浏览 0提问于2019-09-27得票数 27

回答已采纳

1回答

如何用Pandas计算两个数据帧之间的百分比差？

、、、、

我正在使用pandas，并执行一些计算和转换，最后得到两个数据帧，它们看起来或多或少如下所示：Total 4 5Total 3 4Normal 0 1现在，考虑到这两个数据帧

浏览 0提问于2019-03-21得票数 2

回答已采纳

1回答

使用Pandas处理Python中的大型SQL查询？

、、、、

我想对一些数据进行备份测试，这些数据将使用Python、psycopg2和Pandas从Postgres数据库中提取。将从Postgres提取的数据非常大(超过10 of )--即使Pandas数据帧能够存储这么多数据，我的系统也无法以RAM的形式保存这些数据。综上所述，我希望我的Python程序需要执行以下操作： 1:连接到远程(基于局域网) Postgres<

浏览 27提问于2017-11-02得票数 3

回答已采纳

1回答

如何在多个dataframe lambda函数上实现dask映射分区？

、、、、

我已经使用pandas实现了两个数据帧之间的模糊字符串匹配算法。我的问题是如何将其转换为使用多核的dask操作？我的程序在纯python上运行大约3-4天，我想并行操作以优化时间成本。('my_csv.csv', skipinitialspace=True, usecols=fields) 然后，我必须根据每个字符串关联的数值将数据帧emb细分为两个数据

浏览 3提问于2018-05-19得票数 0

1回答

我正在尝试合并两个都有'product_desc‘列的数据帧。我使用的是Pandas 0.13和Python 2.7。small_df = pd.merge(small_df, linregress_df, on = 'product_desc', how = 'left')pandas.core.index.InvalidIndexError: Reindexing only valid wi

浏览 8提问于2014-06-09得票数 2

3回答

基于Pandas中的公共列值合并两个数据框

、

如何从具有共同列值的两个数据帧中获得合并的数据帧，使得只有那些行使得合并的数据帧在特定的列中具有共同的值。要删除的其他行。如有任何帮助/建议，我们将不胜感激。

浏览 6提问于2017-04-09得票数 76

回答已采纳

1回答

Spark中的用户定义函数(UDF)是否在集群工作节点上并行运行？

、

假设我在python中创建了一个函数，所以将一个数字求幂为2： def squared(s):%sql select id, squaredWithPython(id) as id_squared from test 那么，如果数据分布在工作节点的内存上同样，在DataFrames中使用UDF也是如此。请注意，代码从以下位置检

浏览 33提问于2019-10-10得票数 0

回答已采纳

2回答

用NA替换pandas数据框中所有出现的值的快速方法

、

我正在使用python脚本来清理和连接许多大型.csv文件。具体地说，我正在使用pandas read_csv函数读取文件，然后将它们作为dataframe对象进行处理，这非常有效。这是我第一次使用pandas，所以我仍然在习惯它包含的所有令人难以置信的有用功能。我正在读取的csv文件使用-99.9作为标记值来表示NA/NaN。由于这与我在其他地方表示丢失数据的方式不同，因此我希望将-9

浏览 0提问于2013-07-05得票数 2

回答已采纳

1回答

Python:如何在两个数据集之间查找匹配的数据条目并执行有效的计算

、、

例如，假设我有两个数据集以Pandas数据帧的形式存储，如下所示： Data1:"Peter" "kiwi""Susan" "peach" C3 C4"

浏览 5提问于2018-12-19得票数 1

1回答

Pandas在合并两个数据帧和某些列的值时不会继续

、、、、

我尝试在pandas中使用left merge在公共列上将两个数据帧组合在一起，只有当我这样做时，我合并的数据不会继续，而是提供NaN值。所有的列都是对象，并以这种方式匹配，所以我不太确定发生了什么。这是我的第一个dateframe头文件，它是程序的输出 ? 这是我的第二个数据帧头。第二个df是一个“关键”文档，用于将第一个输出与其正确的id/品味/等进行匹配，并且它们

浏览 18提问于2020-11-06得票数 0

3回答

Python:快速高效地编写大型文本文件的方法

、、、、

我有一个关于python的速度/效率相关的问题：我需要写大量非常大的R数据帧文件，大约0.5-2 GB大小。这基本上是一个大的制表符分隔的表，其中每一行都可以包含浮点数、整数和字符串。通常，我会将所有数据放入numpy dataframe中，然后使用np.savetxt保存它，但由于存在不同的数据类型，因此不能真正将其放入一个数组中。因此，我求助于简单地手动将线组装为字符串，但这有点慢。

浏览 0提问于2014-02-26得票数 5

1回答

可以使用SQL操作通过Pandas创建的数据帧吗？

、、、

因此，我正在尝试创建一个python脚本，该脚本允许我在使用pandas创建的数据帧(masterfile)上执行SQL操作。数据帧从特定文件夹中找到的csv文件中提取其内容。我能够成功地创建其他所有内容，但我在SQL操作部分遇到了麻烦。我正在尝试使用数据帧作为“数据库”，在这里我将使用我的SQL查询来拉取数据，但是我得到了一个

浏览 12提问于2020-06-28得票数 0

3回答

如何在python中组合csv数据

、、、

我有两个CSV文件，我想将它们合并到一个文件中。

浏览 24提问于2019-07-10得票数 1

回答已采纳

2回答

Pandas Dataframe to Apache Beam PCollection转换问题

、、、

不幸的是，当我使用to_pcollection()函数时，我得到以下错误： AttributeError: 'DataFrame' object has no attribute '_expr' 有谁知道怎么解决这个问题吗我使用的是pandas=1.1.4、beam=2.25.0和Python3.6.9。

浏览 29提问于2020-11-26得票数 2

回答已采纳

2回答

查找两个数据帧/列表中的字符串之间的差异，输出差异

、、

所以我有一张excel表格，我正在试着分析两个版本之间的差异。具体地说，我有两个列；A和B。我导入到python中，并使用pandas使A和B都有自己的数据帧(分别称为dfA和dfB)。2 dog smalldog 3 mouse hugemouse 4 child normalchild 我尝试输出第三列，其中包含两个数据帧之间的

浏览 3提问于2019-03-28得票数 0

1回答

如何合并pandas数据帧并过滤不同列中的重复内容？

、

我目前正在学习python2.7中的pandas。我正在学习pandas中的merge()方法。下面是我创建数据帧的代码： 'B': ['bbb',eibi) 输

浏览 4提问于2018-01-21得票数 3

回答已采纳

3回答

Python Pandas -合并条件

、、、、

我在python pandas中有两个数据帧User_id zipcode 数据帧2如何

浏览 3提问于2016-10-29得票数 3

2回答

基于Pandas数据帧中的几个变量计算概率

、、、

我对Python和Pandas还很陌生，所以请耐心听我说……def survivability(total_pass_df, column, value): survivors我确实为这两个组制作了

浏览 2提问于2017-01-08得票数 1

2回答

实际上:如何改变方框中的晶须长度(最小/最大)？

、、

我知道1.5 * IQR是一个常见的规则，但是如果可能的话，我想画出其他的min/max。我正在巧妙地使用(python)。基本上，我想定义一个函数，通过参数数据帧、列和自定义乘法器来显示盒图。在本例中由3或任何其他数字组成。谢谢!

浏览 5提问于2019-12-01得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

如何使用Python中的在同一y轴上绘制多行

如何用Pandas计算两个数据帧之间的百分比差？

使用Pandas处理Python中的大型SQL查询？

如何在多个dataframe lambda函数上实现dask映射分区？

如何重新建立索引以合并两个数据帧？

基于Pandas中的公共列值合并两个数据框

Spark中的用户定义函数(UDF)是否在集群工作节点上并行运行？

用NA替换pandas数据框中所有出现的值的快速方法

Python:如何在两个数据集之间查找匹配的数据条目并执行有效的计算

Pandas在合并两个数据帧和某些列的值时不会继续

Python:快速高效地编写大型文本文件的方法

可以使用SQL操作通过Pandas创建的数据帧吗？

如何在python中组合csv数据

Pandas Dataframe to Apache Beam PCollection转换问题

查找两个数据帧/列表中的字符串之间的差异，输出差异

如何合并pandas数据帧并过滤不同列中的重复内容？

Python Pandas -合并条件

基于Pandas数据帧中的几个变量计算概率

实际上:如何改变方框中的晶须长度(最小/最大)？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐