如何组合有nan值的数组列？

在处理有NaN值的数组列时，可以使用不同的方法进行组合。以下是几种常见的方法：

删除包含NaN值的行：可以使用dropna()函数删除包含NaN值的行。这种方法适用于数据集中NaN值较少的情况，可以通过df.dropna()来删除包含NaN值的行。
替换NaN值：可以使用fillna()函数将NaN值替换为其他值。可以使用均值、中位数、众数或特定值来替换NaN值。例如，可以使用df.fillna(df.mean())将NaN值替换为每列的均值。
插值填充：可以使用interpolate()函数进行插值填充，根据已知数据的趋势来推断NaN值。插值填充可以使用线性插值、多项式插值等方法。
使用前向填充或后向填充：可以使用ffill()函数进行前向填充，使用bfill()函数进行后向填充。前向填充将NaN值用前一个非NaN值进行填充，后向填充将NaN值用后一个非NaN值进行填充。
使用特定值标记NaN值：可以使用isna()函数将NaN值标记为特定值，以便后续处理。例如，可以使用df['column'].isna().replace({True: 'Missing', False: 'Not Missing'})将NaN值标记为'Missing'。

以上方法可以根据具体情况选择使用，以达到合适的数据处理效果。

腾讯云相关产品和产品介绍链接地址：

腾讯云数据计算服务：https://cloud.tencent.com/product/dc
腾讯云数据仓库服务：https://cloud.tencent.com/product/dws
腾讯云数据集成服务：https://cloud.tencent.com/product/dci
腾讯云数据传输服务：https://cloud.tencent.com/product/dts

比较两列中的每个值

、、、

如何比较数据帧中的两列，并根据这两列的差异高效地创建新列？我的表中有一个有很多缺失值的特性，我需要使用数据库中包含相同特性的其他表来回填这些信息。我已经使用np.select比较了我原始表中的功能和其他表中的相同功能，但我觉得应该有一个简单的方法。例如：pd.DataFrame({'A': [1,2,3,4,np.nan], 'B':[1,np.nan,30,4,np.nan]}) 我希望新列包含值[1,2,"different",4,np.nan]。任何帮助都将不胜感激！

浏览 24提问于2019-06-03得票数 0

回答已采纳

1回答

如何删除只在熊猫中最后丢失数据的列？

、

我有一个数据集，其中包含一个可变的列数(每一行中的列的no由该行中的特定值确定)。以下是我目前使用的方法：- pd.read_csv(file_path, names=list(range(100)).dropna(axis=1, how='all') 这将删除所有完全为空的列。唯一的问题是中间可以有列，其中包含空值。例：- abc | | def | 20 | 1 | 2 | ..... | x | | | def | | ghi | 10 | 1 | 2 | ..... | | | | ghi | | jkl | 20 | 1 | 2

浏览 5提问于2021-12-01得票数 1

回答已采纳

1回答

连接两个数据帧行，它们具有不同的列名和行中的不同值。

、、

我有两个dataframe，它有很少的列逗号和很少的列是不同的。并且每个dataframe只有1行，并且包含关于不同运行的信息。那么，我如何组合才能创建一个有2行的数据帧。例： df: a b c 0 1 2 3 df: a y c 0 4 5 6 这只是两个dataframe的示例，但是我将对每个1行的多个数据文件执行此操作。

浏览 0提问于2019-08-16得票数 0

回答已采纳

2回答

Python:如果选定的列为空，则从Pandas Dataframe中删除行

、、

假设我有一个很大的DataFrame，但是我想把精力集中在其中的一个选定部分上，就像4列中的3列一样。如果这些选定的3列的值中至少有2列为空，我希望删除整个行。例如，这是我所拥有的数据，我选择的列是['B','C','D'] A B C D 1 1 2 2 3 3 3 3 4 如果所选列(第二行和第四行)中至少有两个值为空，如何消除这些行。最后的数据是： A B C D 1 1 3 3 3 3

浏览 3提问于2017-10-16得票数 5

回答已采纳

2回答

如何在Pandas DataFrame where子句中使用特定列的值？

、、

当一个特定的列也满足一个单独的标准时，我试图选择熊猫DataFrame中符合特定标准的所有细胞。给定以下DataFrame： A B C D 1/1 0 1 0 1 1/2 2 1 1 1 1/3 3 0 1 0 1/4 1 0 1 2 1/5 1 0 1 1 1/6 2 0 2 1 1/7 3 5 2 3 当D也大于1时，我想以某种方式选择列大于其上一个值的数据。 matches = df[(df >

浏览 3提问于2013-10-21得票数 4

回答已采纳

2回答

如何将列添加到由另一列的n个前面值的数组组成的Pandas dataframe中？

、、、

我对蟒蛇和熊猫很陌生。我不知道如何以优雅的方式解决以下问题。假设我们有一个简单的熊猫数据。 import numpy as np import pandas as pd from pandas import DataFrame, Series df = pd.DataFrame(np.arange(0,60,10), columns=['Value']) 现在设置一个变量，例如： n = 3 目标是将列添加到df，由n个前面的值的数组组成的，如下所示：下一步可能是将NaNs设置为零。有什么明智之举吗？谢谢你的帮助，吉尔伯特

浏览 4提问于2016-06-22得票数 2

回答已采纳

1回答

如何在python中获取数组中所有NaN元素的索引？

、、、

我有一个数组 [ nan, nan, nan, 1633.32, 1661.24, 0. ], [ nan, nan, nan, 2885.94, 3264.09, 0. ], [ 605.48, nan, 599.27, 664.47, 670.68, 0. ], [ nan, nan, nan, 874.59, 783.86, 0. ], [ 1596.01, nan, 1469.77,

浏览 5提问于2017-01-19得票数 1

回答已采纳

1回答

从索引中获取相应的值

、

我有一个目标列Value_0，Value_n和索引列idx_0。idx_k I想得到相应的列Value_{idx_0}，.Value_{idx_k}但是我有这三个困难。索引列类型为float索引列可以有NaN值如果索引列有NaN值，我希望输出列在相同的位置返回NaN值。我怎样才能有效地做到这一点(以一种粗制滥造的方式，不需要循环)？我怀疑写像Value[Idx[~np.isnan(Idx)].astype(int)]这样的代码不会允许我有第三个条件。只有写Value[Idx.astype(int)]才有问题，因为python无法将NaN转换为int。而且仅仅写Value[Idx]是行不

浏览 2提问于2021-07-19得票数 0

1回答

如何删除列值为NaN的行的百分比

、、、

假设我有一个df，其中某个列有50%的缺失值。我如何删除--比方说，与该列相关的10%缺少值的行？基本上，怎样才能将列的缺失值百分比从50%降低到40%？输入(50%的值缺失(6/12))： 0 0 1.0 1 1.0 2 NaN 3 NaN 4 NaN 5 1.0 6 NaN 7 1.0 8 NaN 9 1.0 10 NaN 11 1.0 输出(40%的值丢失(4/ 10 ))：我们删除了ID为8和10的最后2个NaN行 0 0

浏览 1提问于2019-02-11得票数 1

回答已采纳

2回答

如何根据该列中的唯一值生成分层列

、、

我有一个熊猫数据框架，如下所示： S.No Name1 Name2 Size 1 2 3 如何为Name1列中的所有唯一值创建一个层次化列，然后在Name2中为所有唯一值创建列，这将使数据格式如下所示： DAB/T1559.3-1991商品、商品、商业、金融等领域的产品 ( S.NO ) 1 2、成品率、 3

浏览 1提问于2018-03-05得票数 0

1回答

使用numpy.ndarray填充数据帧中的缺失值

、、、、

我有一个数据帧和nparray，如下所示 import pandas as pd import numpy as np dic = {'A': {0: 0.9, 1: "NaN", 2: 1.8, 3: "NaN"}, 'C': {0: 0.1, 1: 2.8, 2: -0.1, 3: 0.5}, 'B': {0: 0.7, 1: -0.6, 2: -0.1, 3: -0.1},} df=pd.DataFrame(dic) print(df) A C B 0

浏览 42提问于2020-03-28得票数 1

回答已采纳

1回答

Matlab-读取不规则文本文件

、、

如何在matlab中读取包含以下文本的文本文件？ B4070IC05.tif,11 B4070IC06.tif,11,15,16,6,7 B4070IC07.tif,13,14,4,18,9 B4070IC08.tif,10,7 B4070IC09.tif,4,22,7 B4070IC10.tif,14,15,19,20,24,29,9 B4070IC11.tif,10,11,20,21 B4070IC12.tif,13,14,5,9 我不知道文本的列数。有没有办法将这些数据放入一个单元格矩阵中？如何在加载数据后打印单元格矩阵？

浏览 1提问于2014-10-12得票数 1

回答已采纳

2回答

有多少行的值来自同一栏--熊猫

、、

我有一个df，它有许多列，代表组成指数的公司的市值。数据的索引是日期。在公司进入该指数之前或离开该指数后，该公司在df中的市值为零。我想知道指数不变的平均天数。例如： [in]: df = pd.DataFrame(np.array([[1, 1,np.nan], [np.nan,2, 10], [1,3, 100],[4,np.nan, 100]]), columns=['a', 'b','c']) df [out]: a b c 0

浏览 0提问于2018-02-06得票数 2

2回答

熊猫series.notna()返回真实的包含NaNs的系列

、

我有一个dataframe，我正在设置它来创建一个系列，然后在执行代码之前搜索该系列是否包含任何nans。但是我得到了NaNs被传递给后续代码的系列。 dataframe示例： sample classification type similar ... respiraroty activity antimicrobial molecular details Litrature 7 M41 predicted melanin melanin ... NaN

浏览 3提问于2020-04-07得票数 1

回答已采纳

4回答

在MATLAB中，在矩阵中每列都有非零元素的行中的最低位置。

、

例如，我有一个4x6矩阵A： A = 0 0 0 0 4 3 0 2 1 0 0 0 0 5 0 8 7 0 8 9 10 3 0 2 我希望在A行中找到每个列的非零元素的最低位置。应该是这样的： column 1 => row 4 column 2 => row 2 column 3 => row 2 column 4 => row 3 column 5 => r

浏览 16提问于2015-05-29得票数 2

回答已采纳

4回答

NaN和None的区别是什么？

、、、

我正在使用pandas readcsv()读取csv文件的两列，然后将这些值分配给一个字典。列包含由数字和字母组成的字符串。偶尔也会出现单元格为空的情况。在我看来，读取到该字典条目的值应该是None，而不是赋值为nan。当然，None更能描述一个空单元格，因为它有一个null值，而nan只是说读取的值不是一个数字。我的理解是正确的吗？None和nan有什么区别？为什么要分配nan而不是None 此外，我的字典检查是否有空单元格一直使用numpy.isnan() for k, v in my_dict.iteritems(): if np.isnan(v): 但是这会给我一个错误，告诉

浏览 2提问于2013-07-09得票数 121

回答已采纳

2回答

根据另一列中的值创建新列

、、

浏览 2提问于2020-06-18得票数 0

3回答

如何从一个数据帧中提取列标题并将其添加到另一个数据帧中？

、、

我的目标是将小df中的列标题添加到现有的大型数据帧中，而无需手动键入名称。这是一个小的数据框架。 veddra_term_code veddra_version veddra_term_name number_of_animals_affected accuracy 335 11 Emesis NaN NaN 142 11 Anaemia NOS NaN

浏览 23提问于2021-01-20得票数 1

1回答

检查如何从numpy矩阵中删除特定元素？

、、、

例如，我有一个numpy数组： game.mat = np.zeros((6,7)) 例如，如何删除矩阵的第0行和第5列中的元素？可以使用np.delete()函数吗？

浏览 0提问于2018-11-11得票数 0

2回答

在python中计算二进制值

、

我有一个缺少值的数据，其中的可定位选项为真或假，因为存在NaN情况，熊猫将该列作为浮动列，并在计算该列并获得值: 0、0.5和1之后如何将约束添加到只获得0和1？目前，我使用的是丢失的库 from missingpy import MissForest

浏览 0提问于2020-01-29得票数 0

2回答

有没有办法用NaN替换现有的值？

、、、

我正在试验iPython笔记本中的算法，并想知道是否可以在任意位置用Nan (大约50%或更多)替换数据集中的现有值，每一列都有不同比例的Nan值。在这个实验中，我使用Iris数据集来查看算法是如何工作的，以及哪个算法工作得最好。数据集的链接是这里。提前谢谢你的帮助。

浏览 0提问于2018-04-12得票数 2

回答已采纳

4回答

保持NaNs与熊猫的数据不平等

、

我有一个pandas.DataFrame对象，它包含大约100列和200000行数据。我正在尝试将其转换为bool dataframe，其中True表示值大于阈值，False表示值较少，NaN值被维护。如果没有NaN值，则需要大约60 ms才能运行： df >= threshold 但是当我试图处理NaNs时，下面的方法可以工作，但是非常慢(20秒)。 def func(x): if x >= threshold: return True elif x < threshold: return False else:

浏览 8提问于2015-11-18得票数 16

回答已采纳

1回答

熊猫/ Numpy重组excel电子表格

、、、

有50+ 'URL‘列，其中大多数是空的，但我想迭代这些列，并获取非空的单元格值。然后，这些值将存储在一个新列中。我怎么能这样做呢？以下是我的想法：导入Pandas并创建dataframe import pandas as pd import numpy as np df = pd.read_csv("Original.csv") 创建只包含URL列的列表 URL_col = MRB[['URL 2','URL 3','URL 4','Fact URL','Fact URL 2',

浏览 2提问于2022-03-29得票数 0

1回答

使用genfromtxt读取不同列长的数据

、

有以下具有不同列长的数据集： 5.0 0.4 0.92 11.45 44.18 33.66 3.2 4.92 7.2 11.73 46.98 118.63 3.6 11.43 14.32 8.88 71.3 1.99 9.12 11.71 15.56 20.24 0.77 21.92 2.47 33.99 80.68 0.91 4.32 14.6 15.69 127.8 2.67 2.1 5.14 7.96 46.88

浏览 5提问于2016-03-20得票数 2

回答已采纳

2回答

获取一个列有值而另一个列没有值的行数

、

我有一个48列和4000行的dataframe。我想知道一个列有一个值而另一个列为null的行数(或%)，但是对于所有列(作为阶乘，我可以在一行、填充变量和NaN之间获得所有可能的组合)。例如，：在20%的行中，varA被填充，所有其他行都是NaN。在30%的行中，varA和varB被填充，其余的都是Nan。有人能帮我处理python的代码吗？ (提前谢谢你:)

浏览 15提问于2022-09-12得票数 0

1回答

根据python中另一列的条件递增一列

、、

我有一个数据框，我想根据另一个列"col“上的条件创建一个新的列名为" new”。创建新的列名为" new“，并在"col”中找到任何值时对其进行计数。感谢您的回答，我是Python新手，因此我不确定该如何操作 index col 1 2.11.67 2 NaN 3 NaN 4 5.10.56 5 NaN 6 2.10.67 7

浏览 14提问于2021-09-23得票数 1

回答已采纳

2回答

如果一组值中的任何一组为空，则删除行

、

我有一个包含很多列的DataFrame，我希望删除一些列的值为null的行。我知道如何用一个专栏来做这件事： df = df[df['Column'] != ''] 我想用一组列来做这件事，如下所示： df = df['' not in [df['Column1'], df['Column2'], df['Column3']]' 但是，这会产生错误： ValueError:系列的真值是不明确的。使用a.empty、a.bool()、a.item()、a.any()或a.all()。

浏览 4提问于2017-06-29得票数 2

回答已采纳

1回答

使用Numpy genfromtxt时出现问题

、

嗨，我想处理一个数据文本文件，但我似乎有很多代码的问题。文本文件如下所示 -7 -9.000000000000002 -3 622.0582425616101 -6.500000000000001 -9.000000000000002 -3 622.1498719223513 -6 -9.000000000000002 -3

浏览 7提问于2017-12-31得票数 0

2回答

Scikit-学习均值附近随机值的自定义计算机

、

我想创建一个自定义计算器，用NaN值所在列的mean - std和mean + std范围内的随机值替换数据中的NaN值。这是我到目前为止使用的输入机的代码： class GroupImputer(BaseEstimator, TransformerMixin): def fit(self, X, y=None): X = check_array(X, force_all_finite=False) self.means = np.nanmean(X, axis=0) self.stds = np.nanstd(X, axis=0)

浏览 37提问于2020-10-19得票数 1

回答已采纳

1回答

NumPy，SciPy -如何计算数组子集的z得分？

、

以下面的数组a为例，我正在寻找一种可伸缩的方法来分别为第三列a[:, 3:]中的每个值计算最后两列a[:,2]的z score In [52]: import numpy as np; from scipy import stats In [53]: a = np.array([[0., 0., 0., 1., 2.], [ 0., 0., 1., 3., 4.], [ 1., 0., ...: 0., 5., 6.], [1., 0., 1., 7., 8.], [ 2., 0., 0., 9., 6.], [2., ...: 0.,

浏览 33提问于2020-03-31得票数 0

回答已采纳

4回答

将numpy数组与公共维度“合并”

、、、

我有两个矩阵，对应于数据点(x,y1)和(x,y2) x | y1 ------------ 0 | 0 1 | 1 2 | 2 3 | 3 4 | 4 5 | 5 x | y2 ---------------- 0.5 | 0.5 1.5 | 1.5 2.5 | 2.5 3.5 | 3.5 4.5 | 4.5 5.5 | 5.5 我想要创建一个新的矩阵，它将x值组合成一个列，并在适当的y1，y2列中包含NaN： x | y1

浏览 4提问于2017-11-18得票数 12

回答已采纳

2回答

或/和跨栏的语句

、

我试图创建一个新的列检查，检查我的颜色列和我的大小列，如果颜色是蓝色，大小大于50，那么该列应该是所有者，否则保留为空。如果Color = Blue & Size > 50，那么Owner ELSE为空我有以下几点： df['Check'] = df['Color'].apply(lambda x,y: df['Owner'] if (x == 'Blue') & (y > 50) else null) 我不知道该如何做，告诉apply函数将Color包含为x，大小为y。然后，对于lambda公式中

浏览 1提问于2020-10-01得票数 0

回答已采纳

3回答

创建一个if-elif方案语句作为字典

、、、

我有下面的语句，if col1="string1" and col2="string3"然后是newcol="newstring"，如果是col1="stringX"，那么是col2="stringY"然后是newcol="newstringZ"，我该如何将其构建到字典中，以便我可以应用映射函数来使用字典来检查和插入数据帧的新列？ df = pd.DataFrame( { 'col1': ['string1', 'string1', &

浏览 0提问于2021-10-21得票数 0

2回答

替换除熊猫数据栏外的所有列中缺失的值

、

我有一个熊猫数据栏，有10列，我想填充除一列之外的所有列的缺失值(假设该列称为test)。目前，如果我这样做： df.fillna(df.median(), inplace=True) 它用中值替换所有列中的NA值，如何在不指定所有其他列的情况下排除特定列。

浏览 5提问于2017-03-21得票数 8

回答已采纳

3回答

如何根据Python中的某些条件将当前行与前2行进行比较

、、、

我有一个类似于下面的数据集，我想根据以下条件比较每一个库存项目的所有行如果“”列为非空，则将其标记为"yes"。如果所有行(每个库存)的“”列为空，则对“”列计算"item“列，如果"item”列不为空，则应将该行标记为“是”。或"value“下的1条记录为空，其中"value”下的2条记录不为空，则这2行需要根据项进行计算。如果"value“和"item”都为null(每个库存)，则对“年份”列进行评估，并标记最新的年份"yes“。或"value“为null，但"item”下的1条记录为null，其

浏览 4提问于2022-03-19得票数 0

回答已采纳

2回答

熊猫:替换列列表中的值列表

、、

我有很多行，很多列数据，它们有不同的“占位符”值，需要替换(在列的子集中)。我在论坛上读过许多使用嵌套列表或字典的例子，但没有发现变体。 # A test dataframe df = pd.DataFrame({'Sample':['alpha','beta','gamma','delta','epsilon'], 'element1':[1,-0.01,-5000,1,-2000], 'elemen

浏览 3提问于2016-07-10得票数 3

回答已采纳

1回答

如何在matlab中将N个向量连接到矩阵中？

、、

我试过查这个，但不知道该找什么. 我需要“表连接”N个向量，意思是，创建一个矩阵，其中每个输入向量都有一行，每个可能的条目都有一个列。另外，如果有一个翻译向量可以方便地访问哪个列负责哪个条目，那就太好了。例如 a = [3, 2, 4, 9] b = [3, 1, 5, 9] c = [2, 4, 9, 6] 然后 join(a, b, c) = [ 3; 2; nan; 4; nan; 9; nan, 3; nan; 1; nan; 5; 9; nan, nan; 2; nan; 4; nan; 9; 6, ] 有一个平移向量 [3,2,1,4,5,

浏览 0提问于2016-03-31得票数 0

回答已采纳

1回答

如何将Pandas列切片转置并插入行切片？

、、、、

尝试从一个Pandas数据帧中提取列的切片，转置该切片，并将其插入到不同数据帧中类似大小的行切片中。两个数据帧中的标签和索引不同。对于大型数据帧，我目前正在运行for循环，逐个单元格地复制每个值，但效率非常低。除了for循环，我已经尝试了.loc，.iloc，与转置，但没有成功。pivot，pivot_table，melt在这里似乎不适用，否则我无法理解如何将它们应用于这个看似简单的问题。 # Two dataframes here import pandas as pd import numpy as np numRng = np.arange(20).reshape((5, 4)) df

浏览 15提问于2019-07-10得票数 1

回答已采纳

1回答

如何将每一栏中的每个NaN值替换为熊猫中该列的最小值？

、、

我有一个dataframe，我想用列的NaN替换每个列中的每个min()值，我如何做到这一点？

浏览 3提问于2022-12-02得票数 0

回答已采纳

3回答

如何输出NumPy中忽略nan的最后一列元素？

、、、

我有一个NumPy 2D数组，如下所示： data.dat X1 X2 X3 X4 1 1 1 1 2 2 4 2 3 3 9 3 4 4 16 4 5 5 25 5 6 6 36 6 7 nan 49 7 8 nan 64 8 9 nan 81 nan 10 nan nan nan 现在，如何输出每个列的最后一个元素，忽略数组中的nan。我尝试了以下代码，但没有成功： A[~np.isnan(A)][-1] 代码使用 import numpy as np with open('data.dat

浏览 1提问于2015-05-24得票数 1

2回答

找到所有列之间的重复值，然后用Pandas在新列中排序？

、

我有一个DataFrame： CL1 CL2 CL3 CL4 0 a a b f 1 b y c d 2 c x d s 3 x s x a 4 s dx s s 5 a c d d 6 s dx f d 7 d dc g g 8 f x s t 9 c x a d 10 x y y a 11 c a x y 12 f s d s 13 d d w a 意图：在帮助下潘达斯我

浏览 0提问于2021-01-30得票数 0

回答已采纳

1回答

如何判断给定的2D数组在python中是否有空列

、

1问题我在练习。问题60询问如何判断给定的2D数组是否有空列？我想知道它是否要求检查一个满为0的列，还是用nan填充的一列？我找到了2种解决方案如果空列表示值都等于0的列，则此答案满足。 # Author: Warren Weckesser Z = np.random.randint(0,3,(3,10)) print((~Z.any(axis=0)).any()) 它使用了any()的一个技巧。注意到如果数组中的某个值不等于0，np.array().any()将返回True。例如： np.array([0,-1,0]).any() [Out]: True 但是，如果空列表示值都等于n

浏览 1提问于2019-04-30得票数 1

回答已采纳

3回答

有什么办法可以让熊猫DataFrame的几个栏目联合起来吗？

、

我不需要合并/连接列或用其他值替换某些值(although...maybe是吗？)。但是，我有一个大型的dataframe (>100行和列)，我想提取“几乎相同”的列，即有>2个值(在相同的索引中)，而在其他索引中没有不同的值(如果一个列中有一个值，则另一个列中必须有一个NaN )。下面是这样一个数据挖掘的例子： a = np.random.randint(1,10,10) b = np.array([np.nan,2,np.nan,3,np.nan,6,8,1,2,np.nan]) c = np.random.randint(1,10,10) d = np.array([7,2

浏览 3提问于2017-04-03得票数 1

1回答

如何连接python中的行？

、、、

如何将df的两列连接为一个列？我尝试过很多可能的组合(附加，np，和连接).总是有一个错误或者表是这样输出的 ` A B 0 75 Nan 1 71 NaN 2 NaN 83 3 NaN 64 ` 而不是只在一列中我该怎么做？

浏览 4提问于2022-11-08得票数 0

2回答

使用空数据过滤熊猫数据栏

、、

我有一个带有200+栏的熊猫数据。我试图检查所有带有空数据的列。如何筛选/显示具有空数据的列？df.isnull().sum()列出所有列的计数，但我只希望看到列数为非零空值的列，因为列数很高。

浏览 0提问于2018-11-04得票数 1

回答已采纳

2回答

我如何比较不同行的一列与Levenshtein距离度量大熊猫？

、、、

我有一张这样的桌子： id name 1 gfh 2 bob 3 boby 4 hgf 等。我想知道如何使用Levenshtein度量来比较我的“name”列的不同行？我已经知道我可以用它来比较列： L.distance('Hello, Word!', 'Hallo, World!') 但是行呢？

浏览 4提问于2015-04-03得票数 2

回答已采纳

2回答

有一个或多个NaN的列的Pandas过滤器名称

、、、

你好，你能帮我一下吗？我有CSV，我想要只有int64或float并且有一个或多个Nan值的列的名称。我知道只过滤列，什么有int64或float，但是如何为NaN添加条件？ df.loc[:, (df.dtypes == np.int64) | (df.dtypes == np.float_)].isna().any().index.values

浏览 11提问于2022-06-25得票数 0

1回答

如果包含单个NaN并合并列，则将整个组设置为NaN

、

我有一个df a b c d 0 1 nan 1 0 2 2 nan 0 2 3 4 1 3 1 nan 1 1 nan 3 1 1 2 3 1 1 2 4 我需要按a和b分组，然后如果c或d在组中包含一个或多个nan，我希望特定列中的整个组都是nan： a b c d 0 1 nan 1 0 2 2 nan 0 2 3 nan 1 3 1 nan 1 1 nan 3 1 1 nan 3 1 1 nan 4 然后再加上c和d，就不再有na

浏览 13提问于2020-05-03得票数 2

2回答

将'.npy‘文件中的数据直接读取到数组

、、

这也许是个愚蠢的问题，但我似乎找不到答案。我有一个以前使用np.save保存的大型数组，现在我想将数据加载到一个新文件中，从每个列创建一个单独的列表。唯一的问题是，我的大数组中的一些行只有一个nan值，因此数组看起来如下(作为一个非常简化的示例)： np.array([[5,12,3], [nan], [10,13,9], [nan], [nan]]) 我可以使用for循环来实现我想要的结果，但我想知道是否有比这更好的方法： import numpy as np results = np.load('

浏览 2提问于2016-07-19得票数 0

回答已采纳

2回答