首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >从二维数组单元格的pandas列获取唯一值

从二维数组单元格的pandas列获取唯一值
EN

Stack Overflow用户
提问于 2019-03-16 03:53:14
回答 2查看 2.3K关注 0票数 1

我有一个pandas DataFrame,其中列中的每个单元格都是一个二维项数组。

例如:观察值为['Baseball', 'Glove','Snack']的列items

当我对单个单元格使用.unique时,将根据整个数组值而不是数组中的单个值来分析每个单元格。

如何遍历每个单元格中的每个数组,以确定列中真正唯一的项数?谢谢

代码语言:javascript
运行
复制
  Items
0 ['Baseball', 'Hockey Stick', 'Mit']
1 ['Mit', 'Tennis Racket']
2 ['Baseball', 'Helmet']

这些都是作为唯一值返回的,我想获得每个列表中每个值的唯一计数。

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2019-03-16 04:22:10

我将结合使用itertoolschain方法和set as来解决以下问题。

代码语言:javascript
运行
复制
# you have a dataframe called data with the column items.

from itertools import chain
unique_lists_in_items = data.items.unique().tolist()
set_of_items = set(chain(*unique_lists_in_items))

set_of_items就是你想要的。

票数 0
EN

Stack Overflow用户

发布于 2019-03-16 04:05:38

您可以在感兴趣的列上使用np.uniquenp.concatenate。下面我举了一个例子:

代码语言:javascript
运行
复制
import pandas as pd
import numpy as np

df = pd.DataFrame({'fruits':(np.array(['banana', 'apple']), np.array(['cherry', 'apple']))})
#   items
#0  [banana, apple]
#1  [cherry, apple]
np.concatenate(df.fruits.values) #.values accesses the numpy array representation of the column
#array(['banana', 'apple', 'cherry', 'apple'],
#      dtype='<U6')
np.unique(np.concatenate(df.fruits.values)) #unique items
#array(['apple', 'banana', 'cherry'],
#      dtype='<U6')
np.unique(np.concatenate(df.fruits.values), return_counts=True) #counts
#(array(['apple', 'banana', 'cherry'],
#   dtype='<U6'), array([2, 1, 1]))
subset = df.fruits.dropna() # getting rid of NaNs
subset.loc[subset.map(len)!=0] #get rid of zero-length arrays
#0    [banana, apple]
#1    [cherry, apple]
#Name: fruits, dtype: object
np.unique(np.concatenate(subset.loc[subset.map(len)!=0].values), return_counts=True) #This works as desired
#(array(['apple', 'banana', 'cherry'],
   dtype='<U6'), array([2, 1, 1]))
票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/55189818

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档