腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >用numpy数组和DataFrame掩蔽熊猫DataFrame

问用numpy数组和DataFrame掩蔽熊猫DataFrame
EN

Stack Overflow用户

提问于 2018-08-31 14:48:24

回答 2查看 4.3K关注 0票数 5

我想使用2D布尔掩码来选择性地改变pandas DataFrame中的一些单元格。我注意到我不能(成功地)使用numpy数组作为掩码，但我可以使用DataFrame。然而，更令人沮丧的是，我没有发现numpy方法的错误。

例如,

df = pd.DataFrame({'A':[1,2,3,4], 
                   'B':[10,20,30,40]})

mask_np = np.array([[True,True],
                    [False,False],
                    [True,False],
                    [False,True]])

mask_pd = pd.DataFrame(mask_np, columns=['A','B'])

我认为任何一个掩码都会从df返回值，而不管掩码是True。但是，相反，df[mask_np]生成

这不是我所期望的，我也无法解释。另一方面，df[mask_pd]生成

     A     B
0  1.0  10.0
1  NaN   NaN
2  3.0   NaN
3  NaN  40.0

这正是我所期望和想要的。

为什么我不能使用numpy面罩？我的网络搜索没有发现任何相关的东西。任何解释背后的差异，将不胜感激！

pandas版本0.20.3；Python3.6.3

python

pandas

numpy

dataframe

在线客服搭建方案

搭建集AI机器人、在线客服、智能外呼等多功能服务的客服系统，支持快速接入及自搭建客服系统，从而让顾客快速得到解答

回答 2

Stack Overflow用户

发布于 2018-08-31 15:28:57

源代码说明了原因。__getitem__方法( []是语法糖)专门检查是否通过dataframe进行索引：

elif isinstance(key, DataFrame):
    return self._getitem_frame(key)

如果数据类型为布尔型，则调用的_getitem_frame方法返回pd.DataFrame.where：

def _getitem_frame(self, key):
    if key.values.size and not is_bool_dtype(key.values):
        raise ValueError('Must pass DataFrame with boolean values only')
    return self.where(key)

NumPy数组( _getitem_array )所采用的路径是不同的，而且更加复杂。由于某些原因，代码的设计目的是以不同的方式对待NumPy / Pandas输入，而不是确保相同数据类型的一致性。

带Pandas数据的常规布尔索引通常沿轴执行，即行/轴0通过df.loc[mask, :]或列/轴1通过df.loc[:, mask]。

注意，为了清晰起见，您可以也可能应该直接访问pd.DataFrame.where：

res = df.where(mask_np)

print(res)

     A     B
0  1.0  10.0
1  NaN   NaN
2  3.0   NaN
3  NaN  40.0

票数 3

Stack Overflow用户

发布于 2018-08-31 16:34:58

将True的行索引写在mask_np中:行0、行0、行2、行3。选择在df中具有相同索引的行，并将它们连接起来。这就是df[mask_np]的生成方式。

这可能是Pandas的错误，因为在源代码中假定用于索引的数组是一维的。

查看源代码(Pandas 0.23.4)，

df[mask_np]

等于

df._getitem_bool_array(mask_np)

等于

indexer = mask_np.nonzero()[0]
df._take(indexer, axis=0)

通过以下评价：

>>> mask_np.nonzero()
(array([0, 0, 2, 3]), array([0, 1, 0, 1]))

数组的这个元组表示沿数组尺寸的非零元素的索引。在这种情况下，元组中第一个数组的元素(最终在df._take中使用)是True's在mask_df中的“行”索引。

第一个数组用于沿索引进行take，因此您可以得到行0, 0, 2, 3 of df作为回报。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/52123388

复制

从Mysql备份中恢复单个表

云数据库 SQL Server sql 数据库数据处理

因为云平台的备份是把库中所有的表都打包成一个 .sql文件，然而这一个.sql文件大约有20G，现阶段的方法是把.sql文件source到数据库数据处理机器上，然后再根据需求提出需要的表。每次这个操作都需要大约2个多小时，太耗时。闲暇时间，Google到了一个大神写的几行代码，经过实验确实很好用。下面就分享出来，仅供参考。思路(原谅我也理解了好一会儿)：主要使用sed命令来实现，加上-n,-e参数把打印的结果追加到一个文件中，就得到了想要的表的内容。一般情况下我们使用sed打印指定行的内容是： [ro

行者

2018/03/26

4.6K0

python中csv的应用

文件存储

dic = {'张三':123, '李四':456, '王二娃':789} csvFile3 = open('ming.csv','w') writer2 = csv.writer(csvFile3) for key in dic: writer2.writerow([key, dic[key]]) csvFile3.close()

py3study

2020/01/14

1.2K0

python中如何打开csv文件_python如何读取csv文件

文件存储 java https python 网络安全

python如何读取csv文件，我们这里需要用到python自带的csv模块，有了这个模块读取数据就变得非常容易了。

全栈程序员站长

2022/09/16

8K0

Excel VBA解读（140）：从调用单元格中获取先前计算的值

vba 编程算法

如果有一个依赖于一些计算慢的资源的用户定义函数，可能希望该用户定义函数在大多数情况下只返回其占用的单元格中最后一次计算得到的值，并且只偶尔使用计算慢的资源。

fanjy

2019/07/19

6.9K0

python 从csv读数据到mysql

python csv mysql

import csv import sys,os import MySQLdb def read_csv(filename): with open(filename) as f: f_csv = csv.reader(f) headers = next(f_csv) #数据格式[1111,22222,1111,1111,.....] #for row in f_csv: # Process row

py3study

2020/01/11

1.3K0

怎么用python打开csv文件_Python文本处理之csv-csv文件怎么打开[通俗易懂]

文件存储编程算法 python java https

csv英文全称是Comma-Separated Value，字面翻译逗号分隔值，是一种常见的文本格式文档，可用Excel打开，也可用常见的文本编辑器打开。csv文件经常用于在电子表格软件和纯文本之间交互数据。

全栈程序员站长

2022/09/16

6.8K0

怎么用python打开csv文件_Python文本处理之csv-csv文件怎么打开[通俗易懂]

unity3d：csv读取数据，兼容单元格中包含逗号

csv line string unity3d 编辑器

由于excel导出csv不好转utf8，并且不能打开时跑程序，所以推荐个编辑器Ron‘s Editor csv编辑器https://www.ronsplace.eu/Products/RonsEditor/Download

立羽

2023/08/24

2470

使用Python获取Excel文件中单元格公式的计算结果

python

假设有如下Excel文件，其中第二个WorkSheet中数据如下：其中D列为公式，现在要求输出该列公式计算的数值结果，代码如下：代码运行结果：

Python小屋屋主

2018/04/16

4.2K0

用python的pandas打开csv文件_如何使用Pandas DataFrame打开CSV文件 – python[通俗易懂]

python 数据库 sql 编程算法

message : UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xa1 in position 0: invalid start byte.

全栈程序员站长

2022/09/16

11.9K0

python从SUMO中获取车辆平均行驶时间

python

在SUMO的帮助文档中的simulation output中有如下说明。SUMO提供用来记录车辆trip信息的文件。

钱塘小甲子

2019/01/29

3.4K0

python 从mysql获取变为redis获取

云数据库 Redis®数据库 sql

1.因采集是每分钟写入一次数据库，故redis每分钟读取一次数据库最新信息，读取脚本如下:

葫芦

2019/04/17

3.3K0

【MindiaX实例】 PHP 在foreach 中获取JSON 单个数据

php json

之前在开发MindiaX 主题的时候，遇到一个要解析远程JSON 文件的数据的问题。当时困扰我的是整型与数字字符串是否等价的问题。现在过年有时间，就记录回来。 PHP解析JSON 文件这里的话就直接先讲结果，MindiaX 主题有一个定时自动更换背景的功能，调用的背景图是来自于http://dreamafar.qiniudn.com/destination.json，解析其中的几个名称/值组合成url。实现这部分的函数如下： // get remote img date from json functi

Jeff

2018/01/22

3.4K0

用Python获取磁力种子

python 开源 github

陈键冬，Python中文社区专栏作者，pyecharts开源项目核心开发者，github id:chenjiandongx

Python中文社区

2018/07/27

2.9K0

用Python读取CSV文件的5种方式

文件存储 java https 网络安全

一个股票的数据集，其实就是常见的表格数据。有股票代码，价格，日期，时间，价格变动和成交量。这个数据集其实就是一个表格数据，有自己的头部和身体。

全栈程序员站长

2022/09/16

10.6K0

用Python获取内网地址

udp ip 原理

import socket def get_host_ip(): with socket.socket(socket.AF_INET, socket.SOCK_DGRAM) as s:

云深无际

2020/11/19

1.3K0

用Python获取磁力种子

python 分布式数据库

现在我们使用迅雷等工具下载资源的时候，基本上都只需要一个叫做磁力链接的东西就可以了，非常方便。

小小科

2018/08/17

4K1

Python使用csv模块读写csv文件

文件存储

有时也称为字符分隔值，因为分隔字符也可以不是逗号，其文件以纯文本形式存储表格数据。纯文本意味着该文件是一个字符序列，不含必须像二进制数字那样被解读的数据。

Python碎片公众号

2021/02/26

3.5K0

csv模块-python

文件存储

程序运行结果testqq.csv文件已经写入了aa bb cc内容。不过把之前文件里面的内容都清除掉了。

py3study

2020/01/14

1.3K0

Python3外置模块使用

文件存储 python xslt & xpath

(1)外置模块一览表描述：Python外置模块可以说是Python的强大之处的存在，使得Python语言扩展性高，使用方法众多并且使用也非常简单，在我们日常的运维开发学习中尤为重要;

全栈工程师修炼指南

2020/10/23

4.7K0

Python3外置模块使用

文件存储 python xslt & xpath

全栈工程师修炼指南

2022/09/28

3.5K0

相似问题

从.CSV文件中的单个单元格中获取多个值

用python从CSV文件中删除空白单元格

用Python计算CSV。从列表中获取数据

用python将单个.csv导入mysql

Python读取csv单个特定单元格

2377

活动推荐

云联络中心专属优惠，福利大放送！

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问用numpy数组和DataFrame掩蔽熊猫DataFrame
EN

在线客服搭建方案

回答 2

Stack Overflow用户

Stack Overflow用户

从.CSV文件中的单个单元格中获取多个值

用python从CSV文件中删除空白单元格

用Python计算CSV。从列表中获取数据

用python将单个.csv导入mysql

Python读取csv单个特定单元格

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用numpy数组和DataFrame掩蔽熊猫DataFrameEN

在线客服搭建方案

回答 2

Stack Overflow用户

Stack Overflow用户

从.CSV文件中的单个单元格中获取多个值

用python从CSV文件中删除空白单元格

用Python计算CSV。从列表中获取数据

用python将单个.csv导入mysql

Python读取csv单个特定单元格

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问用numpy数组和DataFrame掩蔽熊猫DataFrame
EN