首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

数据科学 IPython 笔记本 7.6 Pandas 中的数据操作

Pandas 包含一些有用的调整,但是:对于一元操作,如取负和三角函数,这些ufunc将保留输出中的索引和列标签,对于二元操作,如加法和乘法,将对象传递给ufunc时,Pandas 将自动对齐索引。...这意味着,保留数据的上下文并组合来自不同来源的数据 - 这两个在原始的 NumPy 数组中可能容易出错的任务 - 对于 Pandas 来说基本上是万无一失的。...通用函数:索引对齐 对于两个Series或DataFrame对象的二元操作,Pandas 将在执行操作的过程中对齐索引。这在处理不完整数据时非常方便,我们将在后面的一些示例中看到。...California 90.413926 New York NaN Texas 38.018740 dtype: float64 ''' 所得数组包含两个输入数组的索引的并集...2 9.0 3 5.0 dtype: float64 ''' 数据帧中的索引对齐 在DataFrames上执行操作时,列和索引都会发生类似的对齐: A = pd.DataFrame(rng.randint

2.8K10
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas 2.2 中文官方教程和指南(十六)

    在转换部分中解释了将其转换为这些 dtype 的简单方法。 算术和比较操作中的传播 一般来说,在涉及 NA 的操作中,缺失值会传播。当其中一个操作数未知时,操作的结果也是未知的。...逻辑操作 对于逻辑操作,NA 遵循 三值逻辑(或Kleene 逻辑,类似于 R、SQL 和 Julia)。这种逻辑意味着只有在逻辑上需要时才传播缺失值。...在转换部分中解释了将其转换为这些 dtype 的简单方法。 算术和比较操作中的传播 一般来说,在涉及NA的操作中,缺失值会传播。当其中一个操作数未知时,操作的结果也是未知的。...逻辑操作 对于逻辑操作,NA遵循三值逻辑的规则(或Kleene 逻辑,类似于 R、SQL 和 Julia)。这种逻辑意味着只有在逻辑上需要时才传播缺失值。...逻辑操作 对于逻辑操作,NA遵循三值逻辑(或Kleene 逻辑,类似于 R、SQL 和 Julia)。这种逻辑意味着只在逻辑上需要时传播缺失值。

    30110

    NumPy 1.26 中文文档(四十二)

    其他轴是* a * 减少后保留的轴。如果输入包含小于float64的整数或浮点数,则输出数据类型是float64。否则,输出数据类型与输入的相同。如果指定了out,则返回该数组。...如果输入包含小于float64的整数或浮点数,则输出数据类型为float64。否则,输出数据类型与输入的相同。如果指定了out,则返回该数组。...如果输入包含小于float64的整数或浮点数,则输出数据类型为float64。否则,输出数据类型与输入相同。如果指定了out,则返回该数组。...对于整数输入,默认值为float64;对于浮点输入,它与输入 dtype 相同。 outndarray, 可选 备选输出数组,用于放置结果。...对于整数输入,默认值为float64;对于非精确输入,与输入 dtype 相同。 outndarray,可选 交替的输出数组,其中放置结果。

    23810

    《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas的数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

    每个索引都有一些方法和属性,它们可用于设置逻辑并回答有关该索引所包含的数据的常见问题。表5-2列出了这些函数。 ?...a -5.3 b 7.2 c 3.6 d 4.5 e NaN dtype: float64 对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理。...我们有包含0,1,2的索引,但是引入用户想要的东西(基于标签或位置的索引)很难: In [144]: ser Out[144]: 0 0.0 1 1.0 2 2.0 dtype: float64...]: b 1.802165 d 1.684034 e 2.689627 dtype: float64 这里的函数f,计算了一个Series的最大值和最小值的差,在frame的每列都执行了一次...当排序一个DataFrame时,你可能希望根据一个或多个列中的值进行排序。

    6.1K70

    Python 数据分析(PYDA)第三版(二)

    NumPy 操作在整个数组上执行复杂计算,无需 Python for循环,对于大型序列来说,这可能会很慢。...注意 不能假设numpy.empty会返回一个全为零的数组。该函数返回未初始化的内存,因此可能包含非零的“垃圾”值。只有在打算用数据填充新数组时才应使用此函数。...表 4.1:一些重要的 NumPy 数组创建函数 函数 描述 array 将输入数据(列表、元组、数组或其他序列类型)转换为 ndarray,可以通过推断数据类型或显式指定数据类型来完成;默认情况下会复制输入数据...对于有序数据如时间序列,当重新索引时可能需要进行一些插值或值填充。...2.60 c 0.00 d -0.55 dtype: float64 当整行或整列包含所有 NA 值时,总和为 0,而如果任何值不是 NA,则结果为 NA。

    29400

    pandas中的窗口处理函数

    以上述代码为例,count函数用于计算每个窗口内非NaN值的个数,对于第一个元素1,再往前就是下标-1了,序列中不存在这个元素,所以该窗口内的有效数值就是1。...dtype: float64 # 最小值 >>> s.rolling(window=2).min() 0 NaN 1 1.0 2 2.0 3 NaN 4 NaN dtype: float64 # 最大值...0 NaN 1 2.0 2 3.0 3 3.0 4 4.0 dtype: float64 min_periods参数指定窗口内最小的有效数值个数,只有当满足这个条件时,才进行后续运算,否则返回NaN。...对于第二个元素而言,窗口内包含1和2两个元素;对于第三个元素而言,窗口内包含了1,2,3共3个元素,依次类推,就可以得到上述结果。 从上述逻辑可以发现,expanding实现了一种累积的计算方式。...dtype: float64 通过rolling和expanding系列函数,可以按照窗口的方式来灵活处理序列。

    2K10

    xarray | 序列化及输入输出

    当要在一个文件中写入多个组时,传入 mode = 'a' 给 to_netcdf ,从而确保每一次调用都不会删除文件。 除非执行一系列计算操作,否则 netCDF 文件中的值是不会加载到内存中的。...对于文件太大而无法适应内存的数据集来说,这是非常有效的策略。xarray 整合了 dask.array 来提供完整的流计算。...缩放系数及类型转换 以下选项对于任何 netCDF 版本均适用: dtype:任何有效的 numpy 类型或字符串都可转换为 dtype。控制写入文件的数据类型。..._FillValue:当保存 xarray 对象到文件时,xarray 变量中的 Nan 会映射为此属性包含的值。这在转换具有缺省值的浮点数为整数时就显得非常重要了。...因为 Nan 对于整数来说不是有效值。默认情况下,对于包含浮点值的变量在存储时 _FillValue 为 Nan。

    6.5K22

    Pandas 2.2 中文官方教程和指南(八)

    : float64 访问数组在你需要执行一些操作而不需要索引(例如禁用自动对齐)时非常有用。...assign() 的函数签名只是 **kwargs。键是新字段的列名,值可以是要插入的值(例如,Series或 NumPy 数组),或者是要在DataFrame上调用的一个参数的函数。...: float64 访问数组在需要执行一些操作而不需要索引时(例如禁用自动对齐)时非常有用。...剩余的命名元组(或元组)只需展开,它们的值就会被输入到`DataFrame`的行中。如果任何一个元组比第一个`namedtuple`短,那么相应行中的后续列将被标记为缺失值。...剩余的命名元组(或元组)只是简单地解包,它们的值被输入到DataFrame的行中。如果任何一个元组比第一个namedtuple短,那么相应行中后面的列将被标记为缺失值。

    31700

    Python 数据分析(PYDA)第三版(五)

    : float64 示例:组内线性回归 与前面的示例相同,您可以使用groupby执行更复杂的组内统计分析,只要函数返回一个 pandas 对象或标量值。...: float64 与apply一样,transform适用于返回 Series 的函数,但结果必须与输入的大小相同。...对于许多应用程序来说,这是足够的。然而,通常希望相对于固定频率(如每日、每月或每 15 分钟)进行工作,即使这意味着在时间序列中引入缺失值。...要重新采样的轴;默认 axis=0 fill_method 在上采样时如何插值,例如 "ffill" 或 "bfill";默认情况下不进行插值 closed 在下采样时,每个间隔的哪一端是闭合的(包含的...对于这个频率,默认情况下左箱边缘是包含的,因此00:00值包含在00:00到00:05间隔中,而00:05值不包含在该间隔中。

    17900
    领券