首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

Pandas笔记-进阶篇

-5.80 dtype: float64 In [80]: df.sum(axis=1) Out[80]: a 1.40 b 2.60 c 0.00 d -0.55 dtype...: float64 In [81]: df.sum(skipna=False, axis=1) Out[81]: a NaN b 2.60 c NaN d -0.55 dtype...非NA值的数量 describe 针对Series或各DataFrame列计算汇总统计 min、max 计算最小值和最大值 argmin、argmax 计算能够获取到最小值和最大值的索引位置(整数)...留个笔记P146 唯一值、值计数以及成员资格 unique方法可以得到Series中唯一值的数据,返回的唯一值是未排序的。value_counts用于计算一个Series中各值出现的概率。...isnull 返回一个含有布尔值的对象,这些布尔值表示哪些值是缺失值/NA,改对象的类型与源类型一样 notnull isnull的否定式 滤除缺失数据 对于Series很简单,只需要dropna可以轻松的滤除缺失数据

69020
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    Pandas 基础

    Pandas 使用以下约定导入 Pandas import pandas as pd 帮助 help(pd.Series.loc) Pandas 数据结构 序列(Series) 能够保存任何数据类型的一维标记数组...dtype: int64 数据框(DataFrame) 不同类型列的二维标记数据结构,类似 Excel 表格 上面一行为列名 左侧一列为索引 - 姓 名 民族 姓别 年龄 1 贾 小武 汉 男 3 2...df.sort_index() 按轴的值排序 df.sort_values(by='年龄') 从小到大排序的下标 df.rank() 检索 Series / DataFrame 信息 基本信息 df =...() 非 NA 值的数量 df.count() max_speed 3 shield 3 dtype: int64 摘要 总和 df.sum() max_speed 12...']) s + s3 地 NaN 天 NaN 宇 12.0 玄 12.0 黄 5.0 dtype: float64 填充方法的算术运算 借助填充方法自行完成内部数据对齐

    89060

    《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas的数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

    注意,返回的Series拥有原DataFrame相同的索引,且其name属性也已经被相应地设置好了。...因此,对返回的Series所做的任何就地修改全都会反映到源DataFrame上。通过Series的copy方法即可指定复制列。...Out[182]: b 0.0 d 1.0 e 2.0 Name: Utah, dtype: float64 默认情况下,DataFrame和Series之间的算术运算会将Series...如果某个索引对应多个值,则返回一个Series;而对应单个值的,则返回一个标量值: In [225]: obj['a'] Out[225]: a 0 a 1 dtype: int64 In...的sum方法将会返回一个含有列的和的Series: In [232]: df.sum() Out[232]: one 9.25 two -5.80 dtype: float64 传入axis

    6.1K70

    Pandas 2.2 中文官方教程和指南(九·二)

    NaN two 5.442353 three NaN dtype: float64 In [82]: df.sum(axis=1, skipna=True) Out[82]:...: float64 传递给 apply() 的函数的返回类型会影响 DataFrame.apply 的最终输出类型,默认行为如下: 如果应用的函数返回一个 Series,最终输出是一个 DataFrame...列与应用函数返回的 Series 的索引匹配。 如果应用的函数返回任何其他类型,最终输出是一个Series。...: float64 传递给 apply() 的函数的返回类型会影响默认行为下 DataFrame.apply 的最终输出类型: 如果应用的函数返回一个 Series,最终输出是一个 DataFrame...列匹配应用函数返回的 Series 的索引。 如果应用的函数返回其他任何类型,则最终输出是一个 Series。

    19600

    数据科学 IPython 笔记本 7.1 Pandas

    Data Analysis) 序列(Series) 数据帧(DataFrame) 重索引 删除条目 索引,选择和过滤 算术和数据对齐 函数应用和映射 排序和排名 带有重复值的轴索引 汇总和计算描述性统计量...清洗数据(构建中) 输入和输出(构建中) from pandas import Series, DataFrame import pandas as pd import numpy as np 序列(...qx NaN Name: foobarbazqux, dtype: float64 ''' 数据帧(DataFrame) DataFrame是表格数据结构,包含列的有序集合。...每列可以是不同的类型。 DataFrame同时具有行索引和列索引,类似于Series的字典。行和列操作大致是对称实现的。 索引DataFrame时返回的列是底层数据的视图,而不是副本。...dtype: float64 ''' 应用函数并返回DataFrame: func_2 = lambda x: Series([x.min(), x.max()], index=['min', 'max

    5.2K20

    Python 数据分析(PYDA)第三版(二)

    表 4.6:基本数组统计方法 方法 描述 sum 数组或沿轴的所有元素的总和;长度为零的数组的总和为 0 mean 算术平均值;对于长度为零的数组无效(返回NaN) std, var 分别是标准差和方差...Out[214]: b 0.0 d 1.0 e 2.0 Name: Utah, dtype: float64 默认情况下,DataFrame 和 Series 之间的算术会将 Series...其中大多数属于减少或摘要统计的类别,这些方法从 Series 中提取单个值(如总和或均值),或者从 DataFrame 的行或列中提取一系列值。...的sum方法会返回一个包含列和的 Series: In [269]: df.sum() Out[269]: one 9.25 two -5.80 dtype: float64 传递axis...-0.55 dtype: float64 当整行或整列包含所有 NA 值时,总和为 0,而如果任何值不是 NA,则结果为 NA。

    29400
    领券