首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas的数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结

    a -5.3 b 7.2 c 3.6 d 4.5 e NaN dtype: float64 对于时间序列这样的有序数据,重新索引时可能需要做一些插值处理。...只传递一个序列时,会重新索引结果的行: In [98]: frame = pd.DataFrame(np.arange(9).reshape((3, 3)), ....:...在将对象相加时,如果存在不同的索引对,则结果的索引就是该索引对的并集。对于有数据库经验的用户,这就像在索引标签上进行自动外连接。...e 0.0 f NaN g NaN dtype: float64 自动的数据对齐操作在不重叠的索引处引入了NA值。...NaN 1 NaN NaN 在算术方法中填充值 在对不同索引的对象进行算术运算时,你可能希望当一个对象中某个轴标签在另一个对象中找不到时填充一个特殊值(比如0): In [165]: df1 = pd.DataFrame

    6.1K70

    Python 数据分析(PYDA)第三版(二)

    ]: a -5.3 b 7.2 c 3.6 d 4.5 e NaN dtype: float64 对于有序数据如时间序列,当重新索引时可能需要进行一些插值或值填充。...index 使用传递的序列作为新的索引标签。 columns 使用传递的序列作为新的列标签。 axis 要重新索引的轴,无论是"index"(行)还是"columns"。默认为"index"。...method 插值(填充)方法;"ffill"向前填充,而"bfill"向后填充。 fill_value 重新索引时引入缺失数据时要使用的替代值。...正如我们稍后将在使用 loc 和 iloc 在 DataFrame 上进行选择中探讨的,您也可以通过使用loc运算符重新索引,许多用户更喜欢始终以这种方式进行操作。...当我们从arr中减去arr[0]时,减法将针对每一行执行一次。这被称为广播,并且在附录 A:高级 NumPy 中更详细地解释了它与一般 NumPy 数组的关系。

    29400

    精通 Pandas:1~5

    name属性在将序列对象组合到数据帧结构等任务中很有用。 使用标量值 对于标量数据,必须提供索引。 将为尽可能多的索引值重复该值。...]: nan 在这种情况下,将默认值np.NaN指定为序列结构中不存在该键时要返回的值。...默认行为是为未对齐的序列结构生成索引的并集。 这是可取的,因为信息可以保留而不是丢失。 在本书的下一章中,我们将处理 Pandas 中缺失的值。 数据帧 数据帧是一个二维标签数组。...当我们希望重新对齐数据或以其他方式选择数据时,有时需要对索引进行操作。 有多种操作: set_index-允许在现有数据帧上创建索引并返回索引的数据帧。...,将NaN值替换为原始组中的组均值,会使该组均值在转换后的数据中保持不变。

    19.2K10

    Python 数据分析(PYDA)第三版(五)

    幸运的是,pandas 具有一整套标准时间序列频率和重新采样工具(稍后在重新采样和频率转换中更详细地讨论),可以推断频率并生成固定频率的日期范围。...在频率之间的转换或重新采样是一个足够大的主题,后面会有自己的部分(重新采样和频率转换)。在这里,我将向您展示如何使用基本频率及其倍数。...重新采样 指的是将时间序列从一种频率转换为另一种频率的过程。...limit 在向前或向后填充时,要填充的最大周期数 kind 聚合到期间("period")或时间戳("timestamp");默认为时间序列具有的索引类型 convention 在重新采样周期时,用于将低频周期转换为高频的约定...图 11.3:五分钟重新采样示例,显示了闭合、标签约定 最后,您可能希望将结果索引向前移动一定量,例如从右边减去一秒,以便更清楚地了解时间戳所指的间隔。

    17900

    30 个小例子帮你快速掌握Pandas

    missing_index = np.random.randint(10000,size = 20) 接下来将某些值更改为np.nan(缺失值)。...这对于顺序数据(例如时间序列)非常有用。 8.删除缺失值 处理缺失值的另一种方法是删除它们。“已退出”列中仍缺少值。以下代码将删除缺少任何值的行。...如果我们将groupby函数的as_index参数设置为False,则组名将不会用作索引。 16.带删除的重置索引 在某些情况下,我们需要重置索引并同时删除原始索引。...重设索引,但原始索引保留为新列。我们可以在重置索引时将其删除。...在计算元素的时间序列或顺序数组中的变化百分比时很有用。 ? 从第一元素(4)到第二元素(5)的变化为%25,因此第二个值为0.25。

    10.8K10

    NumPy 1.26 中文文档(五十八)

    (gh-15886) 即使索引结果为空,也会报告索引错误 今后,当整数数组索引包含超出边界值时,NumPy 将引发 IndexError,即使未索引的维度长度为 0。...其中一个例子是不是也是匹配形状的序列的类数组对象。在 NumPy 1.20 中,当类数组对象不是序列时将给出警告(但行为保持不变,请参阅弃用)。...(gh-15886) 即使索引结果为空,索引错误也将被报告 将来,当整数数组索引包含超出边界值时,NumPy 将引发 IndexError,即使非索引维数的长度为 0。...(gh-15886) 即使索引结果为空,也将报告索引错误 未来,当整数数组索引包含超出范围值时,NumPy 将引发 IndexError,即使非索引维度的长度为 0。 现在将会发出弃用警告。...1 的索引数组不匹配 (gh-17010) 抛出错误中断迭代 在进行值转换时进行迭代时,错误可能比以前更早地停止迭代。

    30110

    Pandas 学习手册中文第二版:6~10

    具体来说,我们将检查: 对序列或数据帧创建和使用索引 用索引选择值的方法 在索引之间移动数据 重新索引 Pandas 对象 对序列或数据帧创建和使用索引 索引可以显式创建,也可以让 Pandas 隐式创建...重新索引使DataFrame符合新索引,将旧索引中的数据与新索引对齐,并在对齐失败的地方填充NaN。 此代码演示将sp500重新索引到三个指定的索引标签。...我们将在后面的章节中更详细地介绍数据透视,但是目前,仅知道以下内容将数据沿索引和跨列的年份重新组织到了国家/地区中。...在本章中,我们将研究用 Pandas 解决这些问题有多么容易。 如何处理缺失的数据 当数据的NaN值(也称为np.nan – 来自 NumPy 的形式)时,Pandas 中的缺少。...值可以为NaN的原因有很多: 两组数据的连接没有匹配的值 您从外部来源检索的数据不完整 给定的时间点的NaN值未知,稍后会填充 检索值时发生数据收集错误,但该事件仍必须记录在索引中 重新索引数据导致索引没有值

    2.3K20

    总结100个Pandas中序列的实用函数

    本期将分享我认为比较常规的100个实用函数,这些函数大致可以分为六类,分别是统计汇总函数、数据清洗函数、数据筛选、绘图与元素级运算函数、时间序列函数和其他函数。...'C']).sample(n = 1000, replace = True) # 重新修改z的行索引 z.index = range(1000) # 按照z分组,统计y的组内平均值 y.groupby(...❆ 数据清洗函数 同样,数据清洗工作也是必不可少的工作,在如下表格中罗列了常有的数据清洗的函数。 ?...x = pd.Series([10,13,np.nan,17,28,19,33,np.nan,27]) #检验序列中是否存在缺失值 print(x.hasnans) # 将缺失值填充为平均值 print...❆ 数据筛选 数据分析中如需对变量中的数值做子集筛选时,可以巧妙的使用下表中的几个函数,其中部分函数既可以使用在序列身上,也基本可以使用在数据框对象中。 ?

    63422

    pandasNote1

    person, dtype: object 索引就地修改 # 上面栗子中的number修改为phone_num obj3.index = ["sex", "city", "age", "phone_num...,则结果中用缺失值代替,debt属性 # 4、在DF中传入指定的index,有one-six frame2 = pd.DataFrame(data, columns=["year", "state",...通过字典标记或者属性(.点)的方式 获取到的其实就是个S型数据 frame[column] # 更通用 frame.column # 属性的形式 查看行数据 loc # 标签索引查看 iloc...数据 外层作为列索引 内层作为行索引 5、DF转置T 6、DF中传入S型数据 7、设置DF的columns和index属性的name属性 创建数据 如何创建一列布尔值(T/F)的数据 如何创建一个新的属性数据...# 1、2 # 先判断state属性的值是否为Ohio # 如果等于,将eastern属性的值设为T,否则为F # eastern属性是新建的,只能通过字典标记的形式 frame2["eastern

    1.2K20

    总结100个Pandas中序列的实用函数

    在分享《Pandas模块,我觉得掌握这些就够用了!》后有很多读者朋友给我私信,希望分享一篇关于Pandas模块中序列的各种常有函数的使用。...经过一段时间的整理,本期将分享我认为比较常规的100个实用函数,这些函数大致可以分为六类,分别是统计汇总函数、数据清洗函数、数据筛选、绘图与元素级运算函数、时间序列函数和其他函数。...'C']).sample(n = 1000, replace = True) # 重新修改z的行索引 z.index = range(1000) # 按照z分组,统计y的组内平均值 y.groupby(...x = pd.Series([10,13,np.nan,17,28,19,33,np.nan,27]) #检验序列中是否存在缺失值 print(x.hasnans) # 将缺失值填充为平均值 print...❆ 数据筛选 数据分析中如需对变量中的数值做子集筛选时,可以巧妙的使用下表中的几个函数,其中部分函数既可以使用在序列身上,也基本可以使用在数据框对象中。 ?

    62310

    一篇文章就可以跟你聊完Pandas模块的那些常用功能

    在 Series 结构中,index 默认是 0,1,2,……递增的整数序列,当然我们也可以自己来指定索引,比如 index=[‘a’, ‘b’, ‘c’, ‘d’]。...它包括了行索引和列索引,我们可以将 DataFrame 看成是由相同索引的 Series 组成的字典类型。...标准差 argmin() 统计最小值的索引位置 argmax() 统计最大值的索引位置 idxmin() 统计最小值的索引值 idxmax() 统计最大值的索引值...method : {'backfill','bfill','pad','ffill',None},默认无 用于填充重新索引的填充孔的方法系列填充/填充 axis : {0或'索引',1或'列'}...用于将系列中的每个值替换为另一个值,该值可以从函数,a dict或a 派生Series。

    5.2K30

    总结100个Pandas中序列的实用函数

    在分享《Pandas模块,我觉得掌握这些就够用了!》后有很多读者朋友给我私信,希望分享一篇关于Pandas模块中序列的各种常有函数的使用。...经过一段时间的整理,本期将分享我认为比较常规的100个实用函数,这些函数大致可以分为六类,分别是统计汇总函数、数据清洗函数、数据筛选、绘图与元素级运算函数、时间序列函数和其他函数。...'C']).sample(n = 1000, replace = True) # 重新修改z的行索引 z.index = range(1000) # 按照z分组,统计y的组内平均值 y.groupby(...x = pd.Series([10,13,np.nan,17,28,19,33,np.nan,27]) #检验序列中是否存在缺失值 print(x.hasnans) # 将缺失值填充为平均值 print...❆ 数据筛选 数据分析中如需对变量中的数值做子集筛选时,可以巧妙的使用下表中的几个函数,其中部分函数既可以使用在序列身上,也基本可以使用在数据框对象中。 ?

    78130

    如何用Python将时间序列转换为监督学习问题

    像深度学习这样的机器学习方法可以用于时间序列预测。 在机器学习方法出现之前,时间序列预测问题必须重构为监督学习问题来处理,将时间序列转化为输入和输出的时间序列对。...时间序列是按照时间索引排列的一串数字,可以理解为有序值构成的一列数据或有序列表。...8.0 我们可以将前移量更改为2,3或更多之后再重复这个过程,我们可以得到更长的输入时间序列(X),基于输入时间序列,我们可以预测输出值(y)。...在这种问题中,我们在一个时间序列中不是仅有一组观测值而是有多组观测值(如温度和大气压)。此时时间序列中的变量需要整体前移或者后移来创建多元的输入序列和输出序列。我们稍后将讨论这个问题。...总结 在本教程中,我们探究了如何用Python将时间序列数据集重新组织来供监督学习使用。

    24.9K2110

    Numpy教程第1部分 - 阵列简介(常用基础操作总结)

    array变回list arr1d_obj.tolist() 7、改变array的数据类型(将arr1d数据类型改为float) arr1d.astype('float') 8、arr1d是一维数组,...(处理数据时,可能发现数据为Nan的情况) 例如插入nan与inf arr2d[1,1] = np.nan # not a number arr2d[1,2] = np.inf 2、判断nan和inf...,所对应的索引,然后改为-1: missing_bool = np.isnan(arr2d) | np.isinf(arr2d) arr2d[missing_bool] = -1 六、如何计算均值、...--- 1、reshape可以改为其他形式的数组,flatten改为一维数组 arr2d.reshape(4, 3) 九、flatten()与ravel()的区别?...以上就是Numpy教程的基础部分,后续会介绍Numpy教程的提升部分,将详细说明Numpy用于数据分析所体现的功能。

    77840

    总结100个Pandas中序列的实用函数

    经过一段时间的整理,本期将分享我认为比较常规的100个实用函数,这些函数大致可以分为六类,分别是统计汇总函数、数据清洗函数、数据筛选、绘图与元素级运算函数、时间序列函数和其他函数。...'C']).sample(n = 1000, replace = True) # 重新修改z的行索引 z.index = range(1000) # 按照z分组,统计y的组内平均值 y.groupby(...❆ 数据清洗函数 同样,数据清洗工作也是必不可少的工作,在如下表格中罗列了常有的数据清洗的函数。 ?...x = pd.Series([10,13,np.nan,17,28,19,33,np.nan,27]) #检验序列中是否存在缺失值 print(x.hasnans) # 将缺失值填充为平均值 print...❆ 数据筛选 数据分析中如需对变量中的数值做子集筛选时,可以巧妙的使用下表中的几个函数,其中部分函数既可以使用在序列身上,也基本可以使用在数据框对象中。 ?

    74120
    领券