首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

最全面的Pandas的教程!没有之一!

在上面的例子中,数据透视表的某些位置是 NaN 空值,因为在原数据里没有对应的条件下的数据。...导入导出数据 采用类似 pd.read_ 这样的方法,你可以用 Pandas 读取各种不同格式的数据文件,包括 Excel 表格、CSV 文件、SQL 数据库,甚至 HTML 文件等。...使用 pd.read_excel() 方法,我们能将 Excel 表格中的数据导入 Pandas 中。请注意,Pandas 只能导入表格文件中的数据,其他对象,例如宏、图形和公式等都不会被导入。...如果文件中存在有此类对象,可能会导致 pd.read_excel() 方法执行失败。 举个例子,假设我们有一个 Excel 表格 'excel_output.xlsx',然后读取它的数据: ?...和前面类似,把数据存到 'excel_output.xlsx' 文件中: ?

26K64
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    盘一盘 Python 系列 4 - Pandas (上)

    上节都是手敲一些数据来创建「多维数据表」的,现实中做量化分析时,数据量都会很大,一般都是从量化平台中或者下载好的 csv 中直接读取。本节介绍如何从量化平台「万矿」中读取数据来创建「多维数据表」的。...Excel 格式 用 pd.to_excel 函数将 DataFrame 保存为 .xlsx 格式,并保存到 ‘Sheet1’ 中,具体写法如下: pd.to_excel( '文件名','表名' )...) 用 pd.read_excel( '文件名','表名' ) 即可加载该文件并存成 DataFrame 形式 df1 = pd.read_excel('pd_excel.xlsx', sheet_name...情况 1 - df.at['idx_i', 'attr_j'] 情况 2 - df.iat[i, j] Python 里的中括号 [] 会代表很多意思,比如单元素索引,多元素切片,布尔索引等等,因此让...【索引和切片数据表】在索引或切片 DataFrame,有很多种方法。

    6.3K52

    Pandas 2.2 中文官方教程和指南(二十五·二)

    看这里 从文件推断数据类型 处理错误行 GH 2886 写入多行索引 CSV 而不写入重复项 读取多个文件以创建单个 DataFrame 将多个文件合并为单个 DataFrame 的最佳方法是逐个读取各个框架...展示了一个从 csv 文件中获取数据并按块创建存储的函数,同时进行日期解析。...Excel Excel 文档 从类文件句柄读取 修改 XlsxWriter 输出中的格式 仅加载可见工作表 GH 19842#issuecomment-892150745 HTML 从无法处理默认请求头的服务器读取...展示了一个从 csv 文件中接收数据并按块创建存储的函数,同时也进行了日期解析。...点击这里查看 从 csv 文件逐块创建存储 在创建唯一索引的同时向存储追加数据 大数据工作流 读取一系列文件,然后在追加时为存储提供全局唯一索引 在具有低组密度的 HDFStore 上进行分组 在具有高组密度的

    17600

    Pandas 2.2 中文官方教程和指南(十·一)

    如果列标题行中的字段数等于数据文件主体中的字段数,则使用默认索引。如果大于此数,则使用前几列作为索引,以使数据主体中的剩余字段数等于标题中的字段数。 在标题之后的第一行用于确定要放入索引的列数。...,自动强制转换为 dtypes 会有一些怪异之处: + 索引可以以不同的顺序从序列化中重建,即,返回的顺序不能保证与序列化之前相同。... 或 元素用于形成列索引,如果 中包含多行,则会创建一个 MultiIndex);如果指定了,则标题行取自数据减去已解析的标题元素( 元素)。...为了避免向前填充缺失值,请在读取数据后使用 set_index 而不是 index_col。 解析特定列 在 Excel 中,用户经常会插入列进行临时计算,而您可能不想读取这些列。...zip文件格式仅支持读取,且必须只包含一个要读取的数据文件。 压缩类型可以是一个显式参数,也可以从文件扩展名中推断出来。

    35000

    系统性的学会 Pandas, 看这一篇就够了!

    :Series、DataFrame和MultiIndex(老版本中叫Panel )。...如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。 columns:列标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。...1.2.3 MultiIndex与Panel (1)MultiIndex MultiIndex是三维的数据结构; 多级索引(也称层次化索引)是pandas的重要功能,可以在Series、DataFrame...:不替换修改原数据,生成新的对象 pd.isnull(df), pd.notnull(df) 判断数据中是否包含NaN: 存在缺失值nan: (3)如果缺失值没有使用NaN标记,比如使用"?"...数据来源:https://www.kaggle.com/starbucks/store-locations/data 10.3.1 数据获取 从文件中读取星巴克店铺数据 # 导入星巴克店的数据 starbucks

    4.1K20

    pandas系列6-重塑reshape

    重新排列表格型数据的基础运算称之为重塑reshape或者轴向旋转pivot stack:将数据的列旋转成行,AB由列属性变成行索引 unstack:将数据的行旋转成列,AB由行索引变成列属性 重点知识...层次化索引 MultiIndex 数据分散在不同的文件或者数据库中 层次化索引在⼀个轴上拥有多个(两个以上)索引级别 低维度形式处理高维度数据 import pandas as pd import numpy...,unstack引入缺失值 a b c d e one 0.0 1.0 2.0 3.0 NaN two NaN NaN 4.0 5.0 6.0 data1.unstack...(tuples, names=['first', 'second']) # 错层次索引如何创建 # index = pd.MultiIndex.from_tuples(tuples, names=['...左边的表格类似于是Excel或者MySQL中的存储形式,通过轴向转换变成右边的DataFrame型数据。

    71110

    系统性的学会 Pandas, 看这一篇就够了!

    :Series、DataFrame和MultiIndex(老版本中叫Panel )。...如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。 columns:列标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。...1.2.3 MultiIndex与Panel (1)MultiIndex MultiIndex是三维的数据结构; 多级索引(也称层次化索引)是pandas的重要功能,可以在Series、DataFrame...:不替换修改原数据,生成新的对象 pd.isnull(df), pd.notnull(df) 判断数据中是否包含NaN: 存在缺失值nan: (3)如果缺失值没有使用NaN标记,比如使用"?"...数据来源:https://www.kaggle.com/starbucks/store-locations/data 10.3.1 数据获取 从文件中读取星巴克店铺数据 # 导入星巴克店的数据 starbucks

    4.6K30

    系统性的学会 Pandas, 看这一篇就够了!

    :Series、DataFrame和MultiIndex(老版本中叫Panel )。...如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。 columns:列标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。...1.2.3 MultiIndex与Panel (1)MultiIndex MultiIndex是三维的数据结构; 多级索引(也称层次化索引)是pandas的重要功能,可以在Series、DataFrame...:不替换修改原数据,生成新的对象 pd.isnull(df), pd.notnull(df) 判断数据中是否包含NaN: 存在缺失值nan: (3)如果缺失值没有使用NaN标记,比如使用"?"...数据来源:https://www.kaggle.com/starbucks/store-locations/data 10.3.1 数据获取 从文件中读取星巴克店铺数据 # 导入星巴克店的数据 starbucks

    4.4K40

    系统性总结了 Pandas 所有知识点

    Series、DataFrame和MultiIndex(老版本中叫Panel )。...如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。 columns:列标签。如果没有传入索引参数,则默认会自动创建一个从0-N的整数索引。...1.2.3 MultiIndex与Panel 1、MultiIndex MultiIndex是三维的数据结构; 多级索引(也称层次化索引)是pandas的重要功能,可以在Series、DataFrame...:不替换修改原数据,生成新的对象 pd.isnull(df), pd.notnull(df) 判断数据中是否包含NaN: 存在缺失值nan: (3)如果缺失值没有使用NaN标记,比如使用"?"...数据来源:https://www.kaggle.com/starbucks/store-locations/data 10.3.1 数据获取 从文件中读取星巴克店铺数据 # 导入星巴克店的数据 starbucks

    3.3K20

    Python替代Excel Vba系列(三):pandas处理不规范数据

    但是身经百战的你肯定会觉得,前2篇例子中的数据太规范了,如果把数据导入到数据库还是可以方便解决问题的。 因此,本文将使用稍微复杂的数据做演示,充分说明 pandas 是如何灵活处理各种数据。...---- ---- 我们来看看数据: 注意看左上角有3个 nan ,是因为表格的标题行前3列是空的。 由于前2列有合并单元格,出现了很多 nan。 此外注意看第3列,把课时序号显示成小数。...如下是一个 DataFrame 的组成部分: 红框中的是 DataFrame 的值部分(values) 上方深蓝色框中是 DataFrame 的列索引(columns),注意,为什么方框不是一行?...我们平时操作 DataFrame 就是通过这两个玩意去定位里面的数据。 如果你熟悉 excel 中的透视表,那么完全可以把行列索引当作是透视表中的行列区域。...[源码地址](https://github.com/CrystalWindSnake/Creative/tree/master/python/excel_pandas/3) 请关注本号,后续会有更多相关教程

    5K30

    Python替代Excel Vba系列(四):课程表分析与动态可视化图表

    如下图: 表中的一行表示 某一天的某课时是哪位教师负责的哪门科目。 这里的名字按照原有数据做了脱敏(teach 列)。...---- 脚本中导入 本文使用 pyecharts 做可视化输出 ---- ---- 加载数据 代码如下: 这次直接从 csv 文件读取即可。....unstack() ,把 apm 从行索引移到列索引。那么就会有 上午列 和 下午列。 注意此时,如果一位教师只有下午的课,那么此列他的值就为 nan。...---- .stack(dropna=False) ,把 apm 从列索引移回去行索引,dropna=False ,让其保留 nan 的值。 此时即可确保所有的教师都有上下午2行数据。...[源码地址](https://github.com/CrystalWindSnake/Creative/tree/master/python/excel_pandas/4) 请关注本号,后续会有更多相关教程

    1.7K20
    领券