首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

手把手教你做一个“渣”数据师,用Python代替老情人Excel

我希望用Python取代几乎所有的excel功能,无论是简单的筛选还是相对复杂的创建并分析数据和数组。 我将展示从简单到复杂的计算任务。强烈建议你跟着我一起做这些步骤,以便更好地理解它们。...Python提供了许多不同的方法来对DataFrame进行分割,我们将使用它们中的几个来了解它是如何工作的。...五、数据计算 1、计算某一特定列的值 输出结果是一个系列。称为单列数据透视表: ? 2、计数 统计每列或每行的非NA单元格的数量: ? 3、求和 按行或列求和数据: ? 为每行添加总列: ?...4、将总列添加到已存在的数据集 ? 5、特定列的总和,使用loc函数 ? 或者,我们可以用以下方法: ? 6、用drop函数删除行 ? 7、计算每列的总和 ?...简单的数据透视表,显示SepalWidth的总和,行列中的SepalLength和列标签中的名称。 现在让我们试着复杂化一些: ? 用fill_value参数将空白替换为0: ?

8.4K30

《Python for Excel》读书笔记连载12:使用pandas进行数据分析之理解数据

引言:本文为《Python for Excel》中第5章Chapter 5:Data Analysis with pandas的部分内容,主要讲解了pandas如何对数据进行描述性统计,并讲解了将数据聚合到子集的两种方法...描述性统计和数据汇总 理解大型数据集的一种方法是计算整个数据集或有意义子集的描述性统计数据,如总和或均值。...为此,首先按洲对行进行分组,然后应用mean方法,该方法将计算每组的均值,自动排除所有非数字列: 如果包含多个列,则生成的数据框架将具有层次索引,即我们前面遇到的多重索引: 可以使用pandas提供的大多数描述性统计信息...它们引入了第二个维度,可以从不同的角度查看数据。pandas还有一个数据透视表功能,将在下面介绍。...Region)的唯一值,并将其转换为透视表的列标题,从而聚合来自另一列的值。

4.3K30
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    python数据分析——数据分类汇总与统计

    grouped.sum() # 计算每个组的总和 grouped.mean() # 计算每个组的平均值 grouped.max() # 计算每个组的最大值 过滤操作:根据条件过滤掉某些组或行。...对于没有对应数值的单元格,Pandas会用NaN填充。 总结 Pandas的pivot()函数是一个非常有用的数据透视工具,可以根据指定的行、列和数值对数据进行重塑操作,方便数据分析和统计计算。...关键技术:在pandas中透视表操作由pivot_table()函数实现,其中在所有参数中,values、index、 columns最为关键,它们分别对应Excel透视表中的值、行、列。...程序代码如下所示: 交叉表 交叉表采用crosstab函数,可是说是透视表的一部分,是参数aggfunc=count情况下的透视表。 pandas的crosstab是一个用于计算交叉频率表的函数。...下面是一个示例,展示了如何使用pandas的crosstab函数计算交叉频率表: import pandas as pd # 创建示例数据 data = { 'Gender': ['Male'

    7410

    手把手教你用Pandas透视表处理数据(附学习资料)

    本文重点解释pandas中的函数pivot_table,并教大家如何使用它来进行数据分析。...所以,本文将重点解释pandas中的函数pivot_table,并教大家如何使用它来进行数据分析。 如果你对这个概念不熟悉,维基百科上对它做了详细的解释。...数据 使用pandas中pivot_table的一个挑战是,你需要确保你理解你的数据,并清楚地知道你想通过透视表解决什么问题。...虽然他们可能拥有有效的工具对数据进行分析,但肯定有人需要将数据导出到Excel,并使用 一个透视表工具来总结这些数据。...pd.pivot_table(df,index=["Manager","Rep"],values=["Price"]) “Price”列会自动计算数据的平均值,但是我们也可以对该列元素进行计数或求和。

    3.2K50

    初学者的10种Python技巧

    #7-将条件应用于多列 假设我们要确定哪些喜欢巴赫的植物也需要充足的阳光,因此我们可以将它们放在温室中。...在第4行,我们 将此函数.apply()应用于DataFrame并指定应将哪些列作为参数传递。 axis=1 告诉pandas它应该跨列评估函数(与之相对 axis=0,后者跨行评估)。...#4—格式为货币 无论如何,我们在这些植物上花了多少钱?让我们将此计算的输出格式设置为money。...这是生成的DataFrame的样子: ? #2—计算总数的百分比 对每种植物物种如何造成温室总成本感到好奇吗?...将每个值除以所有行的总和,然后将该输出分配给名为“ perc”的新列: piv['perc'] = piv['price'].div(piv['price'].sum(axis=0)) ?

    2.9K20

    python数据分析——数据分类汇总与统计

    本文将介绍如何使用Python进行数据分类汇总与统计,帮助读者更好地理解和应用数据。 首先,我们需要导入一些常用的Python库,如pandas、numpy和matplotlib等。...例如,我们可以计算每个性别学生的平均年龄: age_mean = df.groupby('Gender')['Age'].mean() print(age_mean) 除了分类汇总和统计分析,我们还可以使用...,并希望根据分组计算列的和: mapping = {'a':'red','b':'red','c':'blue','d':'blue','e':'red','f':'orange'} 现在,你可以将这个字典传给...为True时,行/列小计和总计的名称; 【例17】对于DataFrame格式的某公司销售数据workdata.csv,存储在本地的数据的形式如下,请利用Python的数据透视表分析计算每个地区的销售总额和利润总额...关键技术:在pandas中透视表操作由pivot_table()函数实现,其中在所有参数中,values、index、 columns最为关键,它们分别对应Excel透视表中的值、行、列。

    82910

    Python数据分析库Pandas

    本文将介绍Pandas的一些高级知识点,包括条件选择、聚合和分组、重塑和透视以及时间序列数据处理等方面。...例如,选取DataFrame中“A”列大于0且“B”列小于0的行数据: import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn...例如,根据某一列的值来计算另一列的均值或总和。Pandas提供了多种聚合和分组的函数,如下所示。...2.1 groupby() groupby()函数可以根据某一列或多列将数据分组,例如: df.groupby('A').sum() 2.2 聚合函数 Pandas提供了丰富的聚合函数,包括求和、均值、...('A').apply(custom_agg) 重塑和透视 重塑和透视是将数据从一种形式转换为另一种形式的重要操作,Pandas提供了多种函数来实现这些操作。

    2.9K20

    使用R或者Python编程语言完成Excel的基础操作

    功能性:Excel不仅支持基本的表格制作和数据计算,还提供了高级功能,如数据透视表、宏编程、条件格式、图表绘制等,这些功能使其成为处理和展示数据的理想选择。...熟悉界面:打开Excel并熟悉其界面,包括菜单栏、工具栏、功能区等。 掌握基本操作:学习如何插入、删除行/列,重命名工作表,以及基本的数据输入。...数据透视表:学习如何创建和使用数据透视表对数据进行多维度分析。 宏和VBA:对于更高级的用户,可以学习如何录制宏和编写VBA代码来自动化重复性任务。...以下是一些其他的操作: 数据分析工具 数据透视表:对大量数据进行快速汇总和分析。 数据透视图:将数据透视表的数据以图表形式展示。 条件格式 数据条:根据单元格的值显示条形图。...图表 插入图表:根据数据快速创建各种类型的图表,如柱状图、折线图、饼图等。 自定义图表:调整图表样式、布局、图例等。 文本处理 文本分列:将一列数据根据分隔符分成多列。

    23810

    干货分享|如何用“Pandas”模块来做数据的统计分析!!

    我们对“EstimatedSalary”这一列做了加总的操作,而对“Balance”这一列做了求平均值的操作 02 Crosstab函数 在处理数据时,经常需要对数据分组计算均值或者计数,在Microsoft...而对于更加复杂的分组计算,“Pandas”模块中的“Crosstab”函数也能够帮助我们实现。...03 Pivot_table函数 和上面的“Cross_tab”函数的功能相类似,对于数据透视表而言,由于它的灵活性高,可以随意定制你的分析计算要求,而且操作性强,因此在实际的工作生活当中被广泛使用,...04 Sidetable函数 “Sidetable”可以被理解为是“Pandas”模块中的第三方的插件,它集合了制作透视表以及对数据集做统计分析等功能,让我们来实际操作一下吧 首先我们要下载安装这个“...例如上面的代码,显示的则是比方说当“Age”是“Middle”的时候,也就是中年群体,“AmountSpent”的总和,也就是花费的总和是762859元 06 Missing函数 “Sidetable”

    82120

    Python面试十问2

    五、pandas中的索引操作 pandas⽀持四种类型的多轴索引,它们是: Dataframe.[ ] 此函数称为索引运算符 Dataframe.loc[ ] : 此函数⽤于标签 Dataframe.iloc...的合并操作 如何将新⾏追加到pandas DataFrame?...先分组,再⽤ sum()函数计算每组的汇总数据  多列分组后,⽣成多层索引,也可以应⽤ sum 函数 分组后可以使用如sum()、mean()、min()、max()等聚合函数来计算每个组的统计值。...十、数据透视表应用 透视表是⼀种可以对数据动态排布并且分类汇总的表格格式,在pandas中它被称作pivot_table。...: 可以对需要的计算数据进⾏筛选 Columns: 类似Index可以设置列层次字段,它不是⼀个必要参数,作为⼀种分割数据的可选⽅式。

    8810

    利用excel与Pandas完成实现数据透视表

    数据透视表是一种分类汇总数据的方法。本文章将会介绍如何用Pandas完成数据透视表的制作和常用操作。...1,制作数据透视表 制作数据透视表的时候,要确定这几个部分:行字段、列字段、数据区,汇总函数。数据透视表的结构如图1所示。...图1 数据透视表的结构 Excel制作数据透视表很简单,选中表格数据,并点击工具栏上的“数据透视表”菜单即可,如图2所示。...', columns='品牌', values='数量', fill_value=0) pivot_table方法还支持对透视表进行统计计算,而且会新建一个列来存放计算结果。...图6 统计结果 这个数据透视表可以对利润和销售额进行不同的汇总计算,这时候aggfunc是字典类型,例如对销售额计算平均值,对利润计算总和,可以这样: pt5 = df.pivot_table(

    2.3K40

    懂Excel轻松入门Python数据分析包pandas(二十一):透视表

    > 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。...正好 pandas 的 pivot_table 也是与 Excel 透视表对应。本文简单教你入门使用 pandas 完成透视表功能。...2个参数,因为 pandas 中添加这2列是非常简单 "Excel 透视表是百分比呀" pandas 透视表功能没有参数设置,因为本身透视出来的还是一个 DataFrame ,这可以利用之前学到的一切技巧来为这个...下面是 Excel 透视表结果: 接着是 pandas 实现: - 修改 index 参数为 pclass,即可按船舱等级汇总 - 行9:不想再重复编写那段"非人"看的占比计算,直接调用一个自定义的函数...解决思路就是:把 ticket 列内容相同的归为一组,组内有多于1行记录的,就是有小伙伴一起上船的 相信一直看本系列的小伙伴马上就知道,这在 pandas 中不就是分组操作吗!

    1.2K50

    懂Excel轻松入门Python数据分析包pandas(二十一):透视表

    此系列文章收录在公众号中:数据大宇宙 > 数据处理 >E-pd > 经常听别人说 Python 在数据领域有多厉害,结果学了很长时间,连数据处理都麻烦得要死。...正好 pandas 的 pivot_table 也是与 Excel 透视表对应。本文简单教你入门使用 pandas 完成透视表功能。...pandas 中添加这2列是非常简单 "Excel 透视表是百分比呀" pandas 透视表功能没有参数设置,因为本身透视出来的还是一个 DataFrame ,这可以利用之前学到的一切技巧来为这个...下面是 Excel 透视表结果: 接着是 pandas 实现: - 修改 index 参数为 pclass,即可按船舱等级汇总 - 行9:不想再重复编写那段"非人"看的占比计算,直接调用一个自定义的函数...解决思路就是:把 ticket 列内容相同的归为一组,组内有多于1行记录的,就是有小伙伴一起上船的 相信一直看本系列的小伙伴马上就知道,这在 pandas 中不就是分组操作吗!

    1.7K20

    如何用 Python 执行常见的 Excel 和 SQL 任务

    现在,可以对我们以前不能做的人均 GDP 列进行各种计算,包括通过不同的值过滤列,并确定列的百分位数值。 选择/过滤数据 任何数据分析师的基本需求是将大型数据集分割成有价值的结果。...对我们一直在研究的 GDP 数据集进行一系列简单的计算。例如,计算人均国民生产总值超过 5 万的总和。 ? ? 这将给你答案为 770046 。...使用相同的逻辑,我们可以计算各种的值 -- 完整列表位于左侧菜单栏下的计算/描述性统计部分的 Pandas 文档。...Groupby 操作创建一个可以被操纵的临时对象,但是它们不会创建一个永久接口来为构建聚合结果。为此,我们必须使用 Excel 用户的旧喜爱:数据透视表。...幸运的是,Pandas 拥有强大的数据透视表方法。 ? ? 你会看到我们收集了一些不需要的列。幸运的是,使用 Pandas 中的 drop 方法,你可以轻松地删除几列。 ? ?

    10.8K60

    熟练掌握 Pandas 透视表,数据统计汇总利器

    有一堆杂乱的数据,你想按某些规则把它们分门别类、汇总统计?这时候就需要数据"整理达人" Pandas.pivot_table 出马了,这是 Pandas 快速上手系列的第 8 篇。...你还可以指定用"总和"、"均值"等聚合函数来汇总每个格子的数据。 拥有了这张透视表,数据就井然有序了。你可以一览无余地观察每个类别、每个地区的销售情况,发现潜在规律和异常。...语法和对应的参数含义: import pandas df = pandas.pivot_table( data="要进行汇总的数据集(DataFrame)", values="要聚合的列或列的列表...DataFrame ,还能读出这么多信息 熟练掌握 Pandas 合并术,数据处理不再伤脑筋 玩转 Pandas unique方法,告别数据重复烦恼 谜一样的空值?...多维度数据透视与总结,透视表功能可以按任意的行列索引对数据进行高效切割与聚合,全方位统计各维度的关键信息。

    42700

    Pandas,数据处理的好帮手!

    最近做可视化视频,在处理数据的时候遇到了一些问题。 所以就来总结一下,也给大家一个参考。 1. pandas.pivot_table 数据透视表,数据动态排布并且分类汇总的表格格式。...我的理解就是可以进行「行列转换」。 比如下面这样的一个转换。 ? 对名字列进行分类汇总,然后将日期那一列转换到行上,具体代码如下。...下面来看一个全明星球员出场次数的统计。 ? 首先添加num列,然后对name进行分类汇总,然后进行「行累加」。 最后便可得到球员历年的数据情况,避免出现数据缺失的情况,具体代码如下。...计算分类汇总后的数据总和 # 按name分类汇总并计算总和 df.groupby(['name'])[['name', 'view', 'danmaku']].sum().reset_index())...——Pandas中文网。

    98530

    Python数据分析实验二:Python数据预处理

    二、实验任务 使用Pandas和Matplotlib库分别完成以下要求: 把包含销售数据的chipotle.csv文件内容读取到一个名为chipo的数据框中,并显示该文件的前10行记录 获取chipo数据框中每列的数据类型...quantity_df.set_index('order_id',inplace=True) top_5_quantity_df 首先通过groupby()方法按订单号 (‘order_id’) 分组,并计算每个订单的商品数量总和...通过完成各种任务,我掌握了使用Pandas读取CSV文件并将数据加载到DataFrame中,如何查看DataFrame中每列的数据类型以及如何获取数据的基本统计信息。...学会了如何对数据进行筛选、查询和统计分析,例如计算订单数量、查询特定条件下的订单等。了解了如何处理缺失值,并将数据类型转换为适合分析的格式。   ...通过数据透视表的形式对数据进行了多维度的汇总和分析,帮助我更深入地理解数据之间的关联性。

    11700
    领券