首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

基于 Python 和 Pandas 的

基于 Python 和 Pandas 的数据分析(1) Pandas 是 Python 的一个模块(module), 我们将用 Python 完成接下来的数据分析的学习....Pandas 模块是一个高性能,高效率和高水平的数据分析库. 从本质上讲,它非常像操作电子表格的无头版本,如Excel. 我们所使用的大部分的数据集都可以被转换成 dataframes(数据框架)....但是如果你不熟悉, 可以看下我的解释: 一个 dataframe 就很像是一个仅有行和列组成的电子表格. 现在开始, 我们可以使用 Pandas 以光速对数据集进行一系列的操作....() 这里, 我们创建了 start 和 end 两个变量, 它们都是 datatime 的对象....还会接触到更多关于可视化图形, 数据的输入输出形式, 初中级的数据分析和操作, 合并与组合数据等. 后面会持续更新, 有任何问题或者错误, 欢迎留言, 希望和大家交流学习.

1.1K20
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    pandas中的loc和iloc_pandas获取指定数据的行和列

    大家好,又见面了,我是你们的朋友全栈君 实际操作中我们经常需要寻找数据的某行或者某列,这里介绍我在使用Pandas时用到的两种方法:iloc和loc。...读取第二行的值 (2)读取第二行的值 (3)同时读取某行某列 (4)进行切片操作 ---- loc:通过行、列的名称或标签来索引 iloc:通过行、列的索引位置来寻找数据 首先,我们先创建一个...Dataframe,生成数据,用于下面的演示 import pandas as pd import numpy as np # 生成DataFrame data = pd.DataFrame(np.arange...[1,:] (2)读取第二列的值 # 读取第二列全部值 data2 = data.loc[ : ,"B"] 结果: (3)同时读取某行某列 # 读取第1行,第B列对应的值 data3...和columns进行切片操作 # 读取第2、3行,第3、4列 data1 = data.iloc[1:3, 2:4] 结果: 注意: 这里的区间是左闭右开,data.iloc[1:

    10K21

    Pandas 查找,丢弃列值唯一的列

    前言 数据清洗很重要,本文演示如何使用 Python Pandas 来查找和丢弃 DataFrame 中列值唯一的列,简言之,就是某列的数值除空值外,全都是一样的,比如:全0,全1,或者全部都是一样的字符串如...:已支付,已支付,已支付… 这些列大多形同虚设,所以当数据集列很多而导致人眼难以查找时,这个方法尤为好用。...上代码前先上个坑吧,数据列中的空值 NaN 也会被 Pandas 认为是一种 “ 值 ”,如下图: 所以只要把列的缺失值先丢弃,再统计该列的唯一值的个数即可。...代码实现 数据读入 检测列值唯一的所有列并丢弃 最后总结一下,Pandas 在数据清洗方面有非常多实用的操作,很多时候我们想不到只是因为没有接触过类似的案例或者不知道怎么转换语言描述,比如 “...列值唯一 ” --> “ 除了空值以外的唯一值的个数等于1 ” ,许多坑笔者都已经踩过了,欢迎查看我的其余文章,提建议,共同进步。

    5.7K21

    Pandas库的基础使用系列---获取行和列

    前言我们上篇文章简单的介绍了如何获取行和列的数据,今天我们一起来看看两个如何结合起来用。获取指定行和指定列的数据我们依然使用之前的数据。...大家还记得它们的区别吗?可以看看上一篇文章的内容。同样我们可以利用切片方法获取类似前4列这样的数据df.iloc[:, :4]由于我们没有指定行名称,所有指标这一列也计算在内了。...如果要使用索引的方式,要使用下面这段代码df.iloc[2, 2]是不是很简单,接下来我们再看看如何获取多行多列。为了更好的的演示,咱们这次指定索引列df = pd.read_excel(".....通常是建议这样获取的,因为从代码的可读性上更容易知道我们获取的是哪一行哪一列。当然我们也可以通过索引和切片的方式获取,只是可读性上没有这么好。...df.iloc[[2,5], :4]如果不看结果,只从代码上看是很难知道我们获取的是哪几列的数据。结尾今天的内容就是这些,下篇内容会和大家介绍一些和我们这两篇内容相关的一些小技巧或者说小练习敬请期待。

    63700

    用过Excel,就会获取pandas数据框架中的值、行和列

    标签:python与Excel,pandas 至此,我们已经学习了使用Python pandas来输入/输出(即读取和保存文件)数据,现在,我们转向更深入的部分。...在Python中,数据存储在计算机内存中(即,用户不能直接看到),幸运的是pandas库提供了获取值、行和列的简单方法。 先准备一个数据框架,这样我们就有一些要处理的东西了。...df.columns 提供列(标题)名称的列表。 df.shape 显示数据框架的维度,在本例中为4行5列。 图3 使用pandas获取列 有几种方法可以在pandas中获取列。...语法如下: df.loc[行,列] 其中,列是可选的,如果留空,我们可以得到整行。由于Python使用基于0的索引,因此df.loc[0]返回数据框架的第一行。...在pandas中,这类似于如何索引/切片Python列表。 要获取前三行,可以执行以下操作: 图8 使用pandas获取单元格值 要获取单个单元格值,我们需要使用行和列的交集。

    19.2K60

    使用Pandas实现1-6列分别和第0列比大小得较小值

    一、前言 前几天在Python白银交流群【星辰】问了一个pandas处理Excel数据的问题,提问截图如下: 下图是他的原始代码截图: 二、实现过程 其实他这个代码,已经算实现了,如果分别进行定义的话...,每一列做一个变量接收,也是可以实现效果的,速度上虽然慢一些,但是确实可行。...df[f'min{i}'] = df[['标准数据', f'测试{i}']].min(axis=1) print(df) 看上去确实是实现了多列比较的效果。...这篇文章主要盘点了一个Pandas处理的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。...最后感谢粉丝【星辰】提问,感谢【dcpeng】给出的思路和代码解析,感谢【Jun】、【瑜亮老师】等人参与学习交流。

    1.2K20

    Pandas中如何查找某列中最大的值?

    一、前言 前几天在Python白银交流群【上海新年人】问了一个Pandas数据提取的问题,问题如下:譬如我要查找某列中最大的值,如何做? 二、实现过程 这里他自己给了一个办法,而且顺便增加了难度。...print(df[df.点击 == df['点击'].max()]),方法确实是可以行得通的,也能顺利地解决自己的问题。...顺利地解决了粉丝的问题。 三、总结 大家好,我是皮皮。这篇文章主要盘点了一个Pandas数据提取的问题,文中针对该问题,给出了具体的解析和代码实现,帮助粉丝顺利解决了问题。...最后感谢粉丝【上海新年人】提出的问题,感谢【瑜亮老师】给出的思路,感谢【莫生气】、【添砖java】、【冯诚】等人参与学习交流。

    40110

    Excel与pandas:使用applymap()创建复杂的计算列

    标签:Python与Excel,pandas 我们之前讨论了如何在pandas中创建计算列,并讲解了一些简单的示例。...通过将表达式赋值给一个新列(例如df['new column']=expression),可以在大多数情况下轻松创建计算列。然而,有时我们需要创建相当复杂的计算列,这就是本文要讲解的内容。...记住,我们永远不应该循环遍历pandas数据框架/系列,因为如果我们有一个大的数据集,这样做效率很低。...pandas applymap()方法 pandas提供了一种将自定义函数应用于列或整个数据框架的简单方法,就是.applymap()方法,这有点类似于map()函数的作用。...图3 我们仍然可以使用map()函数来转换分数等级,但是,需要在三列中的每一列上分别使用map(),而applymap()能够覆盖整个数据框架(多列)。

    3.9K10

    Pandas vs Spark:获取指定列的N种方式

    导读 本篇继续Pandas与Spark常用操作对比系列,针对常用到的获取指定列的多种实现做以对比。...无论是pandas的DataFrame还是spark.sql的DataFrame,获取指定一列是一种很常见的需求场景,获取指定列之后可以用于提取原数据的子集,也可以根据该列衍生其他列。...由于Pandas中提供了两种核心的数据结构:DataFrame和Series,其中DataFrame的任意一行和任意一列都是一个Series,所以某种意义上讲DataFrame可以看做是Series的容器或集合...在Spark中,提取特定列也支持多种实现,但与Pandas中明显不同的是,在Spark中无论是提取单列还是提取单列衍生另外一列,大多还是用于得到一个DataFrame,而不仅仅是得到该列的Column类型...03 小结 本文分别列举了Pandas和Spark.sql中DataFrame数据结构提取特定列的多种实现,其中Pandas中DataFrame提取一列既可用于得到单列的Series对象,也可用于得到一个只有单列的

    11.5K20

    对比Excel,Python pandas删除数据框架中的列

    标签:Python与Excel,pandas 删除列也是Excel中的常用操作之一,可以通过功能区或者快捷菜单中的命令或者快捷键来实现。...上一篇文章,我们讲解了Python pandas删除数据框架中行的一些方法,删除列与之类似。然而,这里想介绍一些新方法。取决于实际情况,正确地使用一种方法可能比另一种更好。...唯一的区别是,在该方法中,我们需要指定参数axis=1。下面是.drop()方法的一些说明: 要删除单列:传入列名(字符串)。 删除多列:传入要删除的列的名称列表。...实际上我们没有删除,而是创建了一个新的数据框架,其中只包含用户姓名、城市和性别,有效地“删除”了其他两列。然后,我们将新创建的数据框架赋值给原始数据框架以完成“删除操作”。注意代码中的双方括号。...下面是我用来决定使用哪种方法的一些技巧。 .drop() 当有许多列,而只需要删除一些列时,效果最佳。在这种情况下,我们只需要列出要删除的列。

    7.2K20

    Pandas 中三个对列转换的小操作

    前言 本文主要介绍三个对列转换的小操作: split 按分隔符将列分割成多个列 astype 转换列为其它类型 将对应列上的字符转换为大写或小写 创建 DataFrame 首先,导入 Pandas 模块...import pandas as pd mydict = { "dev_id": ["001", "002", "003", "004"], "name": ["John Hunter...df_dev.set_index("dev_id", inplace = True) df_dev df_dev.set_index("dev_id", inplace = True) 使用 df_dev 中已经存在的列来创建...split 按分隔符将列分割成多个列 现在我们想要将 name 列划分成两个列,其中一个列为 first_name,另外一个列为 last_name。...= -1,则会返回 I, am, KangChen. n = 1,则会返回 I, am KangChen. n = 2,则会但会 I, am, KangChen. expand = True 将分割的字符串转换为单独的列

    1.2K20
    领券