Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >初探pandas——安装和了解pandas数据结构

初探pandas——安装和了解pandas数据结构

作者头像
LRainner
发布于 2020-07-15 07:39:34
发布于 2020-07-15 07:39:34
61300
代码可运行
举报
文章被收录于专栏:安全学习笔记安全学习笔记
运行总次数:0
代码可运行

安装pandas

通过python pip安装pandas

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
pip install pandas

pandas数据结构

pandas常用数据结构包括:Series和DataFrame

Series

Series是一种一维的数组型对象,包含一个值序列(与numpy中的数据类型相似),数据标签(称为索引(index))。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
import pandas as pd

# 创建Series对象
obj=pd.Series([4,5,6,7])
print(obj)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
0    4
1    5
2    6
3    7
dtype: int64

左边为索引,右边为值,默认索引从0到n-1(n为数据长度),可以通过values属性和index属性分别获得Series对象的值和索引

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
print(obj.values)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
array([4, 5, 6, 7], dtype=int64)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
print(obj.index)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
RangeIndex(start=0, stop=4, step=1)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 自定义索引序列
obj2=pd.Series([4,5,6,7],index=['a','b','d','e'])
print(obj2,'\n')

# 输出索引
print(obj2.index)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
a    4
b    5
d    6
e    7
dtype: int64

Index(['a', 'b', 'd', 'e'], dtype='object')

Series对象可以使用标签来进行索引

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 输出索引为b的元素
print(obj2['b'])

# 输出索引为a,d,e的元素
print('* '*10)
print(obj2[['a','d','e']])
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
5
* * * * * * * * * *
a    4
d    6
e    7
dtype: int64

Series对象也能使用布尔值进行过滤

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 输出值大于5的元素
print(obj2[obj2>5])
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
d    6
e    7
dtype: int64

DataFrame

DataFrame表示矩阵的数据表,包含已排序的列集合,每一列可以是不同的的值类型(数值、字符串、布尔值等)

DataFrame既有行索引,也有列索引,可以被视为一个共享相同索引的Series的字典

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
# 创建DataFrame对象
data={'age':[18,18,18,20,20,20],'name':['a','b','c','aa','bb','cc'],'height':[180,180,180,182,182,182]}
frame=pd.DataFrame(data)
print(frame)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
   age name  height
0   18    a     180
1   18    b     180
2   18    c     180
3   20   aa     182
4   20   bb     182
5   20   cc     182

DataFrame也可以用columns参数指定列索引顺序排列

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
frame=pd.DataFrame(data,columns=['name','age','height'])
print(frame)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
  name  age  height
0    a   18     180
1    b   18     180
2    c   18     180
3   aa   20     182
4   bb   20     182
5   cc   20     182

如果传的列参数不在字典中,将会出现缺失值

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
frame=pd.DataFrame(data,columns=['name','age','height','addition'])
print(frame)
print(frame.columns)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
  name  age  height addition
0    a   18     180      NaN
1    b   18     180      NaN
2    c   18     180      NaN
3   aa   20     182      NaN
4   bb   20     182      NaN
5   cc   20     182      NaN
Index(['name', 'age', 'height', 'addition'], dtype='object')

DataFrame的一列可以按字典型标记或属性那样索引为Series

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
frame=pd.DataFrame(data,columns=['name','age','height'])
print(frame['name'])
print(frame.age)
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
0     a
1     b
2     c
3    aa
4    bb
5    cc
Name: name, dtype: object
0    18
1    18
2    18
3    20
4    20
5    20
Name: age, dtype: int64

行也可以通过位置或特殊属性loc进行索引

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
frame=pd.DataFrame(data,columns=['name','age','height'])
print(frame.loc[2])
代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
name        c
age        18
height    180
Name: 2, dtype: object
本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-07-03,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 小白也编程 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python数据分析-pandas库入门
pandas 提供了快速便捷处理结构化数据的大量数据结构和函数。自从2010年出现以来,它助使 Python 成为强大而高效的数据分析环境。pandas使用最多的数据结构对象是 DataFrame,它是一个面向列(column-oriented)的二维表结构,另一个是 Series,一个一维的标签化数组对象。
嵌入式视觉
2022/09/05
4.2K0
Python数据分析-pandas库入门
基础知识篇(一)Pandas数据结构
本文介绍pandas的基本数据类型,要熟练使用pandas,需要熟悉它的两种主要数据结构:Series和DataFrame 1.Series Series 形如于一维矩阵的对象,通常用来存储一列数值,其包含数值列(与numpy数据格式相似)和标签列(与数值列相对应,称之为index列) 1.1 Series生成 最简单的Series可以由一个数值list生成 import pandas as pd from pandas import Series, DataFrame import numpy as np
秋枫学习笔记
2023/01/30
9660
《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas的数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结
pandas是本书后续内容的首选库。它含有使数据清洗和分析工作变得更快更简单的数据结构和操作工具。pandas经常和其它工具一同使用,如数值计算工具NumPy和SciPy,分析库statsmodels和scikit-learn,和数据可视化库matplotlib。pandas是基于NumPy数组构建的,特别是基于数组的函数和不使用for循环的数据处理。 虽然pandas采用了大量的NumPy编码风格,但二者最大的不同是pandas是专门为处理表格和混杂数据设计的。而NumPy更适合处理统一的数值数组数据。
SeanCheney
2018/04/24
6.4K0
《利用Python进行数据分析·第2版》第5章 pandas入门5.1 pandas的数据结构介绍5.2 基本功能5.3 汇总和计算描述统计5.4 总结
pandasNote1
import numpy as np import pandas as pd from pandas import Series, DataFrame Series创建 基本知识 类似于一维数组的对象 由一组数据(各种Numpy数据类型)和数据标签(索引)组成 左边索引,右边数值; 不指定索引的话,自动从0开始; 索引也可以自定义:index=[‘a’, ‘b’, ‘c’, ‘d’] 通过Python的字典类型创建 obj = pd.Series([4, 7, 8, -1]) obj 0 4 1
皮大大
2021/03/01
1.3K0
数据分析 ——— pandas数据结构(一)
之前我们了解了numpy的一些基本用法,在这里简单的介绍一下pandas的数据结构。
andrew_a
2019/08/02
2.3K0
【Pandas】pandas的主要数据结构
pandas是数据分析领域的常用库,它被专门设计来处理表格和混杂数据,这样的设计让它在数据清洗和分析工作上更有优势。
树枝990
2020/08/19
1.6K0
数据分析工具Pandas1.什么是Pandas?2.Pandas的数据结构SeriesDataFrame3.Pandas的索引操作索引对象IndexSeries索引DataFrame索引高级索引:标签
Pandas是一个强大的分析结构化数据的工具集,基于NumPy构建,提供了 高级数据结构 和 数据操作工具,它是使Python成为强大而高效的数据分析环境的重要因素之一。
Python攻城狮
2018/08/23
4.3K0
数据分析工具Pandas1.什么是Pandas?2.Pandas的数据结构SeriesDataFrame3.Pandas的索引操作索引对象IndexSeries索引DataFrame索引高级索引:标签
pandas知识点(数据结构)
1.Series 生成一维数组,左边索引,右边值: In [3]: obj = Series([1,2,3,4,5]) In [4]: obj Out[4]: 0 1 1 2 2 3 3 4 4 5 dtype: int64 In [5]: obj.values Out[5]: array([1, 2, 3, 4, 5], dtype=int64) In [6]: obj.index Out[6]: RangeIndex(start=0, stop=5, step=1) 创建对
py3study
2020/01/20
3740
软件测试|数据分析神器pandas教程(三)
前面我们介绍了pandas Series数据结构,本篇文章我们来介绍另外一种pandas数据结构——DataFrame。
霍格沃兹测试开发Muller老师
2023/04/10
5260
【无痛学Python】Pandas统计分析基础,看这一篇就够了!
Pandas是基于NumPy的数据分析模块,它提供了大量的数据分析会用到的工具,可以说Pnadas是Python能成为强大数据分析工具的重要原因之一。
Skrrapper
2025/06/10
4680
肝了3天,整理了90个Pandas案例,强烈建议收藏!
文章很长,高低要忍一下,如果忍不了,那就收藏吧,总会用到的 萝卜哥也贴心的做成了PDF,在文末获取! 如何使用列表和字典创建 Series 使用列表创建 Series 使用 name 参数创建 Series 使用简写的列表创建 Series 使用字典创建 Series 如何使用 Numpy 函数创建 Series 如何获取 Series 的索引和值 如何在创建 Series 时指定索引 如何获取 Series 的大小和形状 如何获取 Series 开始或末尾几行数据 Head() Tail() Take()
周萝卜
2021/10/25
4.7K0
Pandas的数据结构Pandas的数据结构
Pandas的数据结构 import pandas as pd Pandas有两个最主要也是最重要的数据结构: Series 和 DataFrame Series Series是一种类似于一维数组的 对象,由一组数据(各种NumPy数据类型)以及一组与之对应的索引(数据标签)组成。 类似一维数组的对象 由数据和索引组成 索引(index)在左,数据(values)在右 索引是自动创建的 [图片上传失败...(image-3ff688-1523173952026)] 1. 通过list构建Series
王小婷
2018/05/31
1K0
上手Pandas,带你玩转数据(1)-- 实例详解pandas数据结构
昨天写一个小项目的时候,想用pandas把数据写入到Excel中去,结果发现我原先写的那套pandas教程是真的垃圾啊。 痛定思痛,我决定重写一份。
看、未来
2021/09/18
7.1K0
pandas教程(一)Series与DataFrame
预备知识:NumPy数组是一个多维数组对象,称为ndarray。其由两部分组成:实际的数据、描述这些数据的元数据
K同学啊
2019/01/22
1.1K0
Python 数据处理:Pandas库的使用
✅作者简介:人工智能专业本科在读,喜欢计算机与编程,写博客记录自己的学习历程。 🍎个人主页:小嗷犬的博客 🍊个人信条:为天地立心,为生民立命,为往圣继绝学,为万世开太平。 🥭本文内容:Python 数据处理:Pandas库的使用 ---- Python 数据处理:Pandas库的使用 1.Pandas 数据结构 1.1 Series 1.2 DataFrame 2.基本功能 2.1 重新索引 2.2 丢弃指定轴上的项 2.3 索引、选取和过滤 2.4 用 loc 和 iloc 进行选取 2.5
小嗷犬
2022/11/15
24.3K0
pandas技巧1
.dataframe tbody tr th:only-of-type { vertical-align: middle; } <pre><code>.dataframe tbody tr th { vertical-align: top; } .dataframe thead th { text-align: right; } </code></pre>
皮大大
2021/03/02
6010
猿创征文|数据导入与预处理-第3章-pandas基础
pandas的官网地址为:https://pandas.pydata.org/ 官网首页介绍了Pandas,
IT从业者张某某
2022/11/12
14.6K0
猿创征文|数据导入与预处理-第3章-pandas基础
Pandas数据结构之DataFrame常见操作
DataFrame 就像带索引的 Series 字典,提取、设置、删除列的操作与字典类似:
用户1564362
2019/11/30
1.9K0
带你玩转Pandas
21.对每种animal的每种不同数量visits,计算平均age,即,返回一个表格,行是aniaml种类,列是visits数量,表格值是行动物种类列访客数量的平均年龄
用户3577892
2020/06/10
6930
pandas
pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。Pandas 纳入了大量库和一些标准的数据模型,提供了高效地操作大型数据集所需的工具。pandas提供了大量能使我们快速便捷地处理数据的函数和方法。你很快就会发现,它是使Python成为强大而高效的数据分析环境的重要因素之一。
润森
2019/08/29
8210
pandas
推荐阅读
相关推荐
Python数据分析-pandas库入门
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验