前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >软件测试|数据分析神器pandas教程(二)

软件测试|数据分析神器pandas教程(二)

原创
作者头像
霍格沃兹测试开发Muller老师
发布2023-03-31 17:59:47
4430
发布2023-03-31 17:59:47
举报
文章被收录于专栏:muller的测试分享

前言

上一篇文章我们介绍了pandas的安装,并且写了一个简单的示例,本篇文章我们就开始学习pandas的数据结构。

数据结构-Series

Pandas Series 类似表格中的一个列(column),类似于一维数组,可以保存任何数据类型。

Series 由索引(index)和列组成,函数如下:

代码语言:python
代码运行次数:0
复制
pandas.Series( data, index, dtype, name, copy)

参数说明:

  • data:一组数据(ndarray 类型)
  • index:数据索引标签,如果不指定,默认从 0 开始
  • dtype:数据类型,默认会自己判断
  • name:设置名称
  • copy:拷贝数据,默认为 False

创建一个简单的 Series 实例:

代码语言:python
代码运行次数:0
复制
import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)

print(mydata)
----------------------
输出内容如下:
0    4
1    5
2    6
dtype: int64

从上可知,如果没有指定索引,索引值就从 0 开始,我们可以根据索引值读取数据代码如下:

代码语言:python
代码运行次数:0
复制
import pandas as pd

a = [4, 5, 6]

mydata = pd.Series(a)


print(mydata[1])
----------------------------
输出结果如下:
5

我们也可以指定索引值,这样就可以按照索引输出内容,代码如下:

代码语言:python
代码运行次数:0
复制
import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata)

---------------------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

同样,我们也可以根据指定的索引输出内容,代码如下:

代码语言:python
代码运行次数:0
复制
import pandas as pd

place = ["Jiangxi", "Ganzhou", "Zhanggong"]

mydata = pd.Series(place, index = ["provice", "city", "district"])

print(mydata["city"])

-----------------------
输出结果如下:
Ganzhou

类似字典方法,通过键值对对象创建Series,代码如下:

代码语言:python
代码运行次数:0
复制
import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place)

print(mydata)
---------------------------
输出结果如下:
provice       Jiangxi
city          Ganzhou
district    Zhanggong
dtype: object

从输出结果可以得知,字典的键成为了索引,如果我们需要字典中的一部分数据,只需要指定需要数据的索引即可,代码如下:

代码语言:python
代码运行次数:0
复制
import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'])

print(mydata)

----------------------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
dtype: object

我们同样可以设置 Series 名称参数,代码如下:

代码语言:python
代码运行次数:0
复制
import numpy as np

place = {"provice": "Jiangxi", "city": "Ganzhou", "district": "Zhanggong"}

mydata = pd.Series(place, index=['city', 'district'], name="my hometown")

print(mydata)
--------------------------
输出结果如下:
city          Ganzhou
district    Zhanggong
Name: my hometown, dtype: object

总结

本文主要介绍了pandas的Series数据结构,这个数据结构较为简单,后续我们将介绍dataframe数据结构。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 前言
    • 数据结构-Series
      • 总结
      领券
      问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档