今天开始,我们将介绍pandas库。pandas的数据结构跟我们常用的表格结构一样,所以理解起来很容易。话不多说,赶紧开始我们的pandas之旅吧。
pandas数据结构
Series对象
在介绍之前,我们先导入numpy和pandas:
Series其实就是个带索引的一维数组:
如上图,左边一列为默认的索引,右边一列为数值。我们可以通过index和values分别获取索引和数据:
当然,可以通过索引来找到对应的数据:
刚才的索引是默认的,我们也可以自己创建索引:
Series是一种特殊的字典,我们可以将Python中的字典转换为Series:
如上图,字典中的键和值分别对应Series中的索引和值。
DataFrame对象
与Series类似,DataFrame就是带有索引和列名的二维数组。我们可以有多种方式创建DataFrame对象:
A.通过Series来创建
如上图,我们只需将之前的data1加个列名即可变为DataFrame对象。
B.通过字典来创建
如上图,字典的键为df1中的列名,字典的值为df1中的值,索引为默认。
C.通过Series对象构成的字典来创建
我们可以用之前的data和data1来创建一个DataFrame:
如图,由于data和data1的索引不同,有些值会返回NaN(not a number)。
D.通过numpy的二维数组进行创建
如图,创建二维数组后,只需将索引和列名定义好即可。
今天的介绍就到这里,下次再见。
领取专属 10元无门槛券
私享最新 技术干货