本期和大家分享DataFrame数据的处理~
一、提取想要的列
第一种方法就是使用方法,略绕,使用.列名的方法可以提取对应的列!
第二张方法类似列表中提取元素!本方法是我们将来比较常用的方法。
需要说明的是在提取列后 dtype:int64这里的类型指的该列的存储形式,那本身提取出来的数据是什么呢?
我们提取出来的这一列就是Series。所以DataFrame可以看做是Series的集合,而提取出任意的列就是Series。
二、提取想要的行
DataFrame有个特性就是可以任意进行行列处理,那如何提取某行呢?
要利用ix方法,但是实际工作中按照序号提取数据很少,更多是获取筛选后的行。筛选功能后期会分享到。在这里分享另外两个经常用到的,提取前几行后几行的方法。
.head()可以提取整个表的任意前多少行
.tail()可以提取整个表的任意后多少行
如果在括号内不输入参数,则默认返回五行。
针对行的问题,暂时先介绍到这里,后续会再次分享到。
三、DataFrame的赋值
当我们先创建的DataFrame列数大于原始数据的时候,就会以NaN方式显示,这个上期已经介绍过,当我们对某一列进行赋值的时候,整个列会赋值给一个相同的值。
如果我们直接对某个不存在的列进行赋值,pandas同样会默认帮我们创建好新的列,然后将对应的值存进去。
四、DataFrame的转置
对象.T方法可以将DataFrame进行转置,这里需要说明,该方法并不改变原数据的存储,如果想改变原数据需要重新赋值一次!