df.iloc[0,:] 第一行
df.iloc[0,0] 第一列的第一个元素
数据清洗
df.columns = ['a','b','c'] 重命名列
pd.isnull() 检查空值,返回逻辑数组...=n) 删除所有小于n个非空值的行
df.fillna(x) 用x替换所有空值
s.fillna(s.mean()) 将所有空值替换为均值(均值可以用统计部分中的几乎任何函数替换)
s.astype(float...) 将数组的数据类型转换为float
s.replace(1,'one') 将所有等于1的值替换为'one'
s.replace([1,3],['one','three']) 将所有1替换为'one',...1) 将df1中的列添加到df2的末尾(行数应该相同)
df1.join(df2,on=col1,how='inner') SQL类型的将df1中的列与df2上的列连接,其中col的行具有相同的值。...() 查找每个列中的最大值
df.min() 查找每列中的最小值
df.median() 查找每列的中值
df.std() 查找每个列的标准差
点击“阅读原文”下载此速查卡的打印版本
END.