首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >python数据清洗补齐_我的世界fill填充上半砖

python数据清洗补齐_我的世界fill填充上半砖

作者头像
全栈程序员站长
发布2022-09-22 19:34:19
发布2022-09-22 19:34:19
56700
代码可运行
举报
运行总次数:0
代码可运行

大家好,又见面了,我是你们的朋友全栈君。

缺失数据比较多的情况下,可以直接滤除,缺失数据比较少时,对数据进行填充就很有必要了。

数据填充函数fillna()默认参数如下:

代码语言:javascript
代码运行次数:0
运行
复制
fillna(self, value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)
代码语言:javascript
代码运行次数:0
运行
复制
import numpy as np
from numpy import nan
import pandas as pd
data=pd.DataFrame(np.arange(3,19,1).reshape(4,4),index=list('abcd'))
print(data)
data.iloc[0:2,0:3]=nan
print(data)
代码语言:javascript
代码运行次数:0
运行
复制
      0     1     2   3
a   NaN   NaN   NaN   6
b   NaN   NaN   NaN  10
c  11.0  12.0  13.0  14
d  15.0  16.0  17.0  18
代码语言:javascript
代码运行次数:0
运行
复制
print(data.fillna(0))   ### 用0填充缺失数据
代码语言:javascript
代码运行次数:0
运行
复制
      0     1     2   3
a   0.0   0.0   0.0   6
b   0.0   0.0   0.0  10
c  11.0  12.0  13.0  14
d  15.0  16.0  17.0  18
代码语言:javascript
代码运行次数:0
运行
复制
print(data.fillna(data.mean()))     ### 用每列特征的均值填充缺失数据
代码语言:javascript
代码运行次数:0
运行
复制
      0     1     2   3
a  13.0  14.0  15.0   6
b  13.0  14.0  15.0  10
c  11.0  12.0  13.0  14
d  15.0  16.0  17.0  18
代码语言:javascript
代码运行次数:0
运行
复制
print(data.fillna(data.median()))   ### 用每列特征的中位数填充缺失数据
代码语言:javascript
代码运行次数:0
运行
复制
     0     1     2   3
a  13.0  14.0  15.0   6
b  13.0  14.0  15.0  10
c  11.0  12.0  13.0  14
d  15.0  16.0  17.0  18
代码语言:javascript
代码运行次数:0
运行
复制
print(data.fillna(method='bfill'))   ### 用相邻后面(back)特征填充前面空值
代码语言:javascript
代码运行次数:0
运行
复制
      0     1     2   3
a  11.0  12.0  13.0   6
b  11.0  12.0  13.0  10
c  11.0  12.0  13.0  14
d  15.0  16.0  17.0  18
代码语言:javascript
代码运行次数:0
运行
复制
data=pd.DataFrame(np.arange(3,19,1).reshape(4,4),index=list('abcd'))
data.iloc[1:2,:]=nan
print(data)
代码语言:javascript
代码运行次数:0
运行
复制
     0     1     2     3
a   3.0   4.0   5.0   6.0
b   NaN   NaN   NaN   NaN
c  11.0  12.0  13.0  14.0
d  15.0  16.0  17.0  18.0
代码语言:javascript
代码运行次数:0
运行
复制
print(data.fillna(method='bfill'))   ### 用相邻前面(before)特征填充后面空值 
代码语言:javascript
代码运行次数:0
运行
复制
      0     1     2     3
a   3.0   4.0   5.0   6.0
b   3.0   4.0   5.0   6.0
c  11.0  12.0  13.0  14.0
d  15.0  16.0  17.0  18.0
代码语言:javascript
代码运行次数:0
运行
复制
values={0:10,1:20,2:30}
print(data.fillna(value=values))   ### 用字典对不同的列填充不同的缺失数据
代码语言:javascript
代码运行次数:0
运行
复制
      0     1     2   3
a  10.0  20.0  30.0   6
b  10.0  20.0  30.0  10
c  11.0  12.0  13.0  14
d  15.0  16.0  17.0  18

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/170015.html原文链接:https://javaforall.cn

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档