数据标准化是指将数据按比例缩放,使之落入到特定区间。 为了消除量纲的影响,方便进行不同变量间的比较分析。 0-1标准化: x=(x-min)/(max-min) Python代码实现:
import pandas
data = pandas.read_csv(
'D:\\PDA\\4.14\\data.csv'
)
data['scale'] = round(
(
data.score-data.score.min()
)/(
data.score.max()-data.score.min()
)
, 2
)
注意:
Python中,如果需要访问数据框中的某一列,用data["name"]或者data.name均可访问。
如果需要增加一列,则须使用data["total"]=data.score*data.num 才能实现。这个时候用data.XX会报错。
数据的标准化在衡量比较两个不同量纲数据的时候,非常常用。