根据用户喜好信息, 智能推荐商品(淘宝首页推荐)
分析客服问答模型, 替代人工客服(JD客服)
分析客户信用数据, 计算信贷额度(蚂蚁金服)
特征
对于人类个体而言姓名,年龄,性别,都是其自身的特征...特征值, 目标值
判定男女
特征值(已知的): 身高, 体重, 头发长度, 体征(很多)
目标值(未知的): 男, 女
样本
如果对全班学生成绩进行分析,一个学生就是一个样本
----...特征工程:
特征工程是将原始数据转换为更好地代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性
特征抽取
特征预处理
特征降维
1.特征抽取
1.1 字典特征抽取: 万能的0和1之字典特征抽取..., 出现过的特征统统列举出来,然后每个样本挨个比对所有特征,如果存在对应的特征则取1, 不存在则取0
one-hot
from sklearn.feature_extraction.text...数据降维
3.1 特征选择: 将某些低于特定方差的特征值过滤掉(特征较少时采用)
from sklearn.feature_selection import VarianceThreshold
def