不少IT攻城狮想投入 AI 的怀抱,但苦于不知如何下手。其实,人工智能的核心就是机器学习,机器学习算法可以描述为学习一个目标函数 f,它能够最好地映射出输入变量 X 到输出变量 Y。下面将介绍数据科学家们最常使用的 5 种机器学习算法。
1.线性判别分析
特点:假设数据服从高斯分布,通过计算每个类的判别值,并根据最大值来进行预测,所以它可以较好地提前去除离群值。
2.线性回归
特点:通过找到一组特定的权值,称为系数 k。然后,通过符合输入变量 x 到输出变量 y 关系的等式所代表的线表达出来。
3.分类与回归树分析
特点:根据算法和数据结构建立的二叉树,通过树的各分支到达叶节点,并输出对应叶节点的分类值。
4.随机森林
特点:从数据中采集很多样本,计算均值,然后将所有均值再求平均,最终得到一个真实均值的较好的估计值。
5.K 最近邻算法
特点:寻找整个训练集中 K 个最相似的样本(邻居),并把这些样本的输出变量进行总结。
领取专属 10元无门槛券
私享最新 技术干货