在美国科学促进会上,休斯顿 Rice 大学的 Genevera Allen 博士警告,机器学习正在加速“科学领域的可再现危机”,她称使用机器学习技术获得的结果常常是具有误导性的,或者是完全错误的。越来越多的科学研究使用机器学习去分析已经收集的数据集。Allen 博士指出,由于软件识别的模式只存在于数据集而不是现实中,得到的结果很有可能是不精确的或错误的。这个数据集分析的结论可能与另一个更大的数据库得到的结果不重叠。她认为,使用机器学习和大数据集加速了“科学领域的可再现危机”。机器学习算法获得的结果能被信任吗,能重现吗,另一个数据集是否能得到相同的发现?Allen 博士指出答案通常是否定的。
领取专属 10元无门槛券
私享最新 技术干货