【导读】简单的逻辑回归于复杂的深度神经网络都广泛应用于各种分类场景,但是针对不同的任务到底哪种模型更适合呢?本文从参数量和特定数据的使用两方面来阐述两种模型的区别以及各自的适用场景,对我们的具体实践具有很强的指导意义。专知内容组编辑整理。
上图从数据科学中心采取的图表
by David Young
图片说明的虽然很形象,但我们更关心的问题是“每种技术在不同的场景下各有什么优势?”
深度神经网络和逻辑回归的最明显的区别应该是:深度神经网络比逻辑回归估计有更多的参数。所以这时候我们要考虑的问题就是:在哪些情况下我们需要使用更多的参数。
为了获得可靠的估计,你需要一个合适的数据量与参数的比例关系,所以使用个更多参数的第一个条件是要有大量的数据,这样才能支撑起更多参数的估计。如果没有很多数据,那么你将用小数据估计很多参数,最后会得到过拟合的结果。因此,根据具体情况,深度神经网络的附加节点(additional granularity)要么代表额外的细节,要么代表误差倾向。
第二个关键区别是理解“为什么我们的预测是准确有效的”,或者如何理解需要以哪些特定的方式使用某些数据来限制方程。 我们都知道溺水和冰激凌销售相关的例子,因为相对来说人在夏天游泳和淹死都比较多,而且夏天人们也吃更多的冰淇淋。 冰淇淋的销售可能有助于表明“人们何时会被淹死”,但这并不表示“人们为什么淹死”。 需要了解“为什么”意味着限制数据的使用方式并保证逻辑推理是非常重要的。 公式越复杂,分析人员越少,你就越能够理解什么导致了什么、为什么预测起作用、以及它何时可能停止。
另一方面,“为什么”有时并不像“是什么”那么重要。 深度神经网络的突破性应用是机器视觉、图像分类、或将视频转换为可分析的数据等领域。 图片和视频有大量的信息和细节,如果不能进行自动化分析,很难使用这些信息。这就很适合使用深度学习神经网络。
这两种技术以及它们的变体,如果能应用到最适合的问题上,将发挥更大的潜力;相反,任何技术,如果不能适当的使用,反而会产生问题。
David Young曾在Marketing Analytics工作20余年,现居住在维也纳
如果您喜欢这篇文章,那么你也可能喜欢David Young的书:
https://store.bookbaby.com/bookshop/book/index.aspx?bookURL=A-Short-Guide-to-Marketing-Model-Alignment-and-Design
参考链接:
https://www.linkedin.com/pulse/logistic-regression-vs-deep-neural-networks-david-young/
扫码关注腾讯云开发者
领取腾讯云代金券
Copyright © 2013 - 2025 Tencent Cloud. All Rights Reserved. 腾讯云 版权所有
深圳市腾讯计算机系统有限公司 ICP备案/许可证号:粤B2-20090059 深公网安备号 44030502008569
腾讯云计算(北京)有限责任公司 京ICP证150476号 | 京ICP备11018762号 | 京公网安备号11010802020287
Copyright © 2013 - 2025 Tencent Cloud.
All Rights Reserved. 腾讯云 版权所有