Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >机器学习-朴素贝叶斯分类器

机器学习-朴素贝叶斯分类器

作者头像
XXXX-user
发布于 2019-09-25 03:16:05
发布于 2019-09-25 03:16:05
7670
举报
文章被收录于专栏:不仅仅是python不仅仅是python

背景介绍

什么是分类器?

分类器是一种机器学习模型,用于基于某些特征来区分不同的对象。

朴素贝叶斯分类器的原理:

朴素贝叶斯分类器是一种概率性机器学习模型,用于分类任务。分类器基于贝叶斯定理。

贝叶斯定理:

使用贝叶斯定理,我们可以找到已知B发生,A发生的可能性。在这里,B是证据,A是假设。这里所做的假设是预测变量/特征是独立的。也就是说,一个特定功能的存在不会影响其他功能。因此,它被称为朴素。

例如:

让我们以一个例子来获得更好的直觉。考虑打高尔夫球的问题。数据集如下所示。

根据一天的特点,我们对一天是否适合打高尔夫球进行分类。列代表这些功能,行代表各个条目。如果我们取数据集的第一行,则可以观察到如果前景多雨,温度高,湿度高且不大风,则不适合打高尔夫球。我们在此做出两个假设,如上所述,我们认为这些预测变量是独立的。即,如果温度高,则不一定表示湿度高。这里所做的另一个假设是,所有预测变量对结果的影响均等。即,有风的日子在决定是否打高尔夫球方面没有更多的重要性。

根据此示例,贝叶斯定理可以重写为:

变量y是类别变量(打高尔夫球),它表示是否适合打高尔夫球或没有给定条件。变量X代表参数/特征。

X给出为:

这里的x_1,x_2….x_n代表这些特征,即可以将它们映射到外观,温度,湿度和大风。通过替换X并使用链式规则扩展,我们得到:

现在,您可以通过查看数据集并将其替换为方程式来获取每个值。对于数据集中的所有条目,分母不会更改,而是保持不变。因此,可以去除分母并且可以引入比例。

在我们的例子中,类变量(y)只有两个结果,是或否。在某些情况下,分类可能是多元的。因此,我们需要找到概率最大的y类。

使用上面的函数,我们可以得到给定预测变量的类。

朴素贝叶斯分类器的类型: 多项式朴素贝叶斯: 这主要用于文档分类问题,即文档是否属于体育,政治,技术等类别。分类器使用的特征/预测词是文档中出现的单词的频率。 伯努利·朴素贝叶斯: 这类似于多项式朴素贝叶斯,但预测变量是布尔变量。 我们用于预测类变量的参数仅采用yes或no值,例如,是否在文本中出现单词。 高斯朴素贝叶斯: 当预测变量采用连续值并且不是离散值时,我们假定这些值是从高斯分布中采样的。

高斯分布(正态分布)

由于值在数据集中的显示方式发生了变化,因此条件概率公式变为:

结论:

朴素贝叶斯算法主要用于情感分析(NLP问题),垃圾邮件过滤,推荐系统等。它们快速,易于实现,但最大的缺点是预测变量要求独立。在大多数现实生活中,预测变量是相互依赖的,这会妨碍分类器的性能。

文章来源

翻译自:https://towardsdatascience.com/naive-bayes-classifier-81d512f50a7c

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-09-22,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 yale记 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Python小案例:朴素贝叶斯分类器
朴素贝叶斯分类器是一个以贝叶斯定理为基础,广泛应用于情感分类领域的优美分类器。本文我们尝试使用该分类器来解决上一篇文章中影评态度分类。 1、贝叶斯定理 假设对于某个数据集,随机变量C表示样本为C类的概
机器学习AI算法工程
2018/03/13
1.9K0
Python小案例:朴素贝叶斯分类器
【机器学习】--机器学习之朴素贝叶斯从初始到应用
机器学习算法中,有种依据概率原则进行分类的朴素贝叶斯算法,正如气象学家预测天气一样,朴素贝叶斯算法就是应用先前事件的有关数据来估计未来事件发生的概率。
LhWorld哥陪你聊算法
2018/09/13
4420
【机器学习】--机器学习之朴素贝叶斯从初始到应用
MADlib——基于SQL的数据挖掘解决方案(22)——分类之朴素贝叶斯
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类。贝叶斯分类是一种利用概率统计知识进行分类的算法,其分类原理是贝叶斯定理。贝叶斯定理是由18世纪概率论和决策论的早期研究者Thomas Bayes发明的,故用其名字命名为贝叶斯定理。
用户1148526
2019/05/25
1K0
朴素贝叶斯深度解码:从原理到深度学习应用
朴素贝叶斯(Naive Bayes)是一种基于贝叶斯定理的分类技术,具有实现简单、易于理解、且在多种应用场景中表现优秀的特点。本节旨在介绍贝叶斯定理的基本历史和重要性,以及朴素贝叶斯分类器的应用场景。
TechLead
2023/10/21
1.1K0
朴素贝叶斯深度解码:从原理到深度学习应用
多项式朴素贝叶斯分类器
在这篇文章中,我们介绍多项式朴素贝叶斯分类器是如何工作的,然后使用scikit-learn作为实际工作的示例来介绍如何使用。
deephub
2024/03/20
2510
多项式朴素贝叶斯分类器
机器学习 | 朴素贝叶斯理论
朴素贝叶斯法是一种直接衡量标签和特征之间的概率关系的有监督学习算法,是一种专注分类的算法。
数据STUDIO
2021/06/24
5500
机器学习中的朴素贝叶斯算法
在处理预测相关的建模问题时你会发现朴素贝叶斯是一个简单而又强大的算法。
花落花飞去
2018/02/05
1.2K0
机器学习中的朴素贝叶斯算法
Python 数据科学手册 5.5 朴素贝叶斯分类
前四节对机器学习概念进行了总体概述。 在本节和随后的一节中,我们将仔细研究几种具体的监督和无监督学习算法,从这里以朴素贝叶斯分类开始。
ApacheCN_飞龙
2022/12/01
3600
Python 数据科学手册 5.5 朴素贝叶斯分类
【机器学习】朴素贝叶斯算法
链接:https://cloud.tencent.com/developer/article/2472727
摆烂小白敲代码
2024/11/24
6870
【机器学习】朴素贝叶斯算法
python机器学习库sklearn——朴素贝叶斯分类器[通俗易懂]
分享一个朋友的人工智能教程。零基础!通俗易懂!风趣幽默!还带黄段子!大家可以看看是否对自己有帮助:点击打开
全栈程序员站长
2022/11/16
3K0
python机器学习库sklearn——朴素贝叶斯分类器[通俗易懂]
【机器学习】朴素贝叶斯算法详解与实战扩展
朴素贝叶斯算法是一种基于概率统计的分类方法,它利用贝叶斯定理和特征条件独立假设来预测样本的类别。尽管其假设特征之间相互独立在现实中往往不成立,但朴素贝叶斯分类器因其计算简单、效率高、对缺失数据不敏感等优点,在文本分类、垃圾邮件过滤、情感分析等领域有着广泛的应用。
破晓的历程
2024/08/20
3000
朴素贝叶斯:基于概率论的分类模型
朴素贝叶斯是建立在贝叶斯定理上的一种分类模型,贝叶斯定理是条件概率的一种计算方式,公式如下
生信修炼手册
2021/03/10
8430
朴素贝叶斯:基于概率论的分类模型
Peter教你谈情说AI | 06朴素贝叶斯分类器
第五节开始我们谈到回归问题和分类问题,其中回归问题可以用梯度下降法求出其模型,那么分类模型可以通过什么方法可以求出呢?
刘盼
2018/11/22
5760
100天搞定机器学习|Day15 朴素贝叶斯
托马斯·贝叶斯 (Thomas Bayes),英国神学家、数学家、数理统计学家和哲学家,1702年出生于英国伦敦,做过神甫;1742年成为英国皇家学会会员;1763年4月7日逝世。贝叶斯曾是对概率论与统计的早期发展有重大影响的两位(贝叶斯和布莱斯·帕斯卡Blaise Pascal)人物之一。
统计学家
2019/05/06
9200
100天搞定机器学习|Day15 朴素贝叶斯
【机器学习】第三部分肆:朴素贝叶斯
朴素贝叶斯是一组功能强大且易于训练的分类器,它使用贝叶斯定理来确定给定一组条件的结果的概率,“朴素”的含义是指所给定的条件都能独立存在和发生. 朴素贝叶斯是多用途分类器,能在很多不同的情景下找到它的应用,例如垃圾邮件过滤、自然语言处理等.
杨丝儿
2022/02/17
6650
【机器学习】第三部分肆:朴素贝叶斯
全面、简单理解朴素贝叶斯(Naive Bayes)
本文介绍了朴素贝叶斯分类器的基本原理、应用场景、优缺点以及实现方法。它通过一个具体的例子,展示了如何使用sklearn库中的朴素贝叶斯分类器进行鸢尾花数据集的分类。同时,文章还探讨了朴素贝叶斯分类器在处理高维数据、缺失值和连续特征等方面的挑战,并简要介绍了sklearn库中三种朴素贝叶斯分类器的不同实现方式。
挖掘大数据
2017/12/20
1.9K0
机器学习21:概率图--朴素贝叶斯模型
贝叶斯决策论是概率框架下实施决策的基本方法。朴素贝叶斯属于生成式模型,即先对联合分布P(x,c)建模,然后再由此获得后验概率P(c|x),朴素贝叶斯分类的是所有属性之间的依赖关系在不同类别上的分布。
用户5473628
2019/08/08
1.1K0
机器学习21:概率图--朴素贝叶斯模型
朴素贝叶斯分类算法(Naive Bayes Classification Algorithm)
朴素贝叶斯分类算法(Naive Bayes Classification Algorithm)是一种基于贝叶斯定理和特征条件独立假设的分类方法。以下是对该算法的清晰介绍:
jack.yang
2025/04/05
900
A.机器学习入门算法(二): 朴素贝叶斯(Naive Bayes)
朴素贝叶斯算法(Naive Bayes, NB) 是应用最为广泛的分类算法之一。它是基于贝叶斯定义和特征条件独立假设的分类器方法。由于朴素贝叶斯法基于贝叶斯公式计算得到,有着坚实的数学基础,以及稳定的分类效率。NB模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。当年的垃圾邮件分类都是基于朴素贝叶斯分类器识别的。
汀丶人工智能
2023/03/22
8710
A.机器学习入门算法(二): 朴素贝叶斯(Naive Bayes)
朴素贝叶斯分类器本质上是线性分类器
该文介绍了朴素贝叶斯分类器的本质是线性分类器,以及适用于离散和连续特征的场景。
AlgorithmDog
2018/01/08
2.3K0
朴素贝叶斯分类器本质上是线性分类器
相关推荐
Python小案例:朴素贝叶斯分类器
更多 >
领券
💥开发者 MCP广场重磅上线!
精选全网热门MCP server,让你的AI更好用 🚀
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档