非监督式学习是一种机器学习的方式,它是监督式学习和强化学习等策略之外的一种选择。
K-均值聚类(K-means clustering)是一种常用的无监督学习算法,用于将数据集划分为K个不相交的簇。该算法通过迭代的方式将每个样本分配到最近的簇,...
在自然语言处理和信息检索的许多任务中,都需要对句子进行成对比较,例如句子相似性检测、释义识别、问答蕴含和文本蕴含等。句子比较最准确的方法是交叉编码,但训练交叉编...
在当今的工业和在线应用中,实时数据流中的异常检测至关重要。异常可能预示着制造缺陷、系统故障、安全漏洞或其他重要事件。传统的基于机器学习的异常检测系统需要监督训练...
无监督与监督学习方法通常依赖核函数捕捉数据结构的非线性特征,但需确保所提非线性能最大化数据多样性与变异性。本研究系统回顾了独立性准则,并设计出三种新准则用于构建...
在大多数自然语言处理应用中,词元化是首要步骤——将输入字符串分解为语义相关单元。传统方法依赖人工编纂的词典和标注数据(LST),而新兴的无监督方法(LIT)通过...
人工智能已超越科幻范畴,现代机器学习算法能实现商品推荐、消费者行为分析、欺诈识别甚至销售预测。全球市场规模突破600亿美元,印证了智能系统对企业决策的关键价值。
想象你是一家超市的经理,面对堆积如山的顾客数据:年龄、消费频率、平均客单价...如何从中发现规律?你需要一种能自动将相似顾客分组的技术——这就是K均值聚类的魔力...
欧洲计算机视觉会议(ECCV)于周日开幕,与国际计算机视觉会议(ICCV)交替举办。原定今年在格拉斯哥举行的ECCV,与今年夏天大多数主要计算机科学会议一样,转...
在当今工业和在线应用中,实时数据流中的异常检测至关重要。传统监督学习方法面临标注成本高、数据分布动态变化的挑战。亚马逊科学团队在ICML 2025提出的SEAD...
划重点:今天起,GPT-4.5会向所有ChatGPT Pro版用户开放,包括网页端、移动端和桌面端。另外所有付费开发者也能使用了。
K-均值(K-means)是一种常用的无监督学习算法,用于将数据集中的样本分成 K 个簇。该算法的过程大致如下:
K-均值(K-means)聚类算法是一种常用的无监督学习算法,用于将数据集分成 K 个簇(clusters)。该算法的基本思想是将数据点分为 K 个簇,使得每个...
在自然语言处理(NLP)领域蓬勃发展的今天,众多高资源语言如英语、中文等凭借丰富的数据和成熟的技术,取得了显著的进步。然而,世界上还有大量的低资源语言,它们因缺...
分裂型层次聚类是一种自上而下的聚类方法,其基本思想是从一个包含所有数据点的簇开始,逐步将该簇划分为更小的子簇,直到每个子簇包含一个数据点为止。每次分裂时,选择一...
监督学习到这里就算是结束了,接下来我们一起来看你一下无监督学习,无监督学习是机器学习中的一个重要分支,但它看起来有点“神秘”——你会发现,数据集里并没有告诉你哪...
本文开始我们讲解无监督学习算法。在之前的文章中,我们给模型的任务通常是找到样本
本文讨论无监督学习中的数据分布建模问题。当我们需要在一个数据集上完成某个任务时,数据集中的样本分布显然是最基本的要素。面对不同的数据分布,我们可能针对同一任...
在上一篇文章聚类中,我们介绍了无监督学习的重要问题之一:聚类问题,并主要讲解了k均值算法。结尾处我们提到,在解决复杂聚类问题时,第一步通常不会直接使用k均值...
在前面的文章中,我们介绍了各种类型的无监督学习算法,如聚类算法、降维算法等。归根结底,无监督学习的目的是从复杂数据中提取出可以代表数据的特征,例如数据的分布...