首页
学习
活动
专区
圈层
工具
发布
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    暑期追剧学AI (三) | 10分钟搞定机器学习数学思维:向量和它的朋友们

    通过计算单词向量之间的距离,例如 “瑞典“这个词,其他富裕的北欧国家密切相关。因为它们之间的距离很小,当在图上绘制时,相似的单词,他们的向量,倾向于聚集在一起。...矢量化需要注意的问题 我们计算向量之间距离的方法,是利用向量范数的概念,范数是任何一种函数G,它将向量映射到实数,且满足以下条件: 长度总是正值; 零的长度得出零; 标量乘法; 用可预测的方式扩展长度;...但这并不是定义长度的唯一方法,还有其他的,你会看到术语和L2范数,广泛地在机器学习中被使用,L2范数是欧氏范数、L1范数又称曼哈顿距离。...我们可以用其中任意一个向量来归一化它的单位向量,然后用它来计算距离、计算向量之间的距离。对于显示给用户推荐是非常有用的,这两个术语也正在被使用在规范化的过程中。...它们可以在多维向量空间中表示出来,从而我们可以对它们进行计算,比如计算它们的距离并把它们相加,方法是,通过计算向量的向量范数,向量范数描述了向量的大小,防止过度拟合也很有用。

    1.1K50

    曼哈顿距离(Manhattan Distance)

    公式 曼哈顿距离(Manhattan Distance),也称为城市街区距离(City Block Distance),是在多维空间中两点之间测量路径长度的一种方法。...对于在n维空间中的两个点 、 曼哈顿距离 可以通过以下公式计算得出: 简化为向量形式则是: 使用数据一步步举例演示 假设我们有两个二维空间中的点 (A(1, 2)) 和 (B(4, 6)),我们要计算它们之间的曼哈顿距离...* * @param point1 第一个点的坐标数组 * @param point2 第二个点的坐标数组 * @return 两个点之间的曼哈顿距离...而 calculateManhattanDistance(int[] point1, int[] point2) 方法则用于计算多维空间中两个点的曼哈顿距离。...这两个方法都返回两个点之间的曼哈顿距离,作为 double 类型的值。 在 main 方法中,我们给出了两个示例,分别演示了如何计算二维空间和多维空间中两个点的曼哈顿距离。

    1.1K10

    高数学习笔记之范数与距离度量(python实现)

    (np.abs(vector1-vector2))) 曼哈顿距离: 9 0x04 切比雪夫距离 ?...1向量为matrix格式,方法2为list 夹角余弦: [[0.92966968]] 0x06 汉明距离 汉明距离的定义:两个等长字符串s1与s2之间的汉明距离定义为将其中一个变为另外一个所需要的最小替换次数...例如字符串“1111”与“1001”之间的汉明距离为2。 应用:信息编码(为了增强容错性,应使得编码间的最小汉明距离尽可能大)。...(dv1*dv2)) print('二维相关系数',corrf) print('相关距离=',1-corrf) print('***'*15) # 使用numpy进行相关系数计算 print('多维相关系数...=\n',np.corrcoef(featuremat)) # 使用numpy进行协方差矩阵计算 print('多维协方差=\n',np.cov(featuremat)) [[4 2 3] [6 6

    75020

    常用的相似度度量总结:余弦相似度,点积,L1,L2

    使用余弦相似度来计算研究论文之间的相似度是很常见的。如果使用点积,研究论文之间的相似性是如何变化的? 余弦相似度考虑向量的方向和大小,使其适用于向量的长度与其相似度不直接相关的情况。...曼哈顿(L1)和欧几里得(L2)距离 曼哈顿距离通过将每个维度的绝对差相加来计算距离,而欧几里得距离则计算点之间的直线距离。 曼哈顿距离适用于涉及网格状运动的场景,或者当单个维度具有不同的重要性时。...随着数据维数的增加,与欧几里得距离度量相比,曼哈顿距离成为首选。 曼哈顿距离L1 欧氏距离L2 曼哈顿距离是沿着网格线行走的距离,而欧几里得距离是直线距离。...这两种距离在许多领域都有广泛的应用,例如在机器学习、图像处理、路径规划等方面。 总结 这四种距离度量方法各自有不同的应用场景和用途,选择哪种度量方法取决于具体的问题和数据类型。...曼哈顿距离和欧几里得距离适用于空间坐标的距离测量。 曼哈顿距离常用于计算城市街道的距离,也用于特征选择和聚类等数据分析任务。欧几里得距离广泛用于空间中的距离测量,机器学习、数据挖掘和图形处理等领域。

    3.8K30

    10个机器学习中常用的距离度量方法

    因此,我们在决定使用哪种测量方法时应该谨慎。但在做出决定之前,我们需要了解距离测量是如何工作的,以及我们可以从哪些测量中进行选择。...本文将简要介绍常用的距离度量方法、它们的工作原理、如何用Python计算它们以及何时使用它们。这样可以加深知识和理解,提高机器学习算法和结果。...2、曼哈顿距离 Manhattan distance 曼哈顿距离也被称为出租车或城市街区距离,因为两个实值向量之间的距离是根据一个人只能以直角移动计算的。...曼哈顿距离以l1范数为基础,计算公式为: Python代码如下 from scipy.spatial import distance distance.cityblock(vector_1, vector...总结 在这篇文章中,简要介绍了十种常用的距离测量方法。本文中已经展示了它们是如何工作的,如何在Python中实现它们,以及经常使用它们解决什么问题。

    1.9K30

    常用距离算法 (原理、使用场景、Python实现代码)

    来源:DeepHub IMBA本文约1700字,建议阅读5分钟本文为你介绍常用的距离度量方法、它们的工作原理、如何用Python计算它们以及何时使用它们。...本文将简要介绍常用的距离度量方法、它们的工作原理、如何用Python计算它们以及何时使用它们。这样可以加深知识和理解,提高机器学习算法和结果。...2、曼哈顿距离 Manhattan distance 曼哈顿距离也被称为出租车或城市街区距离,因为两个实值向量之间的距离是根据一个人只能以直角移动计算的。...曼哈顿距离以l1范数为基础,计算公式为: Python代码如下:  from scipy.spatial import distance  distance.cityblock(vector_1,...总结 在这篇文章中,简要介绍了十种常用的距离测量方法。本文中已经展示了它们是如何工作的,如何在Python中实现它们,以及经常使用它们解决什么问题。

    1.8K20

    KNN中不同距离度量对比和介绍

    math.sqrt(np.sum((x1 - x2)**2)) euclidean_distance函数计算多维空间中两点(x1和x2)之间的欧氏距离,函数的工作原理如下: 从x1元素中减去x2,得到对应坐标之间的差值...和x2)之间的曼哈顿距离,函数的工作原理如下: 用np计算x1和x2对应坐标的绝对差值。...Abs (x1 - x2) 使用np.sum()对绝对差进行求和。 曼哈顿距离,也称为L1距离或出租车距离,是两点坐标的绝对差值之和。...在数据特征具有不同尺度的情况下,或者当问题域的网格状结构使其成为更合适的相似性度量时,使用曼哈顿距离可能会有所帮助。曼哈顿距离可以根据样本的特征来衡量样本之间的相似性或差异性。...该函数使用欧几里得距离作为相似性度量,可以识别测试集中每个数据点的最近邻居,并相应地预测它们的标签。我们实现的代码提供了一种显式的方法来计算距离、选择邻居,并根据邻居的投票做出预测。

    82710

    10个机器学习中常用的距离度量方法

    因此,我们在决定使用哪种测量方法时应该谨慎。但在做出决定之前,我们需要了解距离测量是如何工作的,以及我们可以从哪些测量中进行选择。...本文将简要介绍常用的距离度量方法、它们的工作原理、如何用Python计算它们以及何时使用它们。这样可以加深知识和理解,提高机器学习算法和结果。...2、曼哈顿距离 Manhattan distance 曼哈顿距离也被称为出租车或城市街区距离,因为两个实值向量之间的距离是根据一个人只能以直角移动计算的。...曼哈顿距离以l1范数为基础,计算公式为: Python代码如下 from scipy.spatial import distance distance.cityblock(vector_1, vector...总结 在这篇文章中,简要介绍了十种常用的距离测量方法。本文中已经展示了它们是如何工作的,如何在Python中实现它们,以及经常使用它们解决什么问题。

    1.6K10

    机器学习入门 8-10 L1,L2和弹性网络

    这两种误差的表现形式和Ridge/LASSO正则化方法添加的正则化项非常的相似,MSE是平方和,而MAE是绝对值和; 学习kNN算法衡量样本点之间距离的时候提到过两种计算距离公式。...一种是欧拉距离,欧拉距离计算两点间对应维度差的平方和,另一种是曼哈顿距离,曼哈顿距离是计算两个点每个维度对应差的绝对值之和。...Ridge和LASSO的正则化项用于衡量模型的复杂度; MSE和MAE是用来衡量回归结果的好坏; 欧拉距离和曼哈顿距离是用来衡量两点之间距离的大小; 虽然它们表达了不同的衡量标准,但是它们背后的数学思想其实是非常相近的...明可夫斯基距离表达式为两点之间对应维度差的绝对值的p次方,然后对所有对应维度的计算结果求和,最后对求和结果开p次方根。 将明可夫斯基距离进一步泛化提炼成Lp范数。 ?...这个计算过程是一个NP难的问题,所以通常情况下我们是不使用L0正则的,而如果我们真的想要限制θ个数的话,通常使用L1正则来替代。

    1.9K30

    ​数据科学中 17 种相似性和相异性度量(上)

    其他应用程序需要更复杂的方法来计算点或观测值之间的距离,如余弦距离。以下列举的列表代表了计算每对数据点之间距离的各种方法。...因此,平方欧几里得距离可以在计算观测之间的距离的同时减少计算工作。例如,它可以用于聚类、分类、图像处理和其他领域。使用这种方法计算距离避免了使用平方根函数的需要。...n维空间中两点之间的平方欧几里得距离 ② L1 范数、城市街区、曼哈顿或出租车距离 曼哈顿轮廓 该指标对于测量给定城市中两条街道之间的距离非常有用,可以根据分隔两个不同地方的街区数量来测量距离。...因此,这取决于如何定义和使用距离的情况。...n维空间中两点之间的曼哈顿距离表示为: 对于二维网格,二维空间中两点之间的曼哈顿距离公式可以写成: 回忆之前的 KNN 示例,计算从新数据点到训练数据的曼哈顿距离将产生以下值: 使用曼哈顿距离的

    4.3K40

    ML中相似性度量和距离的计算&Python实现

    常常需要计算不同样本之间的相似性度量(Similarity Measurement),计算这个度量,我们通常采用的方法是计算样本之间的“距离(Distance)”。...比如利用k-means进行聚类时,判断个体所属的类别,就需要使用距离计算公式得到样本距离簇心的距离,利用kNN进行分类时,也是计算个体与已知类别之间的相似性,从而判断个体的所属类别。...欧式距离(Euclidean Distance) 欧式距离是最易于理解的一种距离计算方法,也称欧几里得距离,源自欧式空间中两点的距离公式,是指在m维空间两点之间的真实距离,欧式距离在机器学习中使用的范围比较广...曼哈顿距离(Manhattan Distance) 从名字就可以猜出这种距离的计算方法了。想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?...多维空间的曼哈顿距离 多维空间的两点​ 与​ 之间的欧氏距离 Python实现: def manhattann(a, b): """ n维空间曼哈顿距离

    7.3K170

    全面归纳距离和相似度方法(7种)

    距离(distance,差异程度)、相似度(similarity,相似程度)方法可以看作是以某种的距离函数计算元素间的距离,这些方法作为机器学习的基础概念,广泛应用于如:Kmeans聚类、协同过滤推荐算法...(样本间最大与最小欧氏距离之间的相对差距就趋近于0),也就是维度灾难的问题,如下式结论: 对于维度灾难的问题,常用的有PCA方法进行降维计算。...(具体可参考[5]) 图结构的距离 图结构间的相似度计算,有图同构、最大共同子图、图编辑距离、Graph Kernel 、图嵌入计算距离等方法(具体可参考[4][6])。...七、度量学习(Metric Learning) 度量学习的对象通常是样本特征向量的距离,度量学习的关键在于如何有效的度量样本间的距离,目的是通过训练和学习,减小或限制同类样本之间的距离,同时增大不同类别样本之间的距离...基于深度度量学习:利用深度网络学习一个表示(Embedding),采用各种采样方法(Sampling),比如成对/三元组训练样本(Triplet),计算一个带有Margin/最近邻等分类或聚类算法的损失

    1.3K50

    ML中相似性度量和距离的计算&Python实现

    ,在做分类时,常常需要计算不同样本之间的相似性度量(Similarity Measurement),计算这个度量,我们通常采用的方法是计算样本之间的“距离(Distance)”。...比如利用k-means进行聚类时,判断个体所属的类别,就需要使用距离计算公式得到样本距离簇心的距离,利用kNN进行分类时,也是计算个体与已知类别之间的相似性,从而判断个体的所属类别。...欧式距离(Euclidean Distance) 欧式距离是最易于理解的一种距离计算方法,也称欧几里得距离,源自欧式空间中两点的距离公式,是指在m维空间两点之间的真实距离,欧式距离在机器学习中使用的范围比较广...曼哈顿距离(Manhattan Distance) 从名字就可以猜出这种距离的计算方法了。想象你在曼哈顿要从一个十字路口开车到另外一个十字路口,驾驶距离是两点间的直线距离吗?...多维空间的曼哈顿距离 多维空间的两点a(x_{1,1} \cdots,x_{1n})与b(x_{2,1}, \cdots, x_{2n})之间的欧氏距离 d_{12}=\sum^{n}{k=1}\left

    3.4K170

    解读文本嵌入:语义表达的练习

    我们可以计算向量之间的距离,较小的距离相当于较近的意义。...假设有两个文本的嵌入是vector1 和vector2, 可以使用不同的度量标准来衡量两个向量之间的距离: 欧式距离 曼哈顿距离 向量点积 余弦距离 2.1 欧式距离 定义两点(或向量)之间距离的直观方法是欧式距离...另一个常用的距离是 L1标准距离或曼哈顿距离,是以纽约曼哈顿岛来命名的。...这个岛上的街道有网格布局,曼哈顿两点之间的最短路线是跟着网格走的 L1距离。我们同样可以使用python或者利用 numpy 函数来计算这个度量。...然而,对于自然语言处理的任务,一般的做法通常是使用余弦距离,因为: 余弦距离在 -1和1之间,而 L1和 L2是无界的,所以更容易解释。 从实际角度来看,计算欧几里得度量点积比计算平方根更有效。

    34610

    第一章:向量搜索引擎概述与理论基础

    与传统的基于关键词的搜索不同,向量搜索引擎通过计算向量之间的距离或相似度来找到最相关的结果。 1.1.1 向量的概念 在数学中,向量是具有大小和方向的量。...在计算机科学中,向量通常表示为一个数值数组,每个数值代表在特定维度上的值。...向量搜索的问题 1.2.1 维度灾难 随着向量维度的增加,传统的搜索方法会遇到"维度灾难"问题: 空间稀疏性:高维空间中的点变得稀疏 距离均匀化:所有点之间的距离趋于相等 计算复杂度:暴力搜索的时间复杂度为...1.5.1 常用距离度量 欧几里得距离(L2距离) ² 曼哈顿距离(L1距离) 余弦距离 汉明距离 用于二进制向量,计算不同位的数量 1.5.2 距离度量的选择 不同的应用场景需要选择合适的距离度量...:掌握向量搜索和HNSW算法的核心原理 实现核心算法:从零开始用Java实现完整的向量搜索引擎 优化性能:学习CPU和GPU计算优化技术 工程实践:掌握系统设计、测试和部署的最佳实践 扩展应用:了解如何将向量搜索引擎应用到实际项目中

    45710

    第四章:距离度量算法的实现

    第四章:距离度量算法的实现 4.1 距离度量的重要性 4.1.1 向量相似性的度量 在向量搜索引擎中,距离度量是判断两个向量相似程度的核心方法。...: 非负性: 同一性: 当且仅当 x = y 对称性: 三角不等式: 4.1.3 距离度量接口设计 package com.jvector.core; /** * 距离度量接口 * 定义计算两个向量之间距离的标准方法...*/ publicinterface DistanceMetric { /** * 计算两个向量之间的距离 * @param a 向量a的数据数组 * @param...return (float) Math.sqrt(squaredDistanceOptimized(a, b)); } /** * 使用循环展开优化的平方距离计算...思考题: 为什么余弦距离适用于文本相似性计算? 在什么情况下应该选择曼哈顿距离而不是欧几里得距离? 如何为特定领域设计自定义的距离度量?

    25810

    AIGC - 入门向量空间模型

    由于特征有很多维,因此我们可以使用向量来表示某个物体的特征。...距离通常都是大于 0 的,这里介绍几种常用的距离,包括曼哈顿距离、欧氏距离、切比雪夫距离和闵可夫斯基距离。 曼哈顿距离(Manhattan Distance) 这个距离度量的名字由来非常有趣。...它通过计算两个向量之间的夹角余弦值来衡量它们在多维空间中的方向相似性。余弦相似度通常用于比较两个文本文档之间的相似性,或者用于向量空间模型中的相关性分析。...向量空间模型假设所有的对象都可以转化为向量,然后使用向量间的距离(通常是欧氏距离)或者是向量间的夹角余弦来表示两个对象之间的相似程度。 使用下图来展示空间中向量之间的距离和夹角。...---- 总结 为了让计算机理解现实世界中的事物,我们会把事物的特点转换成为数据,并使用多维度的特征来表示某个具体的对象。

    60351

    图解AI数学基础 | 线性代数与矩阵论

    向量化的方式可以帮助AI算法在迭代与计算过程中,以更高效的方式完成。 3.矩阵(Matrix) 矩阵是二维数组,其中的每一个元素被两个索引确定。矩阵在机器学习中至关重要,无处不在。...L1范数有很多的名字,例如我们熟悉的曼哈顿距离、最小绝对误差等。...L2范数是我们最常用的范数,欧氏距离就是一种L2范数。 AI中的应用:在机器学习中,L1范数和L2范数很常见,比如『评估准则的计算』、『损失函数中用于限制模型复杂度的正则化项』等。...同样,我们可以将『矩阵』分解为一组『特征向量』和『特征值』,来发现矩阵表示为数组元素时不明显的函数性质。特征分解(Eigen-decomposition)是广泛使用的矩阵分解方式之一。...9.常用的距离度量 在机器学习里,大部分运算都是基于向量的,一份数据集包含n个特征字段,那每一条样本就可以表示为n维的向量,通过计算两个样本对应向量之间的距离值大小,有些场景下能反映出这两个样本的相似程度

    1.9K51
    领券