首页
学习
活动
专区
圈层
工具
发布

技术 | 从算法原理,看推荐策略

协同过滤推荐算法应该算是一种用的最多的推荐算法,它是通过用户的历史数据来构建“用户相似矩阵”和“产品相似矩阵”来对用户进行相关item的推荐,以达到精准满足用户喜好的目的。...“用户相似矩阵”和“产品相似矩阵”来对用户进行相关item的推荐,以达到精准满足用户喜好的目的。...(由于基于模型的方法我也不太理解,暂时不展开说明,感兴趣的可以查阅相关资料) 【基于邻域的推荐】–即是构建用户相似矩阵和产品相似矩阵 假设用户表现出了对一些图片的喜欢情况并进行了相应的评分,情况如下:...不同图书代表不同维度,评分则代表了特征向量在该维度上的投影长度,根据用户对不同图书的喜爱程度建立用户的特征向量,然后根据余弦相似度可以判断用户之间的相似性。根据相似性可以建立用户相似矩阵: ?...基于内容的过滤方式与协同过滤中建立用户相似矩阵的方式类似,都是利用特征向量来进行余弦相似度计算,从而判断物品的相似性。

1.1K60
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    听说比K-means厉害多了:谱聚类

    通过找到L的最小的k个特征值,可以得到对应的k个特征向量,这k个特征向量组成一个nxk维度的矩阵,即为我们的H。一般需要对H矩阵按行做标准化,即 ?...07 谱聚类算法流程 铺垫了这么久,终于可以总结下谱聚类的基本流程了。一般来说,谱聚类主要的注意点为相似矩阵的生成方式(参见第二节),切图的方式(参见第六节)以及最后的聚类方法(参见第六节)。...最常用的相似矩阵的生成方式是基于高斯核距离的全连接方式,最常用的切图方式是Ncut。而到最后常用的聚类方法为K-Means。下面以Ncut总结谱聚类算法流程。 输入:样本集D=(x1,x2,......    2)根据相似矩阵S构建邻接矩阵W,构建度矩阵D     3)计算出拉普拉斯矩阵L     4)构建标准化后的拉普拉斯矩阵D−1/2LD−1/2     5)计算D−1/2LD−1/2最小的k1个特征值所各自对应的特征向量...2) 聚类效果依赖于相似矩阵,不同的相似矩阵得到的最终聚类效果可能很不同。 END

    5.7K51

    白话什么是谱聚类算法

    ---- 谱聚类算法流程为: Input: ? Output: ?...根据输入的相似矩阵的生成方式构建样本的相似矩阵S 根据相似矩阵S构建邻接矩阵W,构建度矩阵D 计算出拉普拉斯矩阵L 构建标准化后的拉普拉斯矩阵 ? 计算 ? 最小的 ?...个特征值所各自对应的特征向量f 将各自对应的特征向量f组成的矩阵按行标准化,最终组成n×k1维的特征矩阵F 对F中的每一行作为一个k1维的样本,共n个样本,用输入的聚类方法进行聚类,聚类维数为k2。...一句话总结这个流程就是,利用样本数据,得到相似矩阵(拉普拉斯矩阵),再进行特征分解后得到特征向量,对特征向量构成的样本进行聚类。 ?...的最小的前k个特征值,求出特征向量,并标准化,得到特征矩阵F, 再对F进行一次传统的聚类方法,最终就完成了聚类任务。

    1.2K30

    【机器学习】--谱聚类从初始到应用

    3、算法流程:                输入:样本集D=,相似矩阵的生成方式, 降维后的维度, 聚类方法,聚类后的维度     输出: 簇划分     1) 根据输入的相似矩阵的生成方式构建样本的相似矩阵...S     2)根据相似矩阵S构建邻接矩阵W,构建度矩阵D     3)计算出拉普拉斯矩阵L     4)求L的最小的个特征值所各自对应的特征向量     6) 将特征向量组成维的特征矩阵F     7...8)得到簇划分 4、总结 谱聚类算法是一个使用起来简单,但是讲清楚却不是那么容易的算法,它需要你有一定的数学基础。如果你掌握了谱聚类,相信你会对矩阵分析,图论有更深入的理解。...这点传统聚类算法比如K-Means很难做到     2)由于使用了降维,因此在处理高维数据聚类时的复杂度比传统聚类算法好 谱聚类算法的主要缺点有:     1)如果最终聚类的维度非常高,则由于降维的幅度不够...2) 聚类效果依赖于相似矩阵,不同的相似矩阵得到的最终聚类效果可能很不同。 三、代码 # !

    1.3K30

    线性代数--MIT18.06(二十九)

    相似矩阵和若尔当形 29.1 课程内容:相似矩阵和若尔当形 回顾一下上一讲关于正定矩阵的性质: 对称 逆矩阵亦为正定矩阵(由于原矩阵的特征值与逆矩阵互为倒数,那么逆矩阵的特征值也全部大于0) 若...这些相似矩阵的共同点是什么呢?他们的特征值相同(特征向量不一定相同) 可以简单证明: ?...仅其自己为一个类别(特征值存在重复,特征向量不独立,于是矩阵无法对角化,因此这类矩阵中的对角矩阵为孤零零的一个群体,自己与自己相似), 其他的相似矩阵为另一类 ?...这里的第二类相似矩阵就称为若尔当形。 并且还可以将若尔当形再进行划分为若尔当块,每一个若尔当块对应一个特征向量(若尔当块的数量也就对应于特征向量的数量),即 ?...因为仅仅通过特征值相同,特征向量个数相同来判断两个矩阵为相似矩阵是不正确的,根据若尔当定义 ,每个矩阵都相似于一个若尔当矩阵 ,若尔当矩阵的形式为由若尔当块构成,若尔当块的数量与特征向量的数量相等。

    71930

    Things of Math

    ),最近抽空整理成pdf,需要的下载吧 1.微积分总结 微积分总结 2.线性代数那些事 行列式:理解行列式的几何意义 矩阵:理解矩阵是线性变换,线性变换有哪些,逆矩阵和伴随矩阵以及矩阵的秩的意义 特征向量和特征值...:理解特征值和特征向量对于线性变换的几何意义 相似矩阵:理解相似矩阵是同一个线性变换在不同坐标系下的不同表达 正交矩阵:理解正交矩阵对应的正交变换,介绍Givens旋转和Householder反射...矩阵分解:理解并实现矩阵的各种分解:LU分解,Cholesky分解,QR分解,特征值分解和奇异值分解 3.数值算法与应用 第一章 线性方程组求解 内容包括:高斯消去法,LU分解,Cholesky分解...,矩阵的逆矩阵求解 第二章 非线性方程求解 内容包括:二分法,牛顿法,割线法,IQI法,Zeroin算法 第三章 矩阵特征值和奇异值求解 内容包括:基本幂法,逆幂法和移位幂法,QR分解,Householder

    92610

    线性代数之相似矩阵、二次型

    相似矩阵及二次型的相关知识【第五部分 相似矩阵及二次型】: 【主要内容】 相似矩阵 1、向量的内积、长度、夹角等概念及其计算方法。 2、向量的正交关系及正交向量组的含义。...4、方阵的特征值与特征向量的概念及其计算方法。 (1)特征值求法:解特征方程; (2)特征向量的求法:求方程组的基础解系。...特征向量:属于不同特征值的特征向量是正交的。此外,每个实对称矩阵都可以被一组标准正交的特征向量所对角化。...2、掌握方阵特征值、特征向量的概念、求法。 3、了解相似矩阵的概念、掌握化对称矩阵为对角矩阵的方法。 4、掌握二次型的概念、会用正交变换化二次型为标准形。...相似矩阵 相似矩阵是指存在一个可逆矩阵P使得两个矩阵A和B满足关系 B = P^-1 * A * P。

    53610

    机器学习降维之奇异值分解(SVD)

    奇异值分解(Singular Value Decompostion, SVD)是在机器学习领域广泛应用的算法,不光可以用于降维算法中的特征分解,还可以用于推荐系统,以及自然语言处理等领域,是很多机器学习算法的基石...本篇文章对SVD原理做主要讲解,在学习之前,确保你已经熟悉线性代数中的基本知识,包括特征值、特征向量、相似矩阵相关知识点。如果不太熟悉的话,推荐阅读如下两篇文章,如何理解矩阵特征值?...知乎马同学的回答和如何理解相似矩阵?马同学高等数学,读完之后再看本篇文章会有很大帮助。 1. 回顾特征值和特征向量 我们首先回顾下特征值和特征向量的定义,如下所示。...注意到SVD也可以求出协方差矩阵X^TX最大的d个特征向量组成的矩阵,但是SVD有个好处,就是可以不求出协方差矩阵X^TX,也能通过某些算法求出右奇异矩阵V,比如https://arxiv.org/abs...SVD算法总结 SVD作为一个很基本的算法,在很多机器学习算法中都有它的身影,特别是在现在的大数据时代,由于SVD可以实现并行化,因此更是大展身手。

    1.8K20

    谱聚类(spectral clustering)原理总结

    通过找到L的最小的k个特征值,可以得到对应的k个特征向量,这k个特征向量组成一个nxk维度的矩阵,即为我们的H。...最常用的相似矩阵的生成方式是基于高斯核距离的全连接方式,最常用的切图方式是Ncut。而到最后常用的聚类方法为K-Means。下面以Ncut总结谱聚类算法流程。     ...,x_n)$,相似矩阵的生成方式, 降维后的维度$k_1$, 聚类方法,聚类后的维度$k_2$     输出: 簇划分$C(c_1,c_2,...c_{k_2})$.      1) 根据输入的相似矩阵的生成方式构建样本的相似矩阵...2}LD^{-1/2}$最小的$k_1$个特征值所各自对应的特征向量$f$     6) 将各自对应的特征向量$f$组成的矩阵按行标准化,最终组成$n \times k_1$维的特征矩阵F     7)...2) 聚类效果依赖于相似矩阵,不同的相似矩阵得到的最终聚类效果可能很不同。 (欢迎转载,转载请注明出处。欢迎沟通交流: liujianping-ok@163.com)

    1.4K30

    相似矩阵:换个角度看矩阵

    相似矩阵可以理解为同一个线性变换在不同坐标系下的矩阵表示。 有一张地图,可以用不同的坐标系来表示上面的位置。比如,可以用经纬度来表示,也可以用直角坐标系来表示。...相似矩阵就是线性代数中的这种“不同坐标系下的同一张地图”。 如果对于两个n阶方阵A和B,存在一个可逆矩阵P,使得: B = P^(-1)AP 那么我们称矩阵A和B相似。...相似矩阵:本质上是同一个线性变换在不同坐标系下的表示。 相似矩阵的性质 相似矩阵具有相同的特征值。 虽然特征向量可能不同,但特征值是固有的,不会因为坐标系的变换而改变。 相似矩阵具有相同的行列式。...相似矩阵具有相同的迹。 迹是矩阵主对角线元素的和,它也具有不变性。 这里出现了一个迹,矩阵的迹(trace)是指方阵主对角线上的所有元素之和。通常用tr(A)表示矩阵A的迹。...只有方阵才有迹 相似矩阵与对角化的关系,矩阵的对角化:化繁为简的艺术

    28310

    特征向量(Feature Vectors)

    我们就得到了这两种形状的特征向量。...orb为每个关键点计算相应的特征向量,orb算法创建仅包含1和0的特征向量,因此也被称为二元特征向量 ORB,不仅速度快,不受噪声照明、和图像变换,如旋转的影响 FAST 特征提取 ORB特征检测第一步第一步是找到图像中的关键点...,这是由FAST算法完成的。...在这个例子中,我们看到,第二个像素比第一个像素亮,所以我们给特征向量的第一个比特位赋值为0。特征向量的第一位对应于该关键点的第一对随机点。...定位关键点 ORB算法的第一步是定位训练图像中的所有关键点。 找到关键点后,ORB会创建相应的二进制特征向量,并在ORB描述符中将它们组合在一起。

    1.7K20

    如何计算特征向量?

    ,\( \lambda \) 是对应于特征向量 \( v \) 的特征值:在Python中,我们可以使用`numpy`库来计算一个矩阵的特征值和特征向量。...特征值和特征向量在机器学习、图像处理、数值分析等领域中都有广泛的应用,例如在主成分分析(PCA)中,特征向量可以用来找到数据的主要变化方向。在Python中,计算特征向量通常涉及以下步骤:1....定义或创建你想要计算特征向量的方阵。3. 使用`numpy.linalg.eig`函数计算特征值和特征向量。...`eigenvectors[:, i]` 表示取特征向量矩阵的第 `i` 列,这对应于特征值 `eigenvalues[i]` 的特征向量。...请注意,特征向量的计算要求矩阵必须是方阵(即行数和列数相等)。此外,特征向量的结果可能不是唯一的,因为特征向量可以在不改变其方向的情况下进行缩放。如何判断矩阵是否可逆?

    48610

    用scikit-learn学习谱聚类

    同时,对于相似矩阵的建立,也只是实现了基于K邻近法和全连接法的方式,没有基于$\epsilon$-邻近法的相似矩阵。...最后一步的聚类方法则提供了两种,K-Means算法和 discretize算法。     ...选择自定义相似矩阵时,需要自己调用set_params来自己设置相似矩阵。第三类是全连接法,可以使用各种核函数来定义相似矩阵,还可以自定义核函数。最常用的是内置高斯核函数'rbf'。...8)eigen_solver:1在降维计算特征值特征向量的时候,使用的工具。有 None, ‘arpack’, ‘lobpcg’, 和‘amg’4种选择。...10)assign_labels:即最后的聚类方法的选择,有K-Means算法和 discretize算法两种算法可以选择。一般来说,默认的K-Means算法聚类效果更好。

    2.4K40

    合同,正定,实对称,正交矩阵(补充子式)

    实对称矩阵的特征向量:实对称矩阵的不同特征值对应的特征向量是相互正交的。 正交矩阵的构造:将实对称矩阵的所有特征向量单位化后,按列组成一个矩阵,这个矩阵就是正交矩阵。...这个合同的写法,不知道你能不能想起来其实和相似矩阵的定义很类似,跟一个东西似的。 相似矩阵:要求存在可逆矩阵 P,使得 B = P^-1 * A * P。...相似矩阵主要用于研究矩阵的特征值和特征向量,而合同矩阵主要用于研究二次型和矩阵的正定性, 假设有矩阵 A 和 B: A = [[1, 2], [2, 4]] B = [[5, 0], [0, 1]] 如果我们能找到一个可逆矩阵...这是因为实对称矩阵的特征向量是相互正交的,可以构成一个正交矩阵。 奇异值分解(SVD): SVD是将矩阵分解为三个矩阵的乘积,其中两个是正交矩阵。 继续问,那正交相似矩阵一定合同吗?...正交相似矩阵一定是相似矩阵,而相似矩阵不一定合同。 正交矩阵Q是可逆的,但不是任意可逆矩阵。因此,满足正交相似关系的矩阵不一定满足合同关系的任意可逆变换。

    1K10

    深入机器学习系列之:快速迭代聚类

    谱聚类算法是建立在谱图理论的基础上的算法,与传统的聚类算法相比,它能在任意形状的样本空间上聚类且能够收敛到全局最优解。 谱聚类算法的主要思想是将聚类问题转换为无向图的划分问题。 ?...谱聚类算法的一般过程如下: 1、输入待聚类的数据点集以及聚类数k; 2、根据相似性度量构造数据点集的拉普拉斯矩阵L; 3、选取L的前k个(默认从小到大,这里的k和聚类数可以不一样)特征值和特征向量,构造特征向量空间...(这实际上是一个降维的过程); 4、使用传统方法对特征向量聚类,并对应于原始数据的聚类。...快速迭代算法和谱聚类算法都是将数据点嵌入到由相似矩阵推导出来的低维子空间中,然后直接或者通过k-means算法产生聚类结果,但是快速迭代算法有不同的地方。下面重点了解快速迭代算法的原理。...2 快速迭代算法的原理 ? 在大多数情况下,我们只关心第k(k不为1)大的特征向量,而不关注最大的特征向量。 这是因为最大的特征向量是一个常向量:因为W每一行的和都为1。

    90410

    谱聚类算法(Spectral Clustering)

    图1 谱聚类无向图划分——Smallest cut和Best cut 这样,谱聚类能够识别任意形状的样本空间且收敛于全局最优解,其基本思想是利用样本数据的相似矩阵(拉普拉斯矩阵)进行特征分解后得到的特征向量进行聚类...1.1 图的表示 如果我们计算出item与item之间的相似度,便可以得到一个只有item的相似矩阵,进一步,将item看成了Graph(G)中Vertex(V),歌曲之间的相似度看成G中的Edge(...剩下的仅是将松弛化的问题再离散化,即将特征向量再划分开,便可以得到相应的类别,如将图3中的最小特征向量,按正负划分,便得类{A,B,C}和类{D,E,F,G}。...,第一列值完全相同(迭代算法计算特征向量时,值极其相近),kmeans时可以删除,同时也可以通过这一列来简易判断求解特征值(向量)方法是否正确,常常问题在于邻接矩阵不对称。...3 谱聚类步骤 第一步:数据准备,生成图的邻接矩阵; 第二步:归一化普拉斯矩阵; 第三步:生成最小的k个特征值和对应的特征向量; 第四步:将特征向量kmeans聚类(少量的特征向量); 4

    1.9K50

    特征值和特征向量

    实际上,上述的一段话既讲了矩阵变换特征值及特征向量的几何意义(图形变换)也讲了其物理含义。物理的含义就是运动的图景:特征向量在一个矩阵的作用下作伸缩运动,伸缩的幅度由特征值确定。...特征值大于1,所有属于此特征值的特征向量身形暴长;特征值大于0小于1,特征向量身形猛缩;特征值小于0,特征向量缩过了界,反方向到0点那边去了。 关于特征值和特征向量,这里请注意两个亮点。...x 矩阵的特征向量不是固定的,特征值 {\displaystyle \lambda } 对应的所有特征向量和零向量一起可以组成一个向量空间,这个空间称为 A 的一个特征空间。...模最大的特征值对应的特征向量为 {\displaystyle A} 的主特征向量。 有限维向量空间上的一个变换 {\displaystyle A} 的所有特征值的集合称为 A 的谱。...对于实对称矩阵或埃尔米特矩阵来说,不同特征值对应的特征向量必定正交(相互垂直) 参考资料 https://zh.m.wikipedia.org/zh-cn/特征值和特征向量#特征值方程

    1.2K20
    领券