首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    MySQL中的ifnull()函数判断空值

    但是在MySQL中,ISNULL()函数仅仅是用于判断空值的,接受一个参数并返回一个布尔值,不提供当值为空值的时候将返回值替换成另一个值的第二参数。...SELECT ISNULL('i like yanggb'); // 0 SELECT ISNULL(NULL); // 1 因此MySQL另外提供了一个IFNULL()函数。...简单介绍 IFNULL()函数是MySQL内置的控制流函数之一,它接受两个参数,第一个参数是要判断空值的字段或值(傻?),第二个字段是当第一个参数是空值的情况下要替换返回的另一个值。...函数的语法 IFNULL(v1, v2) 其中,如果v1不为NULL,则IFNULL函数返回v1; 否则返回v2的结果。...简单示例 SELECT IFNULL(NULL, 'i like yanggb'); // i like yanggb 在上面的例子中,由于第一个参数为NULL,所以返回的是第二个参数的值。

    9.8K10

    余弦相似欧氏距离相似度(比较记录)

    余弦相似度公式: ? 这里的分别代表向量A和B的各分量。 原理:多维空间两点所设定的点形成夹角的余弦值。...范围:[-1,1],值越大,说明夹角越大,两点相距就越远,相似度就越小。 余弦相似度模型:根据用户评分数据表,生成物品的相似矩阵; 欧氏距离相似度公式: ?...原理:利用欧式距离d定义的相似度s,s=1 /(1+d)。 范围:[0,1],值越大,说明d越小,也就是距离越近,则相似度越大。...欧式相似度模型:根据用户评分数据表,生成物品的相似矩阵; 总结: 余弦相似度衡量的是维度间取值方向的一致性,注重维度之间的差异,不注重数值上的差异,而欧氏度量的正是数值上的差异性。...主要看数值的差异,比如个人兴趣,可能数值对他影响不大,这种情况应该采用余弦相似度 ,而物品的相似度,例如价格差异数值差别影响就比较大,这种情况应该采用欧氏度量

    2.9K30

    MySQL 全文索引 实现相似度搜索

    模糊查询 Mysql实现模糊查询 最简单的是LIKE关键字, 如 SELECT * FROM `content` WHERE `topic` LIKE '%地球%'; 而当然也可以使用LOCATE()...如何解决 在Mysql 5.7.6后 Mysql内置了ngram分词疫情, 可以实现中文, 日文, 韩文的解析. 我们需要对指定字段建立全文索引并指定分词引擎....VARCHAR, TEXT, CHAR 设置分词 我们需要先设置ngram的分词长度, 由于中文词语一般为两个字, 所以建议设置为2 mysqld --ngram_token_size=2 也可以通过修改mysql...BOOLEAN模式 : 可以通过操作符 进行复杂搜索, 搜索引擎类似....相似度搜索 本文链接:https://blog.xsot.cn/archives/mysql-fulltext.html 所有原创文章采用 CC BY-NC-SA 4.0 协议进行许可, 转载请注明原文链接

    3.5K10

    Elasticsearch全文检索余弦相似

    一、单个词语的全文搜索 见 《Elasticsearch全文搜索TF/IDF》https://my.oschina.net/stanleysun/blog/1594220 二、多个词语的全文搜索 向量空间模型...TF-IDF的解释参见我的另一篇文章《Elasticsearch全文搜索TF/IDF》https://my.oschina.net/stanleysun/blog/1594220 举例 假如现在我要在文档中搜索...各种编程语言的比较 我们可以对每一个文档创建相似的向量,向量中包含“Python”和“语言”两个维度。...因此,我们可以用余弦值来表示相似度。 ? 上面是2维向量的相似度,用同样的方式,可以算出多维向量的相似度,也就是可以计算多个词文档的相关性。...相关文章 Elasticsearch全文搜索TF/IDF 推荐引擎算法 - 猜你喜欢的东西

    3K30

    TF-IDF余弦相似

    原理 TF-IDF(term frequency=inverse document frequency)是⼀种⽤于资讯检索文本挖掘的常⽤加权技术。...这个权重叫做"逆⽂档频率"(Inverse Document Frequency,缩写为IDF),它的大小一个词的常见程度成反比。...第二种方法是直接用TfidfVectorizer完成向量化TF-IDF预处理。   ...由于第二种方法比较的简洁,因此在实际应用中推荐使用,一步到位完成向量化,TF-IDF标准化。 二. 余弦定理 余弦相似性通过测量两个向量的夹角的余弦值来度量它们之间的相似性。...两个向量有相同的指向时,余弦相似度的值为1;两个向量夹角为90°时,余弦相似度的值为0;两个向量指向完全相反的方向时,余弦相似度的值为-1。这 结果是向量的长度无关的,仅向量的指向方向相关。

    2.5K41

    相似距离算法种类总结

    场景:在海量物品的相似度计算中可用simHash对物品压缩成字符串,然后使用海明距离计算物品间的距离 二、相似度度量(9种) 相似度度量(Similarity),即计算个体间的相似程度,距离度量相反...,相似度度量的值越小,说明个体间相似度越小,差异越大 1、余弦相似度(Cosine Similarity) 2、调整余弦相似度(Adjusted Cosine Similarity) 3、皮尔森相关系数...1,2),再用余弦相似度计算,得到-0.8,相似度为负值并且差异不小,但显然更加符合现实。...如果比较XY的Jaccard相似系 数,只比较xn和yn中相同的个数,公式如下: 5、Tanimoto系数(广义Jaccard相似系数) 定义:广义Jaccard相似度,元素的取值可以是实数。...6、对数似然相似率 7、互信息/信息增益,相对熵/KL散度 8、信息检索–词频-逆文档频率(TF-IDF) 9、词对相似度–点间互信息 三、距离度量相似度度量的区别 欧氏距离是最常见的距离度量,而余弦相似度则是最常见的相似度度量

    1.3K40

    TF-IDF余弦相似性的应用(二):找出相似文章

    有些时候,除了找到关键词,我们还希望找到原文章相似的其他文章。比如,"Google新闻"在主新闻下方,还提供多条相似的新闻。 ?...为了找出相似的文章,需要用到"余弦相似性"(cosine similiarity)。下面,我举一个例子来说明,什么是"余弦相似性"。 为了简单起见,我们先从句子着手。   ...请问怎样才能计算上面两句话的相似程度? 基本思路是:如果这两句话的用词越相似,它们的内容就应该越相似。因此,可以从词频入手,计算它们的相似程度。 第一步,分词。   ...假定A和B是两个n维向量,A是 [A1, A2, ..., An] ,B是 [B1, B2, ..., Bn] ,则AB的夹角θ的余弦等于: ?...使用这个公式,我们就可以得到,句子A句子B的夹角的余弦。 ? 余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似,这就叫"余弦相似性"。

    1.1K60

    文本分析 | 词频余弦相似

    上一期,我们介绍了文本相似度的概念,通过计算两段文本的相似度,我们可以: 对垃圾文本(比如小广告)进行批量屏蔽; 对大量重复信息(比如新闻)进行删减; 对感兴趣的相似文章进行推荐,等等。...那么如何计算两段文本之间的相似程度?...回顾点击这里:文本分析 | 余弦相似度思想 本文会具体介绍如何计算文本的夹角余弦相似度,包括两部分: 向量的夹角余弦如何计算 如何构造文本向量:词频词频向量 1. 向量的夹角余弦如何计算 ?...词频词频向量 文本是由词组成的,我们一般通过计算词频来构造文本向量——词频向量。 比如有一句话: 我是数说君,我爱你们,你们爱我吗?...(2)英文文本的比较 中文不同的是,英文不需要分词,因为英文天然就是由一个一个词组组成的。 I Love Shushuojun → I/ Love/ Shushuojun

    1.8K81
    领券