腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
RecordLinkage
-
R
一个
向量
。
与
自身
不
匹配
、
、
、
、
如果我有
一个
名字的
向量
,比如:我想使用levenshteinSim或类似的方法来获得这个
向量
中的相似度分数。我之前已经用两个不同的
向量
a和b做到了。但是,如果我对相同的
向量</
浏览 8
提问于2017-08-16
得票数 1
回答已采纳
2
回答
如何在
R
中找到表中单元格之间的%
匹配
/相似性?
TCGATCGATCGA)和我想找到90%
匹配
的。我正在查看
RecordLinkage
包和函数levenshteinSim。
浏览 2
提问于2019-06-26
得票数 0
回答已采纳
1
回答
使用记录链接的python字符串
匹配
-为特定情况编写规则的可能性
、
、
、
、
我正在使用python的
recordlinkage
工具包来
匹配
来自两个dataframes、df1和df2的学校名称列,同时阻塞它们的公共列'division'。我的代码如下:from
recordlinkage
.standardise import clean indexer =
recordlinkage
.Index,如果school_name中有数字,例如'girls middle 35sp'有数字35等等,那么数
浏览 5
提问于2020-08-24
得票数 0
3
回答
在python中使用ECM进行记录链接
、
、
我正在处理
一个
记录链接问题,并应用无监督算法,因为我没有外部标签。import
recordlinkage
pairs= indexer.index(data1, data2) compare_cl.string('
浏览 1
提问于2018-05-24
得票数 3
2
回答
检查
一个
字符串的所有字符是否存在于
r
中的另
一个
字符串中。
、
如果是这样的话,我应该得到
一个
100%的
匹配
,否则
一个
百分比表示
匹配
的字符百分比。我尝试在levenshteinSim包中使用
RecordLinkage
,但它给出了
一个
与
将
一个
字符串更改为另
一个
字符串所需的数量相对应的数字。install.packages("
RecordLinkage
")levenshteinSim("P
浏览 2
提问于2016-03-18
得票数 2
回答已采纳
2
回答
删除
RecordLinkage
中的循环
我正在使用
R
中的
RecordLinkage
包对数据集执行重复数据消除。
RecordLinkage
包中经过重复数据消除的输出中有循环。id2 name2 5 Jane Johnson 17 Jane Johnson 1 5 17 Jane Johnson Nam
浏览 1
提问于2015-05-12
得票数 0
1
回答
将字符串
向量
与其
自身
进行
R
匹配
、
、
因此,我有
一个
大约有35000个条目的字符串
向量
,我想使用以下函数(
RecordLinkage
::levenshteinSim)将每个字符串与其他字符串进行
匹配
,然后有
一个
包含所有结果的矩阵。
浏览 7
提问于2018-01-11
得票数 0
回答已采纳
3
回答
计算字符串相似度的百分比
、
给定函数在
R
中使用“string uses”包,并告知将
一个
字符串更改为另
一个
字符串所需的最小更改。我想知道
一个
字符串和另
一个
字符串在"%“格式中有多相似。请帮帮我,谢谢。
浏览 3
提问于2017-09-27
得票数 3
回答已采纳
1
回答
如何在
R
包
RecordLinkage
中使用
RecordLinkage
--意外输出
我在
R
包
RecordLinkage
中使用了
RecordLinkage
函数,得到
一个
我知道的结果是错误的,所以我知道我误解了什么。我在x64 Windows上使用
R
3.2.3。我对Stata非常熟悉,但对
R
不太熟悉。我只是在
r
-help上交叉张贴。 我可以从阻塞字段创建记录对,但是所有对都是未知状态(NA)。我不能创建
匹配
或非
匹配
。我想要
一个
简单的示例,说明如何使用
RecordLinkage
包链接数据
浏览 5
提问于2016-01-28
得票数 4
1
回答
是否有
一个
R
函数来查找字符
向量
中的regexp
匹配
索引?
、
、
我正在寻找
一个
像match一样工作的
R
函数,它只用于正则表达式
匹配
,而不是相等。换句话说,如果我有
一个
变量
r
,它是正则表达式的字符
向量
,变量x是字符
向量
,我希望函数返回
一个
与
r
相同的数值
向量
,它为每个正则表达式提供第
一个
元素的索引,该索引
与
该正则表达式
匹配
。注意,我
不
希望正则表达式
匹配
的字符串中的位置。我需要<
浏览 3
提问于2014-01-27
得票数 6
回答已采纳
1
回答
在
R
中对单词混乱的名称进行字符串
匹配
、
我正在尝试在
R
中
匹配
类似于VISHWANATHAN KRISHNA GURUVAYUR和GURUVAYUR KRISHNA VISHWANATHAN的名称。删除空格后,levenshtein会给出
一个
21%
匹配
。我想知道是否有一些字符串
匹配
算法可以将这两个名字标记为相似...levenshteinSim("GURUVAYURKRISHNAVISHWANATHAN"
浏览 3
提问于2016-03-22
得票数 1
3
回答
查找同
一个
矩阵的计数,忽略矩阵中存在的NAs
、
当将V1
与
自身
进行比较时,计数为2,因为这两个数字是
匹配
的。当将V1
与
V2进行比较时,计数为0,因为没有
匹配
的数字。现在,每一行矩阵V都应该与其
自身
(V)
匹配
,以得到如下所示的计数矩阵[V1,] 2 0 1[V3,] 1 0 2 因此,它是指计算
向量
中不属于NA的元素的数量。我怎么用
R
做这件事?
浏览 4
提问于2015-08-13
得票数 1
回答已采纳
1
回答
通过排除
R
中相同的条目来计算文本字符串中的相似度
、
、
、
、
给定的
R
脚本计算视觉效果中显示的两个名称之间的相似度(以%为单位)。这里有两列"names1“和"names2”,它们在id1和id2中有各自的id2。我的要求是,当我们执行脚本时,"names1“中的每个名称
与
"names2”列中的每个名称进行比较,我
不
希望将相同的条目(即(id1,names1)列
与
(id2,names2)列中的相同条目进行比较。为了便于说明,应该将第
一个
(id1,names1)条目(1,Prabhudev Ramanujam)
与</em
浏览 7
提问于2018-01-06
得票数 0
回答已采纳
3
回答
字符
向量
列表
与
字符
向量
的模糊字符串
匹配
、
、
我有
一个
字符
向量
列表和
一个
字符
向量
。我希望在列表中的每个元素(字符
向量
)
与
字符
向量
(字符串)的每个元素之间执行模糊
匹配
,并返回每个组合的最大相似度分数。tall person", "new building", "good example", "green with envy", "zebra crossing") 现在,我想将mylist中的每个元素
与<
浏览 0
提问于2018-07-12
得票数 2
回答已采纳
2
回答
实现聚类的邻近度矩阵
、
、
、
我使用perl和
R
来实现这一点。下面是我用perl编写的
一个
典型代码,它从包含我的词袋的文本文件中读取内容 use warnings ; use Text::Levenshtein qw(distance
浏览 0
提问于2011-08-09
得票数 6
回答已采纳
1
回答
如何旋转对象以
匹配
three.js中的法线
向量
?
、
、
我有
一个
物体,比如说一辆车,它的z旋转已经设定好了,所以它朝向它的方向。 汽车也在
一个
地面上,这是在
一个
斜坡(平面),代表了归一化的法线
向量
(nx, ny, nz)。我现在如何旋转汽车的x和y轴,使其
与
斜率对齐?也就是说,汽车
自身
的法线
向量
与
(nx, ny, nz)
匹配
浏览 1
提问于2022-01-20
得票数 2
1
回答
R
代码levenshteinSim()函数:比较数据中的两列
、
我试图为
R
数据帧中的两列获得
一个
比较分数。我使用库
RecordLinkage
并尝试应用levenshteinSim()函数。这个想法是为了得到
一个
类似的结果而是比较一列又一列然而,我得到了错误: 是否
浏览 1
提问于2017-11-03
得票数 0
1
回答
R
中的模糊合并
、
1.Tire 195 / 75
R
16C Cordiant Business CA 107 / 105
R
all-season还有
一个
例子2.Thet
浏览 5
提问于2017-11-18
得票数 0
回答已采纳
3
回答
在单元格中查找对应的数组
、
假设我有
一个
大小相同的数组单元格,例如 [NaN 4 7 ], ...[3 4 NaN] };vec = [1 2 2];另
一个
向量
[5 4 7
浏览 0
提问于2015-10-05
得票数 1
1
回答
Excel在列中找到部分
匹配
、
我试图编写
一个
公式,如果单元格G3的内容
与
除
自身
之外的同一列中的任何内容部分
匹配
,该公式将返回
一个
正值给单元格D3。也就是说。红色-
不
匹配
蓝色-部分
匹配
浅蓝-
不
匹配
不
匹配
,因为“红色”不是
与
任何其他结果的部分
匹配
,部分
匹配
是因为“蓝色”是“浅蓝”的部分
匹配
。
浏览 0
提问于2019-05-03
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
R语言字符串处理值stringr
R包系列——stringr包
R语言实例:提取酒店房间床型大小的数字
R向量化操作 基础知识
R语言的字符串处理
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券