腾讯云

文章/答案/技术大牛

发布

社区首页 >问答首页 >findAssocs (tm)将所有相关性作为一个列表返回

问findAssocs (tm)将所有相关性作为一个列表返回
EN

Stack Overflow用户

提问于 2016-09-02 12:12:25

回答 1查看 298关注 0票数 0

我有一个从2个文本文档创建的语料库和一个DocumentTermMatrix，我想要找到单词之间的相关性。无论我选择什么单词，findAssocs函数都会为语料库中的所有单词返回correlations =1。为什么会这样呢？

以下是我的代码的摘录：

library(tm)
library(SnowballC)
doc <- Corpus(DirSource("C:/Users/biat/Documents/customersatis"))

toSpace <- content_transformer(function(x,pattern) {return (gsub(pattern, " ", x))})

doc <- tm_map(doc, toSpace, "-")
doc <- tm_map(doc, toSpace, ":")
doc <- tm_map(doc, removePunctuation)
doc <- tm_map(doc,content_transformer(tolower))
doc <- tm_map(doc,removeNumbers)
doc <- tm_map(doc,removeWords,stopwords("swedish"))
doc <- tm_map(doc,stripWhitespace)
doc <- tm_map(doc, PlainTextDocument)
doc <- tm_map(doc, stemDocument, "swedish")

dtm <- DocumentTermMatrix(doc)
findAssocs(dtm,"active",0.1)

当我运行它时，结果表明术语"active“与所有560个其他单词的相关性为1，如下所示，但实际上并非如此。

$active
  admin    actions    all   analysis arrends   
      1          1      1          1       1 .........    
   ...................................................        

............................ website  workshops  
                                   1          1

data-science

text-mining

回答 1

Stack Overflow用户

发布于 2018-05-01 17:25:29

正如scoa所说的，你可能有两个文档，其中一个术语同时出现:产生两个。

在将文档转换为语料库之前，请尝试折叠文档：

text <- paste(unlist(text), collapse ="")

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/39292155

复制

Apache编译后无法正常工作

apache 打包缓存 linux

因为某个场景的需求，要在一个国产系统Rocky4.2(国产凝思4.2操作系统)上安装Apache，虽说此系统是基于Redhat 5.8开发的，但是发现yum安装源包管理，RPM命令倒是能用，但是底层依赖完全没有，这就尴尬了，so，只能源码编译安装了。

后场技术

2020/09/03

2.9K0

K3组件kdsvrmgr无法正常工作

windows dt ip ping

1.在服务器上创建一个用户名和口令，和客户端登陆的用户名和口令一致的； 2.通过网上邻居访问服务器，如果没有提示输入用户和密码，那么网络没问题； 3.看COM+和DTC服务有没有设置好； 4.是XP sp3系统或Home系统的话，可能不稳定； 5.再者看感染病毒没有。。

py3study

2020/01/08

4.7K0

vue在IE下无法正常工作，Promise未定义？

https ecmascript 网络安全 github git

用vue写了一个日历组件，在Firefox、Edge、Chrome以及360等浏览器极速模式中运行一切正常，如图：

Yiiven

2022/12/15

4.3K0

为什么redis哨兵集群只有2个节点无法正常工作？

云数据库 Redis®spring https 网络安全

由于redis的响应速度快，每秒支持的并发极高(号称10万)，现在redis越来越流行了

JAVA葵花宝典

2019/11/08

7.9K1

安装ElasticSearch无法正常启动

容器容器镜像服务 Elasticsearch Service

在用docker安装 ElasticSearch 时，能正常创建容器，返回容器ID，但却无法正常启动，使用浏览器访问 127.0.0.1:9200 时无法访问，使用 docker logs 查看错误日志，发现报了两个错：bootstrap checks failed，下面分别是这两个错误的解决方法。

子润先生

2021/06/23

3.8K0

安装ElasticSearch无法正常启动

容器容器镜像服务 Elasticsearch Service

Petrochor

2022/06/07

3.2K0

jira无法正常显示图片

https 网络安全腾讯云开发者社区

jira安装之后，图片在富文本编辑器内能正常显示，但是在附件内无法显示，如果查看会发现图片的连接是127.0.0.1.

obaby

2023/02/23

2.6K0

树莓派鼓捣记 - 4b 安装 wiringPi 无法正常运行

打包

通过命令 sudo apt-get install wiringPi 安装，执行命令 gpio readall无法正常运行，是因为安装的版本不支持4b，最新版目前已经支持

晓晨

2020/11/06

1.9K0

正常的工作流程

git 人工智能

修改文件，将它们更新的内容添加到索引中。 $ git add file1 file2 file3 你现在为commit做好了准备，你可以使用git diff命令再加上–cached参数，看看哪些文件将被提交(commit)。 (如果没有–cached参数，git diff会显示当前你所有已做的但没有加入到索引里的修改。)你也可以使用git status命令来获得当前项目的一个状况。

用户3004328

2018/09/06

7900

NSTimer 导致UIViewController无法正常释放

其他

原因：当我们使用NSTimer的方法时，定时器对象会对它的target（即self：当前控制器）持有强引用，如果定时器不销毁，则控制器无法释放。

赵哥窟

2018/12/12

1.1K0

jsp无法正常加载CSS样式

css

今天写项目时，发现jsp页面不能加载css样式检查css和引入代码都没有问题，重启eclipse和tomcat都没有解决在浏览器中F12调试查看css文件都没有问题。后来百度寻找解决方法，终于找

白胡杨同学

2020/04/17

4.2K0

ubuntu下无法正常启动eclipse

spring ubuntu linux

最近用SpringMVC+Freemarker+AJAX作了个例子.遇到了一些关于中文编码的问题.通过查资料把问题解决了. 在这里总结一下.

EltonZheng

2021/01/26

1.1K0

小程序<live-pusher>、<live-player>标签无法正常使用？

小程序微信访问管理

出于政策和合规的考虑，微信暂时没有放开所有小程序对 <live-pusher> 和 <live-player> 标签的支持：

hhualiu

2019/03/11

2.3K0

pip无法正常使用解决办法

python

python -m pip install xxx 相当于import,叫做当做模块来启动

一点儿也不潇洒

2018/08/07

1.1K0

mongos崩溃后无法重启的问题

mongodb

从上次重启config节点，或者重新选举90或180天后，所有mongos会同时crash，并且无法重新启动。

MongoDB中文社区

2021/03/01

1.3K0

centos7无法正常启动network

network restart 服务

当我们执行systemctl restart network时出以下报错 image.png 解决方法：直接关闭 NetworkManger 服务就好了 systemctl stop NetworkManger

云计算小黑

2021/06/16

1.1K0

Crontab脚本无法正常执行问题

linux windows bash bash 指令

Crontab执行时若有异常首先要到/var/log下查看cron日志文件文件(vi /var/log/cron)，也可以使用用tail -f /var/spool/mail/root 查看最近的crontab执行情况。通常在日志中能够查看到异常都是脚本写的不正确导致的，可以手动执行看下具体原因。若在日志中看到脚本正常执行，但是无正确的预期结果，则无非是两种原因：

我是李超人

2020/08/21

2.2K0

点击加载更多

相似问题

Django模板标签可以像Django模板可调用一样使用吗？

124

从django模板标签调用python函数

Django -使用模板标签和'with'？

Django模板标签

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问findAssocs (tm)将所有相关性作为一个列表返回
EN

回答 1

Stack Overflow用户

Django模板标签可以像Django模板可调用一样使用吗？

从django模板标签调用python函数

Django -使用模板标签和'with'？

Django模板标签

Django模板标签

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问findAssocs (tm)将所有相关性作为一个列表返回EN

回答 1

Stack Overflow用户

Django模板标签可以像Django模板可调用一样使用吗？

从django模板标签调用python函数

Django -使用模板标签和'with'？

Django模板标签

Django模板标签

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问findAssocs (tm)将所有相关性作为一个列表返回
EN