文章/答案/技术大牛

发布

问tm_map是R中的误差
EN

Stack Overflow用户

提问于 2017-05-25 04:38:47

回答 2查看 1.6K关注 0票数 0

这是我第一次参加twitter分析。

    #Search data from Twitter
library("twitteR")
SearchData = searchTwitter("Bruno Mars", n=1000,lang = 'en')
SearchData

#Scrapping Data 
userTimeline("BrunoMars", n=100, maxID =NULL, excludeReplies = FALSE, includeRts = FALSE)

class(SearchData)
head(SearchData)

#Cleanning Data
library(NLP)
library(tm)



TweetList <- sapply(SearchData, function(x) x$getText()) 

TweetList <- (TweetList[!is.na(TweetList)])
TweetCorpus <- Corpus(VectorSource(TweetList))
TweetCorpus <-  iconv(TweetCorpus, to ="utf-8")

#change data to lower case

TweetCorpus <- tm_map(TweetCorpus,removePunctuation)
TweetCorpus <- tm_map(TweetCorpus, removeNumbers)
TweetCorpus <- tm_map(TweetCorpus, tolower)

我在UseMethod("tm_map"，x)中得到了这个错误:在我的最后3行中，没有适用于类“字符”对象的'tm_map‘方法。

我试图通过在我的代码中添加content_transformer之前添加removePunctuation、removeNumbers和tolower来解决这个问题，但是我仍然有相同的错误。我真的不知道。我需要你的建议和建议。我已经解决这个问题好几天了，但还没有解决。

非常感谢罗斯

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-05-25 04:47:35

tm_map必须应用于语料库对象，而不是字符向量。但是iconv将TweetCorpus对象从一个语料库转换回一个字符向量。

要解决这个问题，请切换预处理的顺序，以便在将tweet转换为语料库对象之前使用iconv：

TweetList <- c("hello", "world", "Hooray", "yep")
TweetList <-  iconv(TweetList, to ="utf-8")
TweetCorpus <- Corpus(VectorSource(TweetList))

票数 0

Stack Overflow用户

发布于 2017-05-25 04:49:02

tm的最新版本使您不能再使用对简单字符值进行操作的tm_map函数。因此，问题在于您的tolower步骤，因为这不是一个“规范”转换(参见getTransformations())。代之以

TweetCorpus <- tm_map(TweetCorpus, content_transformer(tolower))

content_transformer函数包装器将将所有内容转换为语料库中正确的数据类型。您可以将content_transformer与任何旨在操作字符向量的函数一起使用，以便它能够在tm_map管道中工作。

票数 1

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/44180816

复制

详谈R中散点图添加误差线的细节

case ggplot2 size width 图表

加载R包 library(tidyverse) library(ggsci) 导入数据 df <- read_tsv("data.txt") 数据可视化 df %>% ggplot(aes(case_control,logCPM)) + geom_jitter(aes(fill=case_control,color=case_control), pch=21,width=0.1,size=2)+ stat_boxplot(geom="errorbar",widt

R语言数据分析指南

2022/12/22

1.7K0

注意：C++中double的表示是有误差的

c++

注意：C++中double的表示是有误差的，直接通过下面的例子看一下 1 #include<iostream> 2 using namespace std; 3 int main() 4 {

用户1215536

2018/02/05

9170

自编R计算MSE（均方误差）[通俗易懂]

https java 网络安全

1.生成关于x1~N(5,3)，x2～N（100,10），error～N（0,1） 2.自己定一个实际对线性回归模型，并计算得到真实的y y = 1.5+0.8x1+1.8x2+error 3.对x1，x2 进行线性拟合，当然这里也可以自写函数用最小二乘法原理，进行参数对估计 4.提取的每一个beta1，beta2 5.计算他的均方误差，计算公式

全栈程序员站长

2022/09/27

6280

「R」R检验中的“数据是恆量”问题

https 编程算法网络安全

这是一般做基因差异表达分析在使用t检验或者其他统计检验中常出现的一个问题。之前我学习和自己分析时就遇到过，尝试使用判断的方式事先检查它是不是数据存在问题（这类数据明显不服从正态分布），可以使用正态性检验，或者直接判断是不是样本组内的数据是完全一样的，如果一样就不要这个了。

王诗翔呀

2020/07/02

4.9K0

R语言之可视化①误差棒

ide 编程算法

本教程介绍如何使用R软件和ggplot2包创建带有误差棒的图形。可以使用以下函数创建不同类型的错误栏：

用户1359560

2018/12/05

2.6K0

「R」ggplot2误差棒快速指南

error ggplot2 line mean this

这里使用ToothGrowth 数据集。它描述了维他命C对Guinea猪牙齿的生长影响。包含了三种不同的剂量（Vitamin C (0.5, 1, and 2 mg)）和相应的两种不同使用方法（ [orange juice (OJ) or ascorbic acid (VC)]）。

王诗翔呀

2020/07/03

9290

线性回归均方误差_线性回归模型中随机误差项的意义

https 网络安全机器学习神经网络深度学习

刚开始学习机器学习的时候就接触了均方误差（MSE，Mean Squared Error），当时就有疑惑，这个式子是怎么推导的，但是因为懒没有深究。今天看到了唐宇迪老师的机器学习课程，终于理解他是怎么推导的了。一定要一步一步看下去，别看他公式这么多，随便认真看一下就能理解的！

全栈程序员站长

2022/11/11

9840

孟德尔误差是个什么鬼？

https 网络安全

孟德尔定律很数学化，当基因区分显隐性时，分离定律（AaAa呈现3:1），自由组合定律（AaBbAaBb呈现9:3:3:1）。同父同母生育的孩子，应该是遗传父母各一半的遗传物质，因此全同胞的个体应该是一样的。之所以九子各不同，是因为存在抽样误差，而这种误差在遗传学中，又称为孟德尔抽样误差。

邓飞

2019/09/25

1.3K0

「R」观察R是如何工作的

tree 语法

R中的一切皆对象，R表达式也是R对象。这意味着我们可以从语法上解析R表达式，或者部分地执行R表达式，来观察R是如何解释它们的。这对于了解R的工作机制或者调试R代码十分有用。

王诗翔呀

2020/07/03

5680

测量误差？什么误差？测量什么？

node.js

买了一台普源的DM3058，官网售价3980元，用来测量100nA误差范围内的电流，由于预算有限，供应商同时推荐了固纬GDM-8341万用表，分辨率可测到10nA。某宝售价2260元，与DM3058相比省下来1720元！

硬件大熊

2022/06/23

9170

误差函数

神经网络

其中，表示神经网络的输出，表示监督数据（采用 one-hot 编码），表示数据的维度。

hotarugali

2022/03/03

9310

是Excel的图，不！是R的图

coordinates data ggplot2 line position

excel作为一个强大的统计工具，自身包含着一部分数据可视化的功能。R作为可视化的大势，自然也可以画出这些图，有一篇就通过ggplot2包进行了部分总结，甚是有趣，小编复刻学习了一番，现对代码做简单注释，以作分享。

生信宝典

2019/08/01

4.1K0

R语言与机器学习（分类算法）朴素贝叶斯算法

r 语言机器学习编程算法

前两个算法都被要求做出一个艰难的决定，给出数据所属分类的明确答案，但往往因为分类特征统计不足，或者分类特征选择有误导致了错误的分类结果，哪怕是训练集也有可能出现不能正确分类的情形。这时，前两种方法都如同现实生活一样是用“少数服从多数”的办法来做出决策。正如帕斯卡指出的：“少数服从多数未必是因为多数人更正义，而是多数人更加强力”，所以为了保证“少数人的权利”，我们要求分类器给出一个最优的猜测结果，同时给出猜测的概率估计值。贝叶斯统计基础在说朴素贝叶斯算法之前，还是要说说贝叶斯统计，关于贝叶斯统计，

机器学习AI算法工程

2018/03/12

2.1K0

使Twitter数据对百事可乐和可口可乐进行客户情感分析

python api facebook native pycharm

可口可乐（Coca-Cola）和百事可乐（PepsiCo）是软饮料行业的知名品牌，两家公司均跻身《财富》500强。在竞争激烈的市场中拥有广泛产品线的公司彼此之间存在着激烈的竞争，并在随后的几乎所有垂直产品市场中不断争夺市场份额。

abs_zero

2021/03/19

6700

标准误差

sum

标准误差是当前应用最广泛、最基本的一种随机误差的表示方法，当标准误差求得后，平均误差和极限差即可求得故国际上普遍采用标准误差作为实验结果质量的数字指标

为为为什么

2023/02/21

1.1K0

【R语言】R中的因子（factor）

编程算法

R中的因子用于存储不同类别的数据，可以用来对数据进行分组，例如人的性别有男和女两个类别，根据年龄可以将人分为未成年人和成年人，考试成绩可以分为优，良，中，差。

生信交流平台

2022/09/21

3.4K0

R语言异方差回归模型建模：用误差方差解释异方差

编程算法

在社会科学中将OLS估计应用于回归模型时，其中的一个假设是同方差，我更喜欢常误差方差。这意味着误差方差没有系统的模式，这意味着该模型在所有预测级别上都同样差。

拓端

2020/08/14

1.6K0

origin带误差线的柱状图_怎么加误差棒

https 网络安全

软件版本：OriginPro 2021b (64-bit) SR2 9.8.5.212 (学习版) 本期目标：

全栈程序员站长

2022/11/11

6.6K0

什么是好的R包

数据分析 r 语言腾讯云开发者社区

我发现写作这个事情也非常遵循楞次定律，上学期一旦开始了越写越停不下来，但是过春节停一段时间后，越不写越难以重新开始。整理了不少东西可以写作，但是每次都被懒癌打败，不知不觉又一个多月没更了。

Listenlii-生物信息知识分享

2020/05/29

1.2K0

mse均方误差例题_误差函数计算器

https 网络安全

本人最近需要写多个仿真，需要大量用到MSE（均方误差）计算，于是干脆将MSE运算封装为函数，后续使用直接进行调用即可。

全栈程序员站长

2022/11/19

9570

相似问题

R中的tm_map错误消息

回转R误差:系统是计算奇异的

在R中使用tm_map(testfile，removeNumbers)中的过滤器？

R中的舍入误差？

R中的捕获误差

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问tm_map是R中的误差
EN

回答 2

Stack Overflow用户

Stack Overflow用户

R中的tm_map错误消息

回转R误差:系统是计算奇异的

在R中使用tm_map(testfile，removeNumbers)中的过滤器？

R中的舍入误差？

R中的捕获误差

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问tm_map是R中的误差EN

回答 2

Stack Overflow用户

Stack Overflow用户

R中的tm_map错误消息

回转R误差:系统是计算奇异的

在R中使用tm_map(testfile，removeNumbers)中的过滤器？

R中的舍入误差？

R中的捕获误差

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问tm_map是R中的误差
EN