首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >tm_map是R中的误差

tm_map是R中的误差
EN

Stack Overflow用户
提问于 2017-05-25 04:38:47
回答 2查看 1.6K关注 0票数 0

这是我第一次参加twitter分析。

代码语言:javascript
运行
AI代码解释
复制
    #Search data from Twitter
library("twitteR")
SearchData = searchTwitter("Bruno Mars", n=1000,lang = 'en')
SearchData

#Scrapping Data 
userTimeline("BrunoMars", n=100, maxID =NULL, excludeReplies = FALSE, includeRts = FALSE)

class(SearchData)
head(SearchData)

#Cleanning Data
library(NLP)
library(tm)



TweetList <- sapply(SearchData, function(x) x$getText()) 

TweetList <- (TweetList[!is.na(TweetList)])
TweetCorpus <- Corpus(VectorSource(TweetList))
TweetCorpus <-  iconv(TweetCorpus, to ="utf-8")

#change data to lower case

TweetCorpus <- tm_map(TweetCorpus,removePunctuation)
TweetCorpus <- tm_map(TweetCorpus, removeNumbers)
TweetCorpus <- tm_map(TweetCorpus, tolower)

我在UseMethod("tm_map",x)中得到了这个错误:在我的最后3行中,没有适用于类“字符”对象的'tm_map‘方法。

我试图通过在我的代码中添加content_transformer之前添加removePunctuation、removeNumbers和tolower来解决这个问题,但是我仍然有相同的错误。我真的不知道。我需要你的建议和建议。我已经解决这个问题好几天了,但还没有解决。

非常感谢罗斯

EN

回答 2

Stack Overflow用户

回答已采纳

发布于 2017-05-25 04:47:35

tm_map必须应用于语料库对象,而不是字符向量。但是iconvTweetCorpus对象从一个语料库转换回一个字符向量。

要解决这个问题,请切换预处理的顺序,以便在将tweet转换为语料库对象之前使用iconv

代码语言:javascript
运行
AI代码解释
复制
TweetList <- c("hello", "world", "Hooray", "yep")
TweetList <-  iconv(TweetList, to ="utf-8")
TweetCorpus <- Corpus(VectorSource(TweetList))
票数 0
EN

Stack Overflow用户

发布于 2017-05-25 04:49:02

tm的最新版本使您不能再使用对简单字符值进行操作的tm_map函数。因此,问题在于您的tolower步骤,因为这不是一个“规范”转换(参见getTransformations())。代之以

代码语言:javascript
运行
AI代码解释
复制
TweetCorpus <- tm_map(TweetCorpus, content_transformer(tolower))

content_transformer函数包装器将将所有内容转换为语料库中正确的数据类型。您可以将content_transformer与任何旨在操作字符向量的函数一起使用,以便它能够在tm_map管道中工作。

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44180816

复制
相关文章
详谈R中散点图添加误差线的细节
加载R包 library(tidyverse) library(ggsci) 导入数据 df <- read_tsv("data.txt") 数据可视化 df %>% ggplot(aes(case_control,logCPM)) + geom_jitter(aes(fill=case_control,color=case_control), pch=21,width=0.1,size=2)+ stat_boxplot(geom="errorbar",widt
R语言数据分析指南
2022/12/22
1.7K0
详谈R中散点图添加误差线的细节
注意:C++中double的表示是有误差的
注意:C++中double的表示是有误差的,直接通过下面的例子看一下 1 #include<iostream> 2 using namespace std; 3 int main() 4 {
用户1215536
2018/02/05
9170
自编R计算MSE(均方误差)[通俗易懂]
1.生成关于x1~N(5,3),x2~N(100,10),error~N(0,1) 2.自己定一个实际对线性回归模型,并计算得到真实的y y = 1.5+0.8x1+1.8x2+error 3.对x1,x2 进行线性拟合,当然这里也可以自写函数用最小二乘法原理,进行参数对估计 4.提取的每一个beta1,beta2 5.计算他的均方误差,计算公式
全栈程序员站长
2022/09/27
6280
「R」R检验中的“数据是恆量”问题
这是一般做基因差异表达分析在使用t检验或者其他统计检验中常出现的一个问题。之前我学习和自己分析时就遇到过,尝试使用判断的方式事先检查它是不是数据存在问题(这类数据明显不服从正态分布),可以使用正态性检验,或者直接判断是不是样本组内的数据是完全一样的,如果一样就不要这个了。
王诗翔呀
2020/07/02
4.9K0
R语言之可视化①误差棒
本教程介绍如何使用R软件和ggplot2包创建带有误差棒的图形。 可以使用以下函数创建不同类型的错误栏:
用户1359560
2018/12/05
2.6K0
R语言之可视化①误差棒
「R」ggplot2误差棒快速指南
这里使用ToothGrowth 数据集。它描述了维他命C对Guinea猪牙齿的生长影响。包含了三种不同的剂量(Vitamin C (0.5, 1, and 2 mg))和相应的两种不同使用方法( [orange juice (OJ) or ascorbic acid (VC)])。
王诗翔呀
2020/07/03
9290
线性回归 均方误差_线性回归模型中随机误差项的意义
刚开始学习机器学习的时候就接触了均方误差(MSE,Mean Squared Error),当时就有疑惑,这个式子是怎么推导的,但是因为懒没有深究。今天看到了唐宇迪老师的机器学习课程,终于理解他是怎么推导的了。一定要一步一步看下去,别看他公式这么多,随便认真看一下就能理解的!
全栈程序员站长
2022/11/11
9840
线性回归 均方误差_线性回归模型中随机误差项的意义
孟德尔误差是个什么鬼?
孟德尔定律很数学化,当基因区分显隐性时,分离定律(AaAa呈现3:1),自由组合定律(AaBbAaBb呈现9:3:3:1)。同父同母生育的孩子,应该是遗传父母各一半的遗传物质,因此全同胞的个体应该是一样的。之所以九子各不同,是因为存在抽样误差,而这种误差在遗传学中,又称为孟德尔抽样误差。
邓飞
2019/09/25
1.3K0
孟德尔误差是个什么鬼?
「R」观察R是如何工作的
R中的一切皆对象,R表达式也是R对象。这意味着我们可以从语法上解析R表达式,或者部分地执行R表达式,来观察R是如何解释它们的。这对于了解R的工作机制或者调试R代码十分有用。
王诗翔呀
2020/07/03
5680
测量误差?什么误差?测量什么?
买了一台普源的DM3058,官网售价3980元,用来测量100nA误差范围内的电流,由于预算有限,供应商同时推荐了固纬GDM-8341万用表,分辨率可测到10nA。某宝售价2260元,与DM3058相比省下来1720元!
硬件大熊
2022/06/23
9170
测量误差?什么误差?测量什么?
误差函数
其中, 表示神经网络的输出, 表示监督数据( 采用 one-hot 编码), 表示数据的维度。
hotarugali
2022/03/03
9310
是Excel的图,不!是R的图
excel作为一个强大的统计工具,自身包含着一部分数据可视化的功能。R作为可视化的大势,自然也可以画出这些图,有一篇就通过ggplot2包进行了部分总结,甚是有趣,小编复刻学习了一番,现对代码做简单注释,以作分享。
生信宝典
2019/08/01
4.1K0
是Excel的图,不!是R的图
R语言与机器学习(分类算法)朴素贝叶斯算法
前两个算法都被要求做出一个艰难的决定,给出数据所属分类的明确答案,但往往因为分类特征统计不足,或者分类特征选择有误导致了错误的分类结果,哪怕是训练集也有可能出现不能正确分类的情形。这时,前两种方法都如同现实生活一样是用“少数服从多数”的办法来做出决策。正如帕斯卡指出的:“少数服从多数未必是因为多数人更正义,而是多数人更加强力”,所以为了保证“少数人的权利”,我们要求分类器给出一个最优的猜测结果,同时给出猜测的概率估计值。 贝叶斯统计基础 在说朴素贝叶斯算法之前,还是要说说贝叶斯统计,关于贝叶斯统计,
机器学习AI算法工程
2018/03/12
2.1K0
R语言与机器学习(分类算法)朴素贝叶斯算法
使Twitter数据对百事可乐和可口可乐进行客户情感分析
可口可乐(Coca-Cola)和百事可乐(PepsiCo)是软饮料行业的知名品牌,两家公司均跻身《财富》500强。在竞争激烈的市场中拥有广泛产品线的公司彼此之间存在着激烈的竞争,并在随后的几乎所有垂直产品市场中不断争夺市场份额。
abs_zero
2021/03/19
6700
使Twitter数据对百事可乐和可口可乐进行客户情感分析
标准误差
标准误差是当前应用最广泛、最基本的一种随机误差的表示方法,当标准误差求得后,平均误差和极限差即可求得故国际上普遍采用标准误差作为实验结果质量的数字指标
为为为什么
2023/02/21
1.1K0
【R语言】R中的因子(factor)
R中的因子用于存储不同类别的数据,可以用来对数据进行分组,例如人的性别有男和女两个类别,根据年龄可以将人分为未成年人和成年人,考试成绩可以分为优,良,中,差。
生信交流平台
2022/09/21
3.4K0
【R语言】R中的因子(factor)
R语言异方差回归模型建模:用误差方差解释异方差
在社会科学中将OLS估计应用于回归模型时,其中的一个假设是同方差,我更喜欢常误差方差。这意味着误差方差没有系统的模式,这意味着该模型在所有预测级别上都同样差。
拓端
2020/08/14
1.6K0
origin带误差线的柱状图_怎么加误差棒
软件版本:OriginPro 2021b (64-bit) SR2 9.8.5.212 (学习版) 本期目标:
全栈程序员站长
2022/11/11
6.6K0
origin带误差线的柱状图_怎么加误差棒
什么是好的R包
我发现写作这个事情也非常遵循楞次定律,上学期一旦开始了越写越停不下来,但是过春节停一段时间后,越不写越难以重新开始。整理了不少东西可以写作,但是每次都被懒癌打败,不知不觉又一个多月没更了。
Listenlii-生物信息知识分享
2020/05/29
1.2K0
mse均方误差例题_误差函数计算器
本人最近需要写多个仿真,需要大量用到MSE(均方误差)计算,于是干脆将MSE运算封装为函数,后续使用直接进行调用即可。
全栈程序员站长
2022/11/19
9570

相似问题

R中的tm_map错误消息

10

回转R误差:系统是计算奇异的

10

在R中使用tm_map(testfile,removeNumbers)中的过滤器?

11

R中的舍入误差?

30

R中的捕获误差

24
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档