如何将所有因子变量转换为数值变量(同时在多个数据框中)？

将所有因子变量转换为数值变量可以通过以下步骤实现：

确定需要转换的因子变量：首先，确定需要转换的因子变量，这些变量通常是具有离散取值的变量，例如性别、地区等。
将因子变量转换为数值变量：使用编程语言中的函数或方法，将因子变量转换为数值变量。具体的转换方法取决于所使用的编程语言和工具。
处理多个数据框：如果需要在多个数据框中进行转换，可以使用循环或迭代的方式，逐个处理每个数据框中的因子变量。
确保数据一致性：在进行转换之前，确保所有数据框中的因子变量具有相同的取值范围和含义，以确保转换后的数值变量在不同数据框之间具有一致性。
验证转换结果：在完成转换后，对转换结果进行验证，确保数值变量的取值符合预期，并且在后续的数据分析和建模过程中能够正确使用。

腾讯云相关产品和产品介绍链接地址：

腾讯云云服务器（CVM）：提供弹性计算能力，支持多种操作系统和应用场景。详情请参考：https://cloud.tencent.com/product/cvm
腾讯云数据库（TencentDB）：提供多种数据库产品，包括关系型数据库、NoSQL数据库等。详情请参考：https://cloud.tencent.com/product/cdb
腾讯云人工智能（AI）：提供多种人工智能服务，包括图像识别、语音识别、自然语言处理等。详情请参考：https://cloud.tencent.com/product/ai
腾讯云物联网（IoT）：提供物联网平台和解决方案，支持设备接入、数据管理和应用开发。详情请参考：https://cloud.tencent.com/product/iot
腾讯云移动开发（Mobile）：提供移动应用开发和运营的云服务，包括移动推送、移动分析等。详情请参考：https://cloud.tencent.com/product/mobile

为什么函数引导返回不同类型的值，而不是从引导中使用的统计数据返回值？

、、、

我正在运行套袋树()分类方法，并将这个错误分类错误率与单个树的错误率进行比较。这对我来说很奇怪，因为函数estim.pred返回一个映射到"pos“和"neg”的因子矩阵，但是res.boot$t返回一个整数矩阵，其值为1或2，其中estim.pred是res.boot$t的统计量。请你解释一下造成这种现象的原因好吗？ library(rpart) library(boot) library(mlbench) data(PimaIndiansDiabetes) n <- 768 ntrain <- 468 ntest <- 300 B <- 100

浏览 1提问于2020-03-06得票数 0

回答已采纳

1回答

pandas数据帧行使用sklearn进行缩放

、、、

如何将sklearn缩放器应用于pandas数据帧的所有行。这个问题与相关。如何将sklearn缩放器应用于一行的所有值？注意:我知道对于特性缩放来说，在列中包含特性和按列缩放特性是很正常的，就像refenced问题中那样。然而，我想使用sklearn标度器来预处理可视化数据，在我的例子中，按行扩展是合理的。

浏览 11提问于2019-11-13得票数 1

回答已采纳

2回答

默认情况下，tapply是否排除了为分段传递的变量上的NA？

、

我有一个数据框(a)，其中有两列：total_amount和Gender。我需要计算一下男性和女性的消费总额。在性别栏中，也有NA。在运行以下命令时 tapply(a$total_amount,a$Gender, sum) 结果是： F M 23623513 24935632 我的问题是:默认情况下，tapply是否删除了为分类选择的片段列中的缺失值，即本例中的性别？如果是，那么我们如何将它们包含在我们的结果中？

浏览 1提问于2018-07-23得票数 1

1回答

Tukey HSD用于混合的连续变量和分类变量，错误：“无因素”

、、、

我正在尝试对死亡率数据进行Tukey检验，我想测试死亡率是否受到铜含量(单向方差分析)以及铜和温度的组合(双向方差分析)的影响。以下是我的公式： lm2<-lm(Mortality~Cu) anova(lm2) TukeyHSD(aov(Mortality~Cu)) lm2<-lm(Mortality~Cu+Temp+Cu:Temp) anova(lm2) TukeyHSD(aov(Mortality~Cu+Temp+Cu:Temp)) 方差分析没有问题，但是对于两个Tukey，我得到了以下错误消息： Error in TukeyHSD.aov(aov(Mor

浏览 1提问于2014-05-09得票数 4

3回答

如何将factor的数据帧转换为数字？

我有一个包含所有因子值的数据框 V1 V2 V3 a b c c b a c b c b b a 如何将数据框中的所有值转换为包含数值的新值(a到1，b到2，c到3，等等)

浏览 2提问于2016-01-01得票数 9

3回答

bind_rows_(x，.id)中的错误:列不能从因子转换为数字

、、、

我使用xlsx库从Excel文件中读取了10个数据集，并将其存储在tibbles中。我想把他们合并。下面是示例数据集。不同数据集之间的变量数不同，某些变量仅位于一个数据集中。person变量的值永远不会重叠。 data1 <- tibble(person = c("A","B","C"), test1 = as.factor(c(1,4,5)), test2 = c(14,25,10), test3 = c(12.5,16.0,4), test4 = c(16,23,21), test5 = as

浏览 2提问于2017-10-17得票数 13

回答已采纳

1回答

面板数据的相关矩阵

、、、

我想为我的面板日期集创建一个相关矩阵。我的数据集的结构如下，我有以下8年的公司数据: LEV、DOI、INDU、GROWTH、SIZE、ROE、AGE：因此，我的输入文件如下所示 company ----year -----LEV-----DOI x-----------1 ---------6 -----10 x-----------2 ---------6 -----10 y-----------1 ---------6 -----10 y-----------2 ---------6 -----10 现在我想为变量的数据集创建一个相关矩阵，它应该如下所示： ---LEV----

浏览 3提问于2017-12-19得票数 0

1回答

关于R中的食谱包

、

您好，我正在机器学习模型中使用功能工程的食谱。然而，当我使用step_dummy时，伪变量被视为数值变量，而不是因子。我认为当我们使用随机森林或其他树模型时，这可能是有问题的。我们如何才能改变这一点呢？PDP显示虚拟预测器被视为数值。所以X轴有0.25，0.5......这应该只有0和1(因为是虚拟的)。 library(modeldata) library(recipes) library(caret) library(ranger) library(ggplot2) library(pdp) data(okc) okc <- okc[complete.cases(okc),] r

浏览 7提问于2020-02-29得票数 1

2回答

分类任务中的所有二进制预测器

、、、、

我正在使用R执行分析，我将实现四种算法。 1. RF 2. Log Reg 3. SVM 4. LDA 我有50个预测器和1个目标变量。我所有的预测器和目标变量都只是二进制数0和1。我有以下问题： Should I convert them all into factors? Converting them into factors, and applying RF algorithms give 100% accuracy, I am very much surprised to see that as well. Also, for other algorithms, how shoul

浏览 0提问于2017-10-20得票数 1

1回答

R在FactoMineR错误消息中编程MCA()

、

我在R中使用FactoMineR包中的MCA()函数对一组大约160个变量和大约2000个观察值进行多重对应分析。大约150个变量是连续的，所以我首先使用cut()函数将这些连续变量转换为分类变量，然后使用MCA()函数。我的代码非常简单，如下所示： library(FactoMineR) data<-read.csv('demographics.csv') for (i in 9:length(data)){ temp<-unlist(data[i],use.names=FALSE) data[i]<-cut(temp,breaks=5

浏览 0提问于2015-11-04得票数 5

1回答

PCA之前的数据缩放:如何处理分类值？

、、、

我必须将PCA应用于包含数值和分类值的数据集上。在预处理阶段，我用数字转换了所有的分类值，这样软件就可以处理它们(基本上我创建了虚拟变量)。现在，为了应用PCA，我必须对数据矩阵进行缩放，使其平均值等于0。我的问题是:规范分类值(现在是数字，但它们实际上是绝对值)是否有意义？我想不是，但那样的话，我该怎么做呢？我做PCA而不缩放这些变量？谢谢!

浏览 0提问于2018-06-10得票数 3

1回答

用因素重塑

、

我正在尝试使用熔化和铸造过程重塑一个包含一个因子和一个数值变量的数据框。以下数据显示了我的问题： library(reshape) df <- as.data.frame(cbind(c(1,1,2,2,3,3),c(2000,2001,2001,2002,2000,2001),c(2,1,4,3,1,5))) names(df) <- c("Id","Year","Var") df$Fac <- interaction(c(1,1,1,0,0,0),c(0,0,0,1,1,1),drop=TRUE) MData &

浏览 0提问于2013-04-17得票数 1

回答已采纳

1回答

在读取文件和重新绑定文件时，sapply与lapply

、、、

我遵循Hadley的线程：来读取多个CSV文件，然后将它们转换为一个数据帧。我还像在上讨论的那样，对lapply和sapply进行了实验。这是我的第一个CSV文件： dput(File1) structure(list(First.Name = structure(c(1L, 2L, 1L, 1L, 1L), .Label = c("A", "C"), class = "factor"), Last.Name = structure(c(1L, 2L, 2L, 2L, 2L), .Label = c("B", "D&

浏览 0提问于2016-09-24得票数 1

17回答

如何将数据框列转换为数值型？

、、

如何将数据框列转换为数字类型？

浏览 4提问于2010-02-18得票数 292

回答已采纳

2回答

用不同的类连接两个数据集

我很难加入两个数据集 #df1 id name1 1 a 2 b 3 c 和 $df2 id name2 1 c 2 d 我试着通过他们的id加入他们 library(dplyr) result <- left_join(df1, df2, by="id") 它给出了以下错误错误:无法连接列'id‘x 'id'：由于类型不兼容(因子/整数)，无法连接'id’x 'id‘ 因为他们有不同的课程： sapply(df

浏览 1提问于2016-10-17得票数 0

回答已采纳

1回答

为什么VLC不能进入全屏模式？

、、

我正在开发一个Matlab应用程序，它使用VLC类来控制VLC-实例。其中一个特点是将VLC播放器设置为全屏。这个特性工作得非常好。 VLC播放器从Matlab的文件交换：下载(非常感谢Léa ) 然而，一个特定的剪辑坚持将播放器调整为更小尺寸的。我做了一些研究，结果发现这是一些VLC版本中常见的问题。通常的解决办法是取消选中“适应视频大小的界面”(类似于此)，而则选中“全屏”框。这应该使播放器在全屏幕打开，而不是调整屏幕大小为视频大小。视频仍然将播放器调整为较小的大小。所有剪辑的规格都是相同的:相同的文件扩展名(.vob)，格式和制作方式相同(我使用ffmpeg做了一些视频微调之类的操作

浏览 3提问于2017-05-30得票数 0

回答已采纳

5回答

KNN从范畴到数值的r-转换

、、、

我试图使用R的Caret包来使用应用于UCI机器学习中的“鲍鱼”数据库的KNN (链接到)。但是当有绝对值时，它不允许使用KNN。如何将分类值(在此数据库中为："M","F","I")分别转换为数值(如1,2,3 )？

浏览 6提问于2015-05-05得票数 1

回答已采纳

1回答

R中的xgboost()出错

、、

我正在尝试使用xgboost()，但收到以下错误： Error in xgb.DMatrix(data, label = label) : can not open file "0" If I traceback, traceback() 4: .Call("XGDMatrixCreateFromFile_R", data, as.integer(FALSE), PACKAGE = "xgboost") 3: xgb.DMatrix(data, label = label) 2: xgb.get.DMatrix(data, label) 1:

浏览 4提问于2015-05-29得票数 3

2回答

什么时候或为什么要将数值变量转换为factor？

、、

我在R方面还是个新手，有点自学。我有一个包含43个变量的数据集，我想预测其中一个主题。有些是数值变量，有些是因子变量。问题是，我不知道什么时候应该把因子转换成数字，反之亦然。我在互联网上发现，如果变量总是在一个很小的范围内取整数值，你就不应该保持变量为数值型。(例如，如果值始终在1和7之间)。我的一个变量是"NSM“，它表示每天从午夜开始的秒数。这些值是整数和离散的(61200、61800、62400、63600、64200、65400、66000、66600、68400、69000、69600、70800、72000、72600、73200，等等，您可以观察到有一个600步长)。

浏览 0提问于2020-03-15得票数 0

1回答

用因子变量插值data.table中的数值变量

、、、、

我正在尝试对data.table dt的多个数值列进行插值。它可以用NA或na_locf之类的东西填充。在我的真实数据中，可能有不止一个因子列。以下是我的示例数据： dt <- structure(list(time = c(0, 0, 0, 0, 0, 0, 0.1, 0.1, 0.1, 0.1), a = structure(c(1L, NA, NA, 1L, 3L, 2L, NA, 1L, 2L, NA), .Label = c("0&

浏览 0提问于2020-12-13得票数 0

3回答

如何将数据转换为矩阵格式

我已经通过read.csv将原始数据(10000行，392列)导入R。我想知道如何将其转换为矩阵格式。非常感谢您的帮助！

浏览 1提问于2013-01-30得票数 6

1回答

随机林不生成err.rate

、、

我使用随机森林来分析一个包含21个变量的600行训练集。 # Construct Random Forest Model rfmodel <- randomForest(default ~ ., data = train.df, ntree = 500, mtry = 4, importance = TRUE, LocalImp = TRUE, rep

浏览 2提问于2016-12-09得票数 1

2回答

在R中将字符转换为无NA强制的数字

、、、、

我在R中工作，有一个带有数字向量的数据，dd_2006。当我第一次导入数据时，我需要从我的3个变量( SumOfCost、SumOfCases和SumOfUnits )中删除$s、小数点和一些空格。为此，我使用了str_replace_all。然而，一旦我使用了str_replace_all，向量就被转换为字符。所以我使用as.numeric(var)将向量转换为数字，但是在运行as.numeric代码之前，引入了NAs，尽管在运行as.numeric代码之前，这里没有NAs。 sum(is.na(dd_2006$SumOfCost)) [1] 0 sum(is.na(dd_2006$SumO

浏览 2提问于2013-07-11得票数 12

回答已采纳

1回答

如何在R中将分类因子级别更改为数值变量

我有一个具有195个级别的pid因子变量，我希望将其更改为每个唯一患者id的数值变量。有人能帮我吗?下面是我的数据；

浏览 0提问于2020-10-09得票数 0

1回答

R (stats)中用于集群的dist函数:我应该将我的ID变量放在row.names中吗？

、、、

我有一个数据框，其中包含一些数字列和一个字符ID列。当我将整个数据帧传递给dist函数时，它会计算距离矩阵，但当我删除ID列并将其传递给distance函数时，我得不到相同的结果。 1)为什么会有这种奇怪的行为？ 2)在R中如何处理集群中的"ID“列？我应该删除ID列，还是应该将它们放在row.names中。附言:我通常在tidyverse中使用碎石和工具。

浏览 38提问于2018-12-18得票数 0

回答已采纳

1回答

Logistic回归错误：‘X’为NULL，因此结果将是ans[test & ok]中的NULLError。

我对R不熟悉，我正在尝试运行一个logistic回归模型。我使用glm创建了一个交叉验证函数和一个常规模型。当我运行常规模型时，它工作得很好，但是当我尝试使用函数时，它会出错。我试过定义Y变量，但是这个错误 er_log=mycv.logistic(data = train_data, glmfit=payment~., yname="payment", K=3, seed=123) terms.formula中的错误(公式，数据=数据)：参数不是有效的模型我也尝试过使用glm模型，该模型最初在函数中工作，但这给了我一个不同的错误 glmfit1=glm(payment~.

浏览 0提问于2019-05-02得票数 0

1回答

下面的代码有什么问题？

、、

lm(公式= FinalData$lnm4 ~ FinalData$p + FinalData$y + FinalData$r) 在我运行这段代码后，根据我正在寻找的内容，它显示了许多毫无意义的数据： Call: lm(formula = FinalData$lnm4 ~ FinalData$p + FinalData$y + FinalData$r) Coefficients: (Intercept) FinalData$p10,63306356 9.54087 0.01583 FinalData

浏览 0提问于2020-01-30得票数 1

1回答

用动态变量从宽到长转置

我有一个广泛的数据集，每个月列为一列。我想将数据转换成一种长格式，但问题是我的列名在将来会发生变化。通过动态变量传递给transpose语句的转置的最佳方法是什么？例如： data have; input subject $ "Jan-10"n $ "Feb-10"n $ "Mar-10"n $; datalines; 1 12 18 22 2 13 19 23 ; run; data want; input subject month $ value; datalines; 1 Jan-10 12 1

浏览 2提问于2015-09-09得票数 1

回答已采纳

2回答

R数据帧的首选数据格式

、、

我正在用Python编写一段数据收集代码。我想生成一个数据帧文件，尽可能容易地导入到R中。我可以完全控制我的Python代码将生成的内容，并且我希望避免在R端进行不必要的数据处理，比如将列转换为因子/数值向量等。此外，如果可能的话，我希望尽可能容易地在R端导入数据，最好是调用一个带有单个文件名参数的函数。我应该如何将数据存储到文件中才能实现这一点？

浏览 0提问于2013-02-17得票数 2

5回答

编写单位转换程序的最简单方法

我的问题是语言无关性。我想写一个简单的单位转换程序。有转换类型，根据类型有单位。例如，如果我们使用Length作为转换类型，那么就会有Meter、Inch、Foot、千米、Mile等等。假设有两个下拉框-一个方向是从，另一个是到。每个下拉框下面都有一个文本框。简单地说，当我在左边选择“英寸”，在右边选择“英里”，并在任何一个文本框中键入任意数字时，我希望在另一个文本框中出现相同的数字。就像任何普通的单位转换app.Now一样，我对此感到非常困惑。用if...else写一段很长的代码是不是唯一的办法呢？你们这些专业人士会怎么做呢？

浏览 0提问于2012-02-13得票数 0

回答已采纳

1回答

数字数据帧列作为字符串的顺序不正确

、

我有一些医院的数据，从csv中读取。我试图通过用户定义的列col，然后按医院的名称订购数据，如下所示： col <- 'Hospital.30.Day.Death..Mortality..Rates.from.Pneumonia' hospitals.sorted <- hospitals[order(hospitals[,col], hospitals$Hospital.Name),] 但我想我遗漏了一些东西；它似乎像字符串一样对col排序： > hospitals.sorted ... # so far so good # ... 2749

浏览 1提问于2012-10-20得票数 10

回答已采纳

2回答

如何将因子变量转换为数值-使用R

、、、、

我还有另一个问题，希望能得到你的帮助。我已经在谷歌上搜索过了，问了一个朋友，并试图理解这个网站周围的类似问题，但我仍然无法理解…… 好的，这就是我的问题:我有一个涵盖1980-2012年数据的大型数据集。我使用read.spss函数将数据放入R rohdaten <-read.spss("C:\\Users\\xxxxxxx.sav", use.value.labels = TRUE, to.data.frame = TRUE, max.value.labels = Inf, trim.factor.names = FALSE, tri

浏览 1提问于2015-02-28得票数 1

回答已采纳

1回答

箱形图在RStudio中不能正确显示

、、

我在R中创建了箱形图，但是，它们显示不正确。我的数据基于Kaggle上的德国信用数据集。我的代码有两个不同的属性，试图被测试： data %>% ggplot(aes(x = Creditability, y = Purpose, fill = Creditability)) + geom_boxplot() + ggtitle("Creditability vs Purpose") data %>% ggplot(aes(x = Creditability, y = Account.Balance, fill = Creditability

浏览 0提问于2021-04-15得票数 0

1回答

用负数表示类在R中的GBM训练

、、、

我已经生成了一个巨大的火车文件~1GB，其中的地面真相是4个类{-1,0,1,2}之一。是的，我同意我可以用3而不是-1来做，但出于一些传统的原因，我使用了-1。我想在多项式分布模式下使用gbm。是否会造成一些负面的问题，还是我可以继续下去呢？

浏览 0提问于2014-01-04得票数 0

回答已采纳

1回答

model.frame.default中用于预测()的错误--“因子有新的级别”--用于Char变量

、

我有一个数据集，我把它分成测试/训练数据集。在这一分裂之后，我立即制作了一个物流模型，包括： logModel1 = glm(Y ~ . -var1 -var2 -var3, data=train, family=binomial) 如果我使用该模型对同一组火车进行预测，就不会有任何错误(当然，对我的模型来说，这不是一个超级有用的测试)。因此，我使用下面的代码来预测我的测试集： predictLog1 <- predict(logModel1, type="response", newdata=test) 但我得到了以下错误：错误在model.frame.defaul

浏览 1提问于2015-04-26得票数 4

回答已采纳

1回答

替换ggplot轴中的标签(不是手动的)

、

我有这个情节的数据： data.frame(id = factor(sample(1:103, 10000, replace=TRUE, prob = sample(1:9/10, 103, replace=TRUE)), levels = 1:103), year = factor(sample(1950:2019, 10000, replace=TRUE, prob=sample(1:9/10, 70, replace=TRUE)),

浏览 1提问于2019-11-13得票数 0

回答已采纳

2回答

将因子转换为整数

、、

我正在使用重塑包操作数据框。当使用melt函数时，它会分解我的值列，这是一个问题，因为这些值的子集是我希望能够对其执行操作的整数。有没有人知道一种方法可以把一个因子转换成一个整数？使用as.character()可以将其转换为正确的字符，但是我不能立即对其执行操作，而as.integer()或as.numeric()会将其转换为系统存储该因子的数字，这没有什么帮助。谢谢! 杰夫

浏览 0提问于2011-01-26得票数 64

回答已采纳

2回答

如何通过比较列中的字符串值在R中创建伪变量

我是R的新手，我想在R中创建一个虚拟变量，它根据数据集中某一列中的值决定为1或0。这些值类似于"51.1“、"47.9”、"75.4“、"89.4”等。我必须为大于55的值分配1，为小于55的值分配0。我知道这可以使用mutate和ifelse函数来完成，但是，我遇到了如何比较这些字符串值的问题。任何建议都将不胜感激。谢谢。

浏览 3提问于2017-02-09得票数 0

回答已采纳

1回答

如果值大于或小于值，则替换数据框中的值

我在R中处理数据帧时遇到了问题，这是R中最基本的事情，但我找不到最好的命令来做这类事情。虚拟示例 Var1 20 300 39 Var2 49 23 91 Var3 0 239 210 如果value小于10，如何将第二列中的value替换为10；或者，如果数据帧中的所有值大于200，如何将它们替换为100

浏览 0提问于2014-05-24得票数 5

回答已采纳

1回答

关于处理lm中的许多二进制自变量

、、、

用lm建立线性回归模型时，数据集约有20个自变量。我是否需要明确地将它们澄清为factor？如果有必要，我怎么能做到呢？一个一个地宣布是非常乏味的。

浏览 1提问于2014-11-08得票数 1

回答已采纳

1回答

R-绘制来自tapply输出的数据

、

我正在做一个R项目，我在一个数据框中有一些数据，我在这个数据框上使用了tapply()。 res <- tapply(NEI$Emissions, NEI$year, sum) 使用tapply会给出以下输出： 1999 2002 2005 2008 7332967 5635780 5454703 3464206 我想用x轴上的年份和y轴上的值来绘制tapply的结果。我已经尝试使用plot()函数来完成此操作： plot(tapply(NEI$Emissions, NEI$year, sum)) 但是，plot函数x轴上的值范围为1.0 - 4.0 (间隔为0

浏览 42提问于2020-06-15得票数 0

回答已采纳

2回答

如何将dataframe中的值转换为对象

、

对于我正在编写的函数，输出是一个数据帧。但是，如何将数据帧中某一列中的值赋给对象呢？例如，如果我有两个向量，它们被cbind到一个数据帧中 >numbers<-c(33, 44, 55, 66) >names<-c("A", "B", "C", "D") >MYdataframe<-data.frame(cbind(names, numbers)) 我会得到这个： >MYdataframe names numbers 1 A 33 2 B 44

浏览 0提问于2012-02-03得票数 0

2回答

如何对作业使用env值？

你好，我试图将env值传递给作业，为此，我使用了以下kubernetes模板： apiVersion: batch/v1 kind: Job metadata: name: socksdownloader spec: template: spec: containers: - name: socksdownloader image: socksdownloader:0.0.1 # env: # - name: REDIS_HOST # value: redis # - name:

浏览 3提问于2021-02-20得票数 3

回答已采纳

1回答

在R的randomForest包中，是否必须将因素显式地标记为因素？

、、、

或者，包装是否会意识到它们是不连续的，并将它们作为因素对待？我知道，对于分类来说，被分类的特征确实需要成为一个因素。但是预测功能呢？我在几个玩具数据集上运行过，根据分类特征是数字还是因素，我得到的结果略有不同，但是算法是随机的，所以我不知道结果中的差异是否有意义。谢谢!

浏览 1提问于2015-10-19得票数 4

回答已采纳

1回答

R: GLM模型和optim()包的估计参数不同

、、、

我想用R中的optim()包找到估计参数，并将我的结果与R中的GLM模型进行比较。代码是 d <- read.delim("http://dnett.github.io/S510/Disease.txt") d$disease=factor(d$disease) d$ses=factor(d$ses) d$sector=factor(d$sector) str(d) oreduced <- glm(disease~age+sector, family=binomial(link=logit), data=d) summary(oreduced) y<-a

浏览 18提问于2021-04-04得票数 1

2回答

在R中组合两段数据

、、、

我不确定如何最好地描述这一点，所以我将向您展示。我有两个变量。答： ID 1 121 2 122 3 123 4 124 5 125 6 126 7 127 8 128 9 129 和B： var1 var2 var3 1 57.1 116.5 73.0 2 38.1

浏览 2提问于2013-03-14得票数 0

回答已采纳

1回答

使用分组/切割列计算geom_boxplot IQR

、、、

我想使用geom_boxplot()在我的数据上显示IQR。如果我有一个按数据块计算stat分组变量，我需要用ddply预先计算一个包含所有数据(IQR等)的数据帧。对于每个数据块？或者，在geom_boxplot()自动显示统计信息之前，我可以使用一些group=指令强制计算所有统计信息吗？我的数据结构与此示例相同，用于统计计算的grouping/cutting变量为replication： dat <- read.table(textConnection("city population replication 1 1 2500 1 2 2 3000 1 3 3 120

浏览 0提问于2012-12-04得票数 0

回答已采纳

3回答

R将导入的Excel数值从R系数转换回数值

、、、

我正在尝试将一个由Excel创建的.csv文件读取到R中。我尝试了许多建议，但没有一个对我完全有效。下面是.csv文件中数据的外观，第一行是标题： recipe_type,State,Successes,Attempts paper,alabama ,586,3379 下面是用于导入.csv文件的R命令： options( StringsAsFactors=F ) results<-read.csv("recipe results.csv", header=TRUE, as.is=T) results$Successes [1] "586" 而成功则被

浏览 6提问于2013-06-08得票数 0

1回答