首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

应用rbinom时要在data.table .SD中应用的列特定参数

在使用rbinom函数时,如果要在data.table.SD中应用列特定参数,可以使用by参数来指定按照哪些列进行分组,并在每个分组中应用不同的参数。

.SD是一个特殊的变量,代表了当前分组的数据表。通过.SDcols参数可以指定在.SD中包含哪些列。在.SD中应用rbinom函数时,可以使用.SD中的列作为参数。

以下是一个示例代码:

代码语言:txt
复制
library(data.table)

# 创建一个示例数据表
dt <- data.table(
  group = c("A", "A", "B", "B"),
  n = c(10, 20, 30, 40),
  p = c(0.2, 0.5, 0.8, 0.3)
)

# 使用rbinom在.SD中应用列特定参数
dt[, result := rbinom(n, size = n, prob = p), by = group]

# 输出结果
print(dt)

在上述代码中,我们创建了一个包含groupnp列的数据表dt。然后,我们使用rbinom函数在.SD中应用列特定参数。通过by = group指定按照group列进行分组,并在每个分组中应用不同的参数。最后,将结果存储在新的result列中。

这是一个简单的示例,展示了如何在data.table .SD中应用列特定参数。根据具体的需求,可以根据不同的列和参数进行更复杂的操作。

推荐的腾讯云相关产品和产品介绍链接地址:

以上是对于应用rbinom时在data.table .SD中应用的列特定参数的完善且全面的答案。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

R语言数据分析利器data.table包 —— 数据框结构处理精讲

data.table为了加快速度,会直接在对象地址修改,因此如果需要就要在修改前copy,直接修改命令有:=添加一,set系列命令比如下面提到setattr,setnames,setorder等;...比如此例取出DT X 列为"a"行,和"a"进行merge。on参数第一必须是DT第一 DT[....n,.N(总数,直接在j输入.N取最后一),:=(直接在data.table上添加,没有copy过程,所以快,有需要的话注意备份),.SD输出子集,.SD[n]输出子集第n,DT[,...., by=x][order(x)] #和上面一样,采取data.table链接符合表达式 DT[v>1, sum(y), by=v] #对v进行分组后,取各组v>1行出来,各组分别对定义...SD就包括了页写选定特定,可以对这些子集应用函数处理 allow.cartesian FALSE防止结果超出nrow(x)+nrow(i)行,常常因为i中有重复而超出。

5.8K20

R语言学习笔记之——数据处理神器data.table

data.table索引 索引与数据框相比操作体验差异比较大,data.table索引摒弃了data.frame时代向量化参数,而使用list参数进行列索引。...注意以上新建,如果只有一,列名比较自由,写成字符串或者变量都可以,但是新建多,必须严格按照左侧列名为字符串向量,右侧为列表模式,当然你也可以使用第二种写法。...当整列和聚合单值同时输出,可以支持自动补齐操作。 当聚合函数与data.table分组参数一起使用时,data.table真正威力才逐渐显露。 mydata[,....以上语法加入了新参数.SDcols和.SD,咋一看摸不着头脑,其实是在按照carrier,origin,dest三个维度分组基础上,对每个子块特定进行均值运算。...SD, mean)则将各个子块对应列应用于均值运算,并返回最终列表。

3.6K80
  • R︱高效数据操作——data.table包(实战心得、dplyr对比、key灵活用法、数据合并)

    %>%功能是用于实现将一个函数输出传递给下一个函数第一个参数。注意这里,传递给下一个函数第一个参数,然后就不用写第一个参数了。在dplyr分组求和过程,还是挺有用。...返回匹配到键值所在(V2)所有行第一行 > DT["A", mult ="first"] V1 V2 V3 V4 1: 1 A -1.1727 1 2、nomatch参数——未匹配样本处理...22 2: B -1.2727 26 3: C -1.2727 30 .SD是一个data.table,他包含了各个分组,除了by变量所有元素。....SD只能在位置j中使用。 .SDcols常于.SD用在一起,他可以指定.SD中所包含,也就是对.SD取子集。...2016-11-28补充: 留言区大神给了一个比较好选中方式,其中主要就是对with使用: data.table,可以用data[,1,with=FALSE]取data第一

    8.3K43

    data.table语句批量处理变量

    问 题:批量处理表变量 正式开始说问题之前,我们先回顾一下data.table基本语句DT[i, j, by],简而言之,"i"是对行进行选择,"j"是对进行操作,"by"是分组。...我们现在要对进行操作(转换类型),因此本期是关于“j”内容。 下面正式开始,笔者在帮他人处理数据遇到了需要同时为一系列变量进行相同处理,先来看数据结构: ?...批 量处理法:用lapply批量处理变量 在此时lapply妙用就显现出来了,在Rlapply用来对list每一个element进行相同处理,如何把它运用到data.table,话不多说先上代码:...我们知道在data.table,.SD是经过i和by处理之后剩下那部分数据集,它格式是一个data.table,同时它是一个list。...而我们要处理变量是第3个到第34个,所以在.SD中选出3至34,运用lapply对选中.SD[, 3:34]里面每一个element使用as.Date函数。 再看,':='左边。

    1.2K30

    R语言:data.table语句批量生成变量

    写在前面 本期依然由村长为大家供稿,只为填上一期最后挖坑,话不多说进入正题。 问题提出 在上一期,还记得我们留下那个彩蛋吗?...我们在对多标准进行筛选,在之前我们还进行了一步非常重要提取,也就是将每一观察值提取出某一特定字段,而后生成一系列变量,这些变量观测值只可能存在三种情况:醛固酮、继发性醛固酮或者NA。...经过这样处理我们才能进行上一期公众号所讲述下一步:以多标准进行筛选操作。...在这里通过链接推送lapply使用原理,再加上stringr包str_match这个函数使用,截取出诊断结果中出现过继发性醛固酮或者醛固酮,没有出现过自动记为NA。...代码如下: lapply(.SD[, 2:23], str_match, "继发性醛固酮|醛固酮") := 左边 我们可以再回顾一下,上文链接中用data.table语句批量处理变量推送中所提到

    1.2K20

    怎么在R语言中模拟出特定分布数据

    前面介绍过,通过readr、readxl两个包可以将文件数据读入为数据框。...其实,我们还可以在 R 里直接模拟出符合特定分布数据,R 提取了一些以“r”开头函数来实现,常见有下面这 4 个: rnorm,生成服从正态分布随机数 runif,生成均匀分布随机数 rbinom...,生成服从二项分布随机数 rpois,生成服从泊松分布随机数 例如: r1 = rnorm(n = 1000, mean = 0, sd = 1) r2 = runif(n = 1000, min...= 0, max = 100) r3 = rbinom(n = 1000, size = 100, prob = 0.1) r4 = rpois(n = 1000, lambda = 1) 正态分布...hist(r1) 均匀分布 hist(r2) 二项分布 hist(r3) 泊松分布 hist(r4) 写在最后 模拟数据有些时候是非常很有用,特别是在学习统计作图

    88320

    懒癌必备-dplyr和data.table让你数据分析事半功倍

    找到合适packages并学习使用它,绝对会让我们数据分析工作事半功倍! 我们有没有发现dylyr包函数使用一些规律? 有的!...①第一个参数都是数据集df ②查询条件都是关于如何操作数据集,在列上面进行操作 ③返回都是新数据集,不会改变原始数据集 在介绍下一个包之前,我们先来引入一个dplyr包综合运用: grouped...(sum(v1),sd(v3))] data.table居然支持直接在j上进行列计算,看到这里是不是觉得超牛逼,关键是代码非常简洁,一句话事,就帮我们完成数据筛选和计算了! DT[,....(sum_v1=sum(v1),sd_v3=sd(v3))] 还可以直接给计算赋予名称哦!!功能强大得我都要笑开花了! 使用by 这还只是小试牛刀,你忘了我们还有个by吗!! DT[,....以上讲这些只是我工作data.table用得最多功能,它强大之处还远远不止这些!如果你想深入,可以去官网下载文档,你绝对值得拥有!

    2.4K70

    ROC曲线不用愁,四种R包教你一步搞定!

    ROC曲线也可以被认为是决策规则Type I Error 函数(当性能仅从总体一个样本中计算,它可以被认为是这些量估计值)。因此ROC曲线是敏感度或召回率作为降噪函数。...③当预测结果与实际值均为n,是真阴性(TN)。④当预测结果为n而实际值为p,是假阴性(FN)。...#这对于在bootstrap操作避免对低pAUCs造成偏倚尤其有用 partial.auc.focus="se", partial.auc.correct=TRUE) (2)修改部分参数...D.ex <- rbinom(50, 1, .5) #rbinom生成一组二项分布随机数,参数为(生成随机数数量,进行随机试验次数,二项分布概率) rocdata <- data.frame(D =...(50, mean = D.ex, sd = 1)), #M是连续marker值或预测类标签 Z = c(rep("A", 50), rep("B", 50)) #z是分组参数

    8.3K10

    35行代码搞定事件研究法(下)

    注意 I,本代码主要使用data.table包完成,关于data.table相应知识会在涉及时候进行讲解。在以后课堂,我们会重点介绍data.table这个包。...用data.table包处理多个事件日 本期课堂核心代码只有下面5行(应用data.table语法): > car <- event[, { > ns <- which(event.flg...在上一讲,我们已经给出了函数 do_car() 用来求单个事件日超额收益,因此很自然,我们希望对于事件日向量 ns 每个元素,都应用一遍 do_car()这个函数。...在这里我们不妨先回忆一下上一讲do_car() 函数有哪些参数: do_car <- function(n, r, rm, date) { .... } 看到了没有?...do_car() 要求我们提供n, r, rm, date 四个参数,但是向量 ns 只能提供 n 这一个参数值,因此我们需要用pryr包partial() 函数把剩下几个变量补充完整(感谢pryr

    1.2K40

    R语言基因组数据分析可能会用到data.table函数整理

    因此,在对大数据处理上,使用data.table无疑具有极高效率。这里主要介绍在基因组数据分析可能会用到函数。...sep 之间分隔符; sep2 分隔符内再分隔分隔符,功能还没有应用; nrow 读取行数,默认-l全部,nrow=0仅仅返回列名; header 第一行是否是列名...; na.strings 对NA解释; file 文件路径,再确保没有执行shell命令很有用,也可以在input参数输入; stringsASFactors 是否转化字符串为因子...,当用file=="",自动忽略此参数; verbose 是否交互和报告时间 dcast.data.table 和reshape2包dcast一样, 这个函数用来重铸表格,并且再在大数据处理上...,当是TRUE,如果mult=“all”,返回两,一x号,一相对应y,如果nomatch=NA,不匹配返回yNA,如果nomatch=0,则跳过该,设置mult="first“,mult

    3.4K10

    data.table包使用应该注意一些细节

    ,文件也可以读入,建议不加分隔符 fread可以自动检测注释,并且跳过注释行   默认skip=0,会跳过不规则行,因此有注释行时,可以走默认skip参数 转换成矩阵可以保留某一为rowname...  as.matrix作用于data.table时会调用as.matrix.data.table,有一个rownames参数可以指定保留为行名 矩阵转换成data.table可以保留列名   在...as.data.table函数同样有一个rownames参数,设置为T可以将行名保留下来作为data.table 不建议set和for循环一起使用   虽然set可以在内存上直接改变数值,但在R...0.6就不等于0.6, 虽然很费解,但这是因为计算机在存储浮点数出现一些问题。...  类似于集合运算,data.tablefintersect, fsetdiff, funion,fsetequal函数能对不同数据框行求交集,差集,并集等 可以直接对按分隔符进行分割   应用

    1.5K10

    Matt Dowle 演讲节选(二)

    相比之下,markdown不仅对于代码有着先天支持,而且只要在第一次设定好css,以后每次编辑时间几乎为零,直接复制粘贴到公众号平台就可以渲染出非常漂亮网页,简直美滋滋!...Matt 是这样想:在data.frame,如果我们想要选择region这个变量为特定关泽,那么代码就会是下面这样: > DF[DF$region == "US", sum(population...)] 这就相当于默认开启了data.framewith参数。...在这个2012年(注意dplyr最早版本在2016年!)帖子,一个用户需要处理以下数据集(这里只显示前6行) ? 他想首先按照gene_id分组,然后分别计算特定变量极值和均值。...True,时间是缩短不少,但那意味着许多枯燥输入。假设你有100,难道你要每class都指定一遍? 这时你就需要fread("test.csv")!不需要输入任何其他参数,你猜要运行多久?

    1.1K40

    深入对比数据科学工具箱:Python和R之争

    当我们需要更多复杂统计分析和数据处理,我们就需要转移到 Python和R上。在确定工程实施和大数据集操作,我们就需要依赖Scala 静态类型等工程方法构建完整数据分析系统。...应用R场景 统计分析: 尽管 Python 里 Scipy、Pandas、statsmodels 提供了一系列统计工具 ,R 本身是专门为统计分析应用建立,所以拥有更多此类工具。...参数传递 数据读取 基本数据结构对照 矩阵转化 矩阵计算 数据操作 参数传递 Python/R都可以通过命令行方式和其他语言做交互,通过命令行而不是直接调用某个类或方法可以更好地降低耦合性,在提高团队协作效率...绘制聚类效果图 这里以K-means为例,为了方便聚类,我们将非数值型或者有确实数据排除在外。...下面是R data.table、dplyr 与 Python pandas 数据操作性能对比: image.png 我曾经用data.table和pandas分别读取过一个600万行IOT

    1K40

    5个例子比较Python Pandas 和R data.table

    data.table) melb <- fread("datasets/melb_data.csv") 示例1 第一个示例是关于基于数据集中现有创建新。...这两个库都允许在一个操作应用多个聚合。我们还可以按升序或降序对结果进行排序。...我们使用计数函数来获得每组房屋数量。”。N”可作为data.tablecount函数。 默认情况下,这两个库都按升序对结果排序。排序规则在pandasascending参数控制。...data.table中使用减号获得降序结果。 示例5 在最后一个示例,我们将看到如何更改列名。例如,我们可以更改类型和距离名称。...inplace参数用于将结果保存在原始数据帧。 对于data.table,我们使用setnames函数。它使用三个参数,分别是表名,要更改列名和新列名。

    3.1K30
    领券