首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

R: data.table条件和删除列"NA“

R中的data.table是一个高效的数据处理工具,可以用于数据的筛选、聚合和转换等操作。下面是对于data.table条件和删除列"NA"的回答:

条件筛选: 要在data.table中按照条件筛选数据,可以使用[ ]操作符。可以通过指定条件在方括号中进行数据筛选。例如,要筛选出某一列中值为特定值的行,可以使用以下语法:

代码语言:txt
复制
dt[列名 == 值]

如果要根据多个条件进行筛选,可以使用逻辑运算符(如&|)组合条件。例如,要筛选出某一列中值大于10且小于20的行,可以使用以下语法:

代码语言:txt
复制
dt[列名 > 10 & 列名 < 20]

删除列中的"NA": 要删除data.table中某列中的"NA"值,可以使用is.na()函数结合条件筛选和赋值操作来实现。以下是一个示例:

代码语言:txt
复制
dt[is.na(列名)] <- NULL

上述代码会删除data.table中某列中的"NA"值所在的行。

需要注意的是,上述示例中的"列名"需要替换为实际的列名。

希望以上回答对您有帮助。如果您还有其他问题,请随时提问。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • R」数据操作(三):高效的data.table

    接「R」数据操作(一)R」数据操作(二) 使用data.table包操作数据 data.table包提供了一个加强版的data.frame,它运行效率极高,而且能够处理适合内存的大数据集,它使用[]...首先,我们仍然载入之前用到的产品数据,不过这里我们使用data.table包提供的fread()函数,它非常高效智能,默认返回data.table。.../R/dataset/product-toy-tests.csv") 如果查看表格信息,你会发现它data.frame没什么两样: product_info #> id name...重塑data.table data.table扩展包为data.table对象提供了更强更快得dcast()melt()函数。...的动态作用域 我们不仅可以直接使用,也可以提前定义注入.N、.I.SD来指代数据中的重要部分。

    6.3K20

    R语言数据分析利器data.table包 —— 数据框结构处理精讲

    版权声明:本文为博主原创文章,转载请注明出处     R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快。...可见它是属于data.tabledata.frame类,并且取,维数,都可以采用data.frame的方法。...将一个R对象转化为data.tableR可以时矢量,列表,data.frame等,keep.rownames决定是否保留行名或者列表名,默认FALSE,如果TRUE,将行名存在"rn"行中,keep.rownames...的一,写出去时list成员间以sep2分隔,它们是处于一之内,然后内部再用字符分开; eol,行分隔符,默认Windows是"\r\n",其它的是"\n"; na,na值的表示,默认""; dec...参考文献 data.table包manual:https://cran.r-project.org/web/packages/data.table/data.table.pdf

    5.9K20

    R语言基因组数据分析可能会用到的data.table函数整理

    版权声明:本文为博主原创文章,转载请注明出处 R语言data.table包是自带包data.frame的升级版,用于数据框格式数据的处理,最大的特点快。...; sep2 对于是list的一,写出去时list成员间以sep2分隔,它们是处于一之内,然后内部再用字符分开; eol 行分隔符,默认Windows是"\r\n",其它的是"\n"...默认nomatch=NA,无匹配返回NA,也可以设置为0,0不返回该行; which 默认FALSE结果返回xy行的联合,当是TRUE时,如果mult=“all”,返回两,一...x号,一相对应的y,如果nomatch=NA,不匹配的返回y的NA,如果nomatch=0,则跳过该,设置mult="first“,mult=”last"则最后返回x一样的行数; verbose...manual: https://cran.r-project.org/web/packages/data.table/data.table.pdf

    3.4K10

    5个例子比较Python Pandas R data.table

    PythonR是数据科学生态系统中的两种主要语言。它们都提供了丰富的功能选择并且能够加速改进数据科学工作流程。...在这篇文章中,我们将比较Pandas data.table,这两个库是PythonR最长用的数据分析包。我们不会说那个一个更好,我们这里的重点是演示这两个库如何为数据处理提供高效灵活的方法。...data.table) melb <- fread("datasets/melb_data.csv") 示例1 第一个示例是关于基于数据集中的现有创建新。...例如,我们可以更改类型距离的名称。 类型:HouseType 距离:DistanceCBD 数据集中的distance列表示到中央商务区(CBD)的距离,因此最好在列名中提供该信息。...对于data.table,我们使用setnames函数。它使用三个参数,分别是表名,要更改的列名新列名。 总结 我们比较了pandasdata.table在数据分析操作过程中常见的5个示例。

    3.1K30

    能不能让R按行处理数据?

    事实上,这些问题也就是你在“看懂一本R的教材”“成为R大神”之间的距离。大猫除了进行翻译,也会在其中增加一些相关知识点,相信掌握了这些问题,一定会对你的研究工作大有裨益。 1....这些问题大多数涉及到用data.table包处理数据。data.table是目前R中人气最高的数据处理包。 2....如果要自己寻找Stackoverflow上与R或是data.table相关的问题,可以在搜索栏输入[R] [data.table] Your question。 提 出问题 好啦,开始上课!...eddi大神的意思是,原来inti_total_assetissuing_scale是两个变量,现在要把他们stack起来,“堆成”一,也就是这样: ?...对,这个步骤castmelt函数的作用类似,只不过这里直接用了data.table自己的语句。

    1.4K20

    Excel的SNP数据如何变为plink格式

    这个一般是mapped数据不匹配,可以通过R中的mapmap查看一下什么情况: > dim(map) [1] 43251 4 > dim(ped) [1] 185 43257 可以看到...再看一下map的前几行后几行: 可以看到map最后几行是错误的,原始的xlsx文件有问题。...常见问题3:indel位点 plink格式不支持indel位点,需要将indel位点删除。 当然,如果有几万个snp,就不方便处理了。...思路: 将其读取到R中 转置 保存到本地 然后通过grep,去掉相关的行 然后再读到R中,再进行处理。 报错总结 数据有空行,有缺失,有indel。...更新的代码中,判断是否有空行,将NN作为缺失读取到R中,可以避免上面的情况,更新后的代码如下: library(openxlsx) library(tidyverse) library(data.table

    1.7K10

    R语言专题3-条件循环

    专题3.条件循环1.条件语句-if(){}1.1 只有if# if()里的内容一定得是逻辑值,可以是你写上的TF,也可以是运算结果# 若运算结果为T或者你写上了T,他就会执行后续语句,反之则不执行#...0.1171687 -0.1286477 0.3504566ifelse(x>0,'+','-')## [1] "+" "-" "+"# 与字符检测函数str_detect()进行连用,用之前别忘记加载R包...tumor'ifelse(k1,"normal","tumor")## [1] "tumor" "tumor" "tumor" "normal" "normal" "normal"1.4 多个条件...ifelse写i = 0ifelse(i>0,"+",ifelse(i<0,"-","0")) # 简单的嵌套结构,大家可以先从看懂模仿开始## [1] "0"补充:case_when()# 用之前先加载R包...# 看下输出结果大家就应该知道啥意思了}## [1] 1## [1] 2## [1] 3## [1] 4# 循环画图-以内置数据iris为例par(mfrow = c(2,2)) # 将画板变成两行两

    23130

    data.table包不讲武德,欺负老实人

    有两种解决方法: 1,将的类型变为一致,比如你的数字要赋值为字符,那就先把数字变为字符,再赋值 2,可以将赋值的字符的行被赋值的行一样,这样也不会报错 1....- attr(*, ".internal.selfref")= 这里,x是数字,y是数字,z是字符。 2....,都说data.tabledata.frame差不多,但就是差这么一点点,学艺不精,bug满坑啊!!!」...解决方案1:将x先变为字符,再赋值 先把它转化为字符dfx = as.character(dfx),然后再赋值 df = data.table(x = 1:10,y = rnorm(10),z = paste0...把赋值的行被赋值的一致 将被赋值的行,弄成一样长度的df$x = rep("a1",dim(df)[1]) df = data.table(x = 1:10,y = rnorm(10),z = paste0

    89850

    笔记 GWAS 操作流程6-2:手动计算GWAS分析中的GLMLogistic模型

    名词解释 「GWAS」 ❝全基因组关联分析 ❞ 「手动计算」 ❝使用R语言编程GLM模型Logistic模型,提取EffectPvalue ❞ 「GLM」 ❝一般线性模型 ❞ 「Logistic」...FID # 家系ID 第二为IID # 个体ID 第三为表型值 # 表型数据 2.3 使用R中的lm函数做回归分析 1,首先载入软件包data.table 2,然后读取0-1-2编码的c.raw文件...3,然后读取表型数据文件phe.txt 4,然后将表型数据基因型数据合并 library(data.table) geno = fread("c.raw",header=T) phe = fread...2 第一为FID # 家系ID 第二为IID # 个体ID 第三为表型值 # 表型数据,默认是1-2编码(case-control) 3.3 使用R中的glm函数做Logistic回归分析 1,首先载入软件包...data.table 2,然后读取0-1-2编码的c.raw文件 3,然后读取表型数据文件phe.txt 4,然后将表型数据基因型数据合并 library(data.table) geno[1:10,1

    2.7K32

    《高效R语言编程》5-高效输入输出

    软件配置 几个包: install.packages(c("rio","readr","data.table","feather","WDI")) 关于数据I/O的高级技巧 R语言自己的文件格式是.Rds...:1)基础R的read.csv(),2)fread() 里data.table方法3)较新的readr包里read_csv()函数。...对于小于1M的数据,read.csv()比read_csv()要快,然而fread()比两个都快,如果是更大的数据,read_csv()data.table比read.csv()快5倍左右。...使用readr的话,会将违规数值转换成NA,而fread()会自动将它认为是数值的转化成字符,fread()另一特征是可以使用列名或索引来设置select参数,从而有选择的读取。...R自带的文件格式:RdsRdata save()为Rdata是应用最广泛的,函数功能类似save.img()save.imge()。

    1.5K20

    R语言:data.table语句批量生成变量

    我们在对多标准进行筛选时,在之前我们还进行了一步非常重要的提取,也就是将每一观察值提取出某一特定的字段,而后生成一系列变量,这些变量的观测值只可能存在三种情况:醛固酮、继发性醛固酮或者NA。...经过这样的处理我们才能进行上一期公众号所讲述的下一步:以多标准进行筛选的操作。...在这里通过链接中的推送的lapply使用原理,再加上stringr包中str_match这个函数的使用,截取出诊断结果中出现过的继发性醛固酮或者醛固酮,没有出现过的自动记为NA。...大猫的微信号是: iRoss2007 村长的B站主页是:http://space.bilibili.com/40771572 大猫的R语言课堂关注R语言、数据挖掘以及经济金融学。...我们与大家分享我们的知识节操,我相信独乐乐不如众乐乐。

    1.2K20

    Q&A:在meltdcast之间反复横跳

    Q&A:在meltdcast之间反复横跳 写在前面 各位水友大家好,自从上一次发布了改版的推文说明之后,大喵和村长收到了很多水友的问题,我们也对这些问题进行了回复,希望能对大家R语言的学习有所帮助,在此先谢谢各位的支持...:需要使得每个姓名id只存在一行记录,所有的记录横向排列,并且需要删除所有的含NA记录的项。...1片 1年 规律 黄舜 1 盐酸吡格酮(卡司平) 口服 2片qd 1年 规律 这一部分代码极为重要,首先利用rowMeans进行行筛选,为的是将原本就缺失的记录,以及在宽表到长表转换中生成的缺失记录进行删除...此外关于函数筛选的用法,这里不进行阐述,关于这内容的详细解读可参考R语言:以多标准筛选特定行。 此外对variable这个变量进行了更改。...长表宽表之间的相互转换,有时会在数据清洗中用到,对meltdcast两个函数的理解需要深入。

    66720
    领券