首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >基于CSV的R读入数据子集

基于CSV的R读入数据子集
EN

Stack Overflow用户
提问于 2021-03-03 18:34:50
回答 1查看 161关注 0票数 0

假设您有一个包含1000个变量的.DTA或.SAV文件。这个文件被称为“总数据”,您也有一个名为“SOME”的.CSV文件,其中包含一个名为“保存”的列;在“保存”列中是来自“总数据”的25个变量的名称。

在R中是否有一种在.DTA或.SAV文件中读取的方法;如果是“总数据”,则是保留列中变量的子集?

EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2021-03-03 19:46:55

如果文件是.sav,则可以使用来自havenread_sav。它还具有参数col_select,它可以接受列名的向量。来自?read_sav的文档显示

col_select -一个或多个选择表达式,如dplyr::col_select()。使用c()或list()可以使用多个表达式。有关可用选择选项的详细信息,请参见?dplyr::select。将只从data_file读取指定的列。

其策略是读取.csv文件,将“保存”列解压缩为vector,并输入“read_sav`的col_select

代码语言:javascript
运行
复制
library(readr)
library(haven)
library(dplyr)
cols_to_select <- read_csv("SOME-DATA.csv") %>%
                     pull(KEEP)

df1 <- read_sav("TOTAL-DATA.sav", col_select = cols_to_select)

注意:如果它是一个.dta文件,请使用来自havenread_dta。它还具有相同的col_select参数

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/66462898

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档