gtsummary
是一个用于创建统计表格的 R 包。它提供了多种表格类型,包括描述性统计表、汇总表、生存分析表等。交叉表(Cross Table)是其中一种类型,用于展示两个或多个分类变量之间的关系。
gtsummary
提供了丰富的选项来自定义表格的外观和内容。broom
、gt
等)结合使用,扩展功能。交叉表主要分为以下几种类型:
交叉表常用于以下场景:
NA
?原因:通常是因为某些类别组合在数据集中不存在,导致无法计算相应的统计量。
解决方法:
fill
参数来填充缺失值,例如:library(gtsummary)
# 示例数据
data <- data.frame(
category1 = c("A", "B", "A", "C"),
category2 = c("X", "Y", "X", "Z"),
value = c(10, 20, 30, 40)
)
# 创建交叉表
tab <- tbl_cross(tab_data = data, row = category1, col = category2, fill = list(value = "mean"))
# 打印表格
print(tab)
解决方法:
gtsummary
提供了多种选项来自定义表格的外观,例如:
label
参数来设置变量的标签。fmt
参数来设置数值格式。digits
参数来设置小数位数。# 自定义交叉表外观
tab <- tbl_cross(
tab_data = data,
row = category1,
col = category2,
label = list(category1 = "Category 1", category2 = "Category 2"),
fmt = list(value = "%.1f")
)
# 打印表格
print(tab)
通过以上内容,您可以全面了解 gtsummary
中交叉表的基础概念、优势、类型、应用场景以及常见问题的解决方法。
腾讯云数据湖专题直播
腾讯云数据湖专题直播
云+社区技术沙龙[第17期]
云+社区沙龙online[数据工匠]
T-Day
云+社区沙龙online第6期[开源之道]
企业创新在线学堂
《民航智见》线上会议
《民航智见》线上会议
领取专属 10元无门槛券
手把手带您无忧上云