在R中对一列数据进行标准化并得到贝尔曲线直方图,以确定某个范围内的百分比,可以按照以下步骤进行:
library(ggplot2)
library(dplyr)
data <- data %>% mutate(column_standardized = scale(column))
这将在数据框中添加一个名为"column_standardized"的新列,其中包含标准化后的数据。
ggplot(data, aes(x = column_standardized)) +
geom_histogram(binwidth = 0.2, aes(y = ..density..)) +
geom_density(color = "red") +
labs(x = "Standardized Values", y = "Density") +
theme_minimal()
这将生成一个贝尔曲线直方图,其中x轴表示标准化后的值,y轴表示密度。
percentage <- data %>%
filter(column_standardized >= -1 & column_standardized <= 1) %>%
summarize(percentage = n() / nrow(data) * 100)
这将计算在指定范围内的数据所占的百分比,并将结果存储在"percentage"变量中。
完整的R代码如下:
library(ggplot2)
library(dplyr)
data <- data %>% mutate(column_standardized = scale(column))
ggplot(data, aes(x = column_standardized)) +
geom_histogram(binwidth = 0.2, aes(y = ..density..)) +
geom_density(color = "red") +
labs(x = "Standardized Values", y = "Density") +
theme_minimal()
percentage <- data %>%
filter(column_standardized >= -1 & column_standardized <= 1) %>%
summarize(percentage = n() / nrow(data) * 100)
腾讯云相关产品和产品介绍链接地址:
领取专属 10元无门槛券
手把手带您无忧上云