我的问题与戴维斯和陈(2006)的文章有关,在这个问题中,我们看到了一种方法来可视化Kendall's关于两个变量之间的非参数相关性的τ度量。
给定散点图中的多个数据点,每个点通过一个线段连接到所有其他点。一条线段可以有不同的颜色,如下所示:
下面是原始文章中的一个示例:

我的问题是,我可以生成一个散点图,但不是连接所有可能的对点的线段,根据上述标准改变颜色。
下面是dataset的一个示例:
dataset <- dplyr::tibble(alpha = c(1, 5, 7, 8, 9, 10, 11, 12),
beta = c(7, 7, 5, 4, 3, 14, 15, 18))我可以生成这样的信息:
ggplot2::ggplot(dataset, aes(x = alpha, y = beta)) + geom_point()

但不是这个:

请注意。该解决方案必须可用于具有大量数据点(~1000)的数据集。
发布于 2020-02-25 20:43:58
有很多种方法,但是您需要构建自己的片段data.frame。例如。
library(tidyverse)
pd <- dataset %>%
mutate(d = map(row_number(), function(x) slice(., -x) %>% rename(x = alpha, y = beta))) %>%
unnest(d) %>%
mutate(
slope = (y - beta) / (x - alpha),
cat = case_when(
is.infinite(slope) | slope > 0 ~ 'a',
slope < 0 ~ 'b',
slope == 0 ~ 'c'
)
)
ggplot() +
geom_segment(aes(alpha, xend = x, beta, yend = y, color = cat), pd) +
geom_point(aes(alpha, beta), dataset) +
scale_color_manual(values = c(a = 'black', b = 'red', c = 'blue'))

https://stackoverflow.com/questions/60397153
复制相似问题