我不确定是否有人能帮上忙,或者即使我能很好地解释它,但我被困在这里。
我有一套客户,有的是走失的,有的还是活跃的。我们有一个模型,它可以查看数据,并为它们丢失的原因分配理由。其中一个原因是,如果他们不使用我们的软件导致他们丢失-我们有软件自动化他们的订单,但他们可以忽略这一点,并手工处理订单。
我创建了两个变量:软件使用率和软件使用率相对于他们国家的平均水平(作为比率)。
我的目的是确定这两种方法中的一种或两种,这基本上是说软件是一个问题的门槛/标志。我被困住了,因为在本质上没有结果-我们知道如果一个客户失去了,但我们只能猜测/模型的原因。
到目前为止,我所做的就是手动查看丢失和活动的分布。
任何帮助都会很好。
谢谢
发布于 2018-02-07 10:54:11
您可以使用两个样本$t$-测试来确定对于丢失的用户来说,软件的使用率是否显着降低。
将“软件使用率”/“相对于国家平均水平的软件使用率”与“失去用户的百分比”相提并论,可能会给你一个合适的门槛。
https://datascience.stackexchange.com/questions/27550
复制相似问题