这些问题都集中在了对分析过程中的某一关键点进行描述,这一聚焦点可能是客户、一项交易、一个产品、一天的时间甚至是ZIP码。而对分析中每个单元的描述信息就隐藏在数组的特征中。对于欺诈识别这项业务,分析的关键点有时可能是应收账款,更多的时候也可能是交易案例。对于客户分析这项业务来说,分析的关键点通常情况下是客户本身,但有些时候也可能是一名访客(例如一名顾客可能会访问多次并在数据库中重复出现多次)。
值得注意的是这些问题的指标通常都会与结果中的某一项重要关键字段直接相关。这些问题通常情况下是由领域专家提出的(也可能是分析师,项目管理者或是问题解决者),目的是找到业务困难与数据之间的联系。在其他情况下,这些测算方法通常情况下是客户驱动的。
但是这些KPI或是报告能够切实的解决问题吗?这个问题的答案很可能是‘不’,即使通过修正后的结果也是一样。在这些形式中的报告中,你能够了解到正在发生的事情,甚至了解到这些事件发生的原因。但是这并没有指出问题的关键,不过你可以通过结果进行预测。例如,你可以通过对每个ZIP应答率的总结报告作为下一次应答率的预测指标。
如果你想得到与目标变量相关的报告,例如客户应答率的相关报告,可能实现的机器学习方法或许是建立一个决策树,基于一个单一的条件对结果进行预测。但是这个模型可能会过于简单而难以充实。
领取专属 10元无门槛券
私享最新 技术干货