传统观点认为预测性分析师需要具备统计学、数学、计算机科学或是工程学的学术背景。如果能够在这些领域获得学位是最好的,但即使是没有相应的学位,那么至少应该学习过统计学或是数学相关的课程。在过去,还没有出现过预测性分析、数据挖掘或是机器学习的学位。
然而这一现象目前得到了改善,很多大学都增设了预测性分析的硕士学学位。除此之外,在传统分析师的课程中也发生了很多的变化,包括出现了数据挖掘、市场分析、商务分析或是机器学习的硕士学学位。有一些课程甚至还增加了实习环节以便于学生可以利用书本上的知识来解决现实世界中的问题。
在现实世界中有一个对于预测性模型应用至关重要的问题就是该模型具有非常多的限制。大多数在现实社会中存在着足量数据的问题并没有在教科书中被提及。而引导数据走向发生变化的原因也似乎没有尽头,这使得即使是同一领域中完全一样的获客模型也可能需要完全不同的数据准备、缺失值填补、特征创造甚至是本身的建模工作。不仅如此,进行数据处理的规则似乎也没有尽头,模型可能需要数年的时间的运转后,造模师或许才能够预测出还有多久就会有新的潜在性问题继续浮现出来。
对顶级预测性建模师的调查得到了一个复杂的结果,他们可能会拥有科学、统计学或是数学背景,但是很多人也没有。其中很多人具有社会科学及人口学背景,这是为什么呢?
举一个较为详尽的例子,零售商Target公司建立了一个预测性分析模型来判断顾客的购买行为与未来相似购买行为之间的联系。该公司的媒体和市场数据部资深经理Andrew Pole在2010年预测性分析大会上描述了公司是建立该模型的过程。Pole谈到了将部门知识和预测性模型知识进行融合的必要性,而且他提到的一个最为重要的概念就是所谓的“客户画像”。
他们建立了一个能够判断女性客户是否怀孕的模型。他们注意到了具有某一类购买行为的患者,他们将之称为“筑巢”。例如,妇女通常会在预产期前90天购买婴儿床。Pole也注意到在妇女预产期之前,一些物品的购买具有规律性。这家公司还发现如果能够争取到这部分的购买者,她们还会在婴儿出生前购买一些其它的商品。Target开始积极关注这部分购物群体的价值,使得这部分群体在婴儿出生后仍会通过购物惯性继续在该公司进行消费。
其中关键性的描述词语在于“观察”和“注意”。这表明造模师并非制造了一个黑匣子。分析师会反思“这些内容具有什么意义?”,从这一数据模式中获得的遗漏的观点能够更好地为预测性模型进行服务。他们注意到了模式的重要性,这无疑有助于模型的迭代,他们也在持续思考着在模型建立之初没有被精确定义的有可能会对决策产生重要影响的因素(也可能是那些他们在一开始压根就没有想到的一些事情)。这种对于分析抽丝剥茧般的心态,甚至注意到了有趣的模式行为并使之与之前的某些模式建立了联系,这对于整个模型的成功意义非凡。指望造模师在模型建立的早期就对于项目所需要所有变量和重要模式就了如指掌是不切实际的。所以我们也不必对于“意想不到”的情况感到意想不到,或许通过新的方法,我们可以从期待抵达惊喜。
这种思维模式在任何一所大学的课程里都不会学到;这是个人内在品质的一部分。好的预测性分析师需要拥有这种抽丝剥茧般的心态和求知欲,这与他们是否知道如何驱动线性进程的方程式进展无关。
领取专属 10元无门槛券
私享最新 技术干货