数据挖掘是提取数据、建立模型分析数据、得出结果后与需求部门进行沟通的一个职业。
举个例子:银行的事业部有很多潜在的贷款申请者,事业部向数据挖掘人员提出需求,希望能够分析哪些申请者是优质放贷对象?
数据挖掘人员首先要充分理解事业部的需求,其次要从数据库提取相关数据,提取数据的工作有些时候是由DBA来完成,好了,现在你得到了历史数据,你的任务就是通过历史数据来建立模型,分析具备什么特征的申请者是有能力还贷、不拖欠的,然后用建立好的模型来预测我们刚刚得到的新的一批申请者。
再具体一点:例如,我们通过历史数据发现,年龄大于35岁,的男性,已婚,家庭人口大于3,收入在12000元以上的申请者是理想的放贷对象,那么我们用这个标准来限定新的申请者。
当然我举的例子,为了浅显易懂,是非常简单的示意例子,实际情况要复杂得多,会涉及到个人的贷款历史、信用评估、自然属性、社会属性、资产评估等情况——就是说,数据挖掘人员是要通过数据库中的海量数据,整理出哪些是有用数据,再用这些有用的数据来分析其它部门的问题,帮助他们解决问题,或者为公司的发展提供数据依据
数据挖掘的上升方向是:数据挖掘——产品层——决策层
java是属于开发,比如开发软件、接口、应用程序等,如果一个公司需要开发数据挖掘软件,那么则需要数据挖掘知识+java开发能力,只有在这种时候,才需要两个都具备
但是一般自主开发数据挖掘软件的公司很少,第一需要消耗大量人力物力,第二市场有很多现成的软件,没必要开发。
如果你想从事数据挖掘,你必须具备:
数据挖掘模型、算法的数学知识以及一些数据分析软件(SPSS、SAS、matlab、clementine)
一些数据库相关的知识(oracle、mySQL)
了解市场、其它部门需求
当然这些都是一点一滴积累起来的,没必要一蹴而就,特别是对市场、行业的了解以及对公司其它部门的需求的理解非常重要,这决定了你能否从基础的分析人员上升到产品层、决策层,都是要在实际的工作中积累起来的
至于放弃java什么的,我觉得真的不是放弃,因为你具备了java的基础,一定能派上用场,比如技术型产品经理(face book的扎克伯格和腾讯的马化腾都是技术型产品经理),这种产品经理能够清晰的把握产品的开发过程,还有市场知识。总结起来就是没有什么东西会浪费掉,你学的所有的东西都将在工作中派上用场,只是你遇到的情况不够多不够复杂而已。有需要的大数据学习资料的同学可以评论小编。
领取专属 10元无门槛券
私享最新 技术干货