你不关,我不转
小编凉了没人管
小编今天跟大家分享的是
大数据在保险行业的应用
坐稳了没?要开车了哦
保险这个行业?
保险行业存在已经很长时间了,一直以来并不依赖大数据分析技术,业务一直运转的很好。之前就有数据分析,而且业务一直也使用数据分析,各种报表都很完善,BI系统、数据库、数据集市、数据仓库管理了大量的数据,这些数据都是业务数据。针对这些大量优质数据,保险行业里也一直都有数据分析,不但有,而且非常完善,但是分析的方式并不是以大数据的方式。那么现在的大数据分析技术能给传统的业务带来哪些改变呢?
保险行业数据的特征:
大家都知道,所谓大数据,就是具备4V(Volume,Varity,Velocity,和Value)特征的数据。下面我们就对照这4V来看看保险数据。
规模性(Volume)
保险行业数据的规模很大,首先是交易数据本身的规模就很大。2017年全年,寿险新增保单1.1亿件,每天30万件,每小时1.3万件,每秒3.5件。这只是寿险,健康险,意外险,财产险这些保单数量还要比寿险大很多。寿险的保单大,意外险财产险的保单金额小,比如周末旅游买个短期意外险,几十块钱。乘坐交通工具的附加险,几块钱。所以保单数据时刻都在大量产生。保单中的数据不仅仅限于交易数据本身,不仅仅是办理业务填写的各种单据里的数据。还有所有用户行为产生的数据,比如去一趟门店,什么时候去的,和保险代理人进行一次访谈,谈话中聊到的个人社会关系信息,等等。
多样性(Varity)
业务数据都是结构化的数据,都是要录入到业务系统里的,使用关系数据库保存的结构化数据。对于这些数据来说,不存在原有系统处理不了,必须要依赖大数据系统的问题,因为本来就是原有的业务系统里产生的,在数据仓库里整理好的,在BI系统里用来分析的数据。但是,在业务数据之外,有很多在业务过程中产生的附加数据,不对这些数据进行分析,非常可惜。传统的,线下的业务,更能产生多样性的数据,对于大数据科学家来说是个大宝藏。所以这第二个V,多样性的数据,在传统的保险行业中也是一直存在的,很丰富,图像音频视频都有,还都不少。
高速性(Velocity)
前面咱们已经讨论过产生保单的频率,但说寿险是每秒3.5个保单,这个数字看起来还不算产生数据的速度快。咱们看电话销售,粗略估计一下,一个公司寿险电销行业的销售如果有3万,每天要打8小时电话,按照3-5分钟产生1M音频文件算,每秒钟大约300M的音频。这些音频数据如果不能在产生的时候就实时处理掉,而是积累起来,一天就是24T,后期再想从这些数据里去挖掘价值,就特别困难了。从某种角度来说,Velocity和Volume有相同的地方,互相补偿,高速的数据处理不了就会积攒成大量的数据。如果数据当时不处理,放时间长了就渐渐没有价值了。
价值性(Value)
大量的客户信息,不但有价值,而且都有价值到了涉及道德问题的程度了。最近腾讯的马总在说数据中台的事情,说腾讯不是不能做,而是做数据整合是很敏感很危险的事情。所以我们在挖掘数据价值的时候,主要担心的不是挖掘不出价值来,而是怎么能安全地挖掘价值,在保护用户隐私的前提下来挖掘价值。一般电商会记录用户的购物习惯,上网行为习惯,而保险公司记录的是,例如用户生病的记录,这个就敏感得多了。电商上的客户大部分都是个人信息,而保险公司记录了很多用户生活中的社交关系信息,家庭人员关系,投保被保人关系,这就更加敏感了。
大数据 IN 保险行业?
大数据在保险行业中主要由数据的采集技术、数据的存储技术、数据的分析技术、数据的展现技术、数据的安全合规、开拓新业务、技术与业务的有机结合等方面进行数据技术合理化从而应用于保险行业。
审核:施莉莉
编辑:刘家汉
领取专属 10元无门槛券
私享最新 技术干货