来源 | 宜信技术学院(ID:CE_TECH)
导读:自从阿里巴巴提出“中台”的概念之后,这个词汇就成为各领域企业关注的焦点,很多人在考虑建设自己的中台。然而,构建中台是否真有必要?是否所有的企业都要建设中台?如何构建中台等问题还是让他们疑惑。近日,宜信科技中心 AI 中台团队负责人王东在一篇技术专访中,从大数据和 AI 赋能金融业务的角度,分享了中台、大数据、AI 等软件研发趋势为业务赋能的经验与思路。
本文为王东的采访实录整理,从技术视角到业务视角,在中台的落地契机、AI与大数据关系、AI和大数据技术的落地等方面提出了他的看法。
以下为采访实录:
1、很多人将金融行业的发展划分为三个阶段:信息金融时代,主要指银行卡的出现,银行开始做集中的数据管理;互联网金融时代,互联网的发展,使得用户可以通过 PC 和 APP 办理金融业务,这一阶段金融机构通过数据平台管理和使用数据;智慧金融时代,也就是现在,金融机构通过大数据和 AI 技术让金融服务智能化。
作为有多年金融行业经验的大数据专家,您认为在这 3 个阶段里,数据为金融服务赋能的方式出现了哪些变化?分别有哪些典型的产品化表现?
王东:按照 DIKW 体系, 这三个阶段对应的是数据电子化、数据信息化、数据知识化和数据智能化的过程。
2、智慧金融时代,AI 技术在金融服务的落地场景也越来越多。您能否介绍 AI 在金融服务业务场景中的落地实践。
王东:这里我以宜信的智能聊天机器人平台为例说明。该平台是结合自然语言处理、搜索引擎、会话领域场景的一站式人机对话解决方案,只需简单导入自己的业务问答数据知识,系统的智能模型就会快速学习并生成相应的机器人,创建出定制化的业务咨询专家。
智能聊天机器人平台包含 QA 聊天机器人、任务机器人、闲聊机器人、人工后台、文档管理、模型管理、会话管理、统计报表等诸多功能。平台支持多租户,对算力、数据和资源进行隔离。对接公司 LDAP、SMP、SSO 等认证系统,支持功能角色和数据角色,对业务系统无侵入,可以内嵌到公司 PC 端业务系统中或手机 APP 中。
以 CSC(Cloud Service Container,轻量级服务容器) 场景为例:CSC 的一线同事在日常工作中,每天都会产生大量业务问题需要咨询。此前这些问题通过蜜蜂等 IM 软件在工作群内进行询问,由 CSC 客服管理部相关同事支持。但由于问题数量大、涉及业务线多,这些业务咨询往往不能得到迅速解决,影响业务的顺利开展。另一方面,通过人工进行业务问题支持的工作还存在着响应缓慢、效率不高、成本高昂等问题。最终从客户角度来看,业务问题的无法解决或解决流程不规范,将严重影响客户体验和品牌认知。
使用了智能问答机器人后, 门店客服可以通过智能机器人快速得到一致性答案,通过搜索引擎快速检索到业务文档相关资料,当遇到机器人无法解答问题,可以将问题转入人工后台。让大部分常见问题由机器人代劳,少部分复杂的问题转后台人工处理。通过智能机器人+人工后台的方式,共同提供完整的快捷的一体化用户体验。目前已经成为客服管理重要的日常工具,实现了运营管理智能化从0到1的过程,帮助运营人员减轻压力,提升运营效率。
由于智能聊天机器人平台是按照平台化方式来建设的,因此很容易推广到公司其他需要智能聊天的场景中,除了 CSC 客服问答机器人以外,目前已经在公司车贷客服问答、催收业务咨询、财富智能问答、指尖金融家 APP 和信审业务咨询等领域中上线和使用。
金融领域正掀起一场智能化的变革,智能聊天机器人在这场变革中将扮演重要角色。众多分析师认为,聊天机器人的商业化应用,其真正潜力正是在金融领域。除了对于企业内部业务的智能化支持,更加令人兴奋的是聊天机器人与金融的结合将彻底颠覆个人金融服务的形式,相信在不远的将来,智能金融机器人将在客服、咨询、理财、支付等各种场景下提供更加科学而自然、理性兼具人性的服务,这也是我们平台的最终发展目标。
3、智能化的 AI 产品可以解决复杂多样的业务问题,但面对众多的需求,需要进行优先级排列,您和团队是如何判断业务问题优先级的呢?
王东:就能力分层来说,我们认为智慧化 AI 产品可以分为三层:
从技术难度来说,最具有挑战性的是最底层-AI 平台层,打造一套自己的在线训练平台一直是很多 AI 科学家和数据科学家所期待的,但打造一套非常好用的在线训练平台并不容易,需要投入大量人力和时间,维护成本也很高,需要增加最新算法库等,对使用的用户要求也比较高,一般都是算法工程师和科学家。我们的业务方对这个一般没有什么感知。
从业务影响力和优先级来说,最上层和中间层的优先级会更高一些,这两层主要是为公司一线业务系统服务,会直接或间接触达到一线业务同事或客户,直接产生商业价值和降低成本。
作为 AI 中台来说,在有限的人力情况下,我们会更优先支持最上层和中间层的 AI 服务,例如:聊天机器人平台、语音合成、主题提取、卡证类识别等通用类 AI 服务以及与业务方合作的智能服务项目。而对于最底层 AI 平台,我们也会在日常工作中,通过积累和沉淀可以复用的工具集,逐步形成相应平台能力。
4、据悉,宜信的智能聊天机器人平台是基于 AI 中台研发的,那么 AI 中台为智能聊天机器人平台的研发提供了哪些优势呢?相比 AI 中台建设之前,有哪些地方得到了改善?
王东:从 AI 中台的使命来说,AI 中台承担一些跨领域的、平台级的服务研发和推广,避免烟囱式的开发,强调开发合作、通用性和可复用性。智能聊天机器人平台就是这样一款产品,它具有平台的通用性,可以内嵌到公司各个业务系统中,以自然语言的方式提供问题咨询、任务执行、业务解答等支持,最终达到节省人力,降本增效的目标。
智能聊天机器人在 AI 中台开发是有诸多好处的:
5、现在,越来越多的人提到数据中台需要向 AI 中台演进,您对此怎么看?宜信的数据中台和 AI 中台之间是什么样的关系?二者之间是如何支持协作的?
王东:数据中台除了提供数据平台本身的两大能力(数据存储和数据计算)以外,还提供了更高级的能力,就是把数据变成一种基础服务提供给业务方,业务方可以以自助的方式在数据中台上获取数据,进行数据处理、数据探索、数据挖掘、分析钻取、多维分析、自助化报表、数据分享等,以快速的实现自己的商业价值。
随着业务的发展,越来越多的智能化数据需求被提出,这些智能化需求涉及到模型训练、数据标注、特征工程、模型部署、性能监控等,需要使用机器学习、深度学习等算法支持。数据中台的主要目标还是服务数据,对于智能化和模型并不能很好地支持,因此 AI 中台应运而生。
我们把智能服务的需求抽象出来,形成一个独立的 AI 中台层。AI 中台是一个用来构建智能服务的基础设施平台,对公司所需的模型提供了分布分层的构建能力和全生命周期管理的服务,鼓励各个业务领域基础性、场景性、通用性的 AI 能力沉淀到平台中,加强模型复用、组合创新、规模化,最终实现降本增效和快速响应业务方。
数据中台和 AI 中台两者是相互依存,承前启后的关系。
6、从去年开始,似乎每个公司都在谈中台,但其实很多人对中台的具体价值还不是很理解,您觉得中台在赋能业务方面有哪些优势?请您举几个例子具体介绍。
王东:在“以用户为中心”的思想指导下,企业需要快速响应、挖掘、引领⽤户的需求,借助平台化的力量可以事半功倍。后台并不为前台而生,要么不好用,要么变更速度跟不上前台的节奏。就算是新建的后台系统,因为其后台管理的属性(考虑到企业安全、审计、合规、法律等限制)导致不能适应前台快速开发的需求。前台和后台就像是两个不同转速的⻮轮,前台要快速响应,后台则要求越稳定越好。
因此中台应运而生,中台存在的目的就是更好地服务前台,进而更好地响应服务。在宜信,数据中台和 AI 中台也同样是为了更好更快地服务前台而存在:
中台将前台业务中相对稳定的能力固化和沉淀下来,并共享给有需要的其他业务方使用,从而实现快速响应业务需求、降低成本和支持业务方进行规模化创新。
7、以您的经验来看,什么样的企业需要建设数据或者 AI 中台?或者说企业在什么时候应该要建设中台,是否有什么明显的信号?比如说企业到了什么样的阶段或者遇到什么样的问题。
王东:企业启动自己的数据中台和 AI 中台建设,是与企业当时的业务发展阶段相关的。
很多企业在早期业务发展过程中,为了解决一些当时的业务问题,快速上线了很多功能,要么垂直的、个性化的业务逻辑与基础系统耦合太深,横向系统之间、上下游系统之间交叉逻辑错综复杂。要么缺乏统一规划,建设了许多高度相似的系统,大量重复建设,但又不通用,用户体验不统一。这样导致在新业务、新市场的拓展过程中,系统没法直接复用,甚至没法快速迭代。
我们称为 “重复造轮子”和“烟囱式架构”,本质上是企业在早期高速发展过程当中,为了快速解决当时的业务问题,而欠下了许多技术债务。这些历史技术债务积重难返,当企业进入成熟期之后,发现这些问题的存在,严重影响了企业的运行效率和运营成本。大多数提出中台战略或是建设大中台的企业,都面临过类似的困境。
中台化建设作为一种产品设计思想或者系统架构思想,对于任何一家即将或者正在面临业务高速增长的企业来说,都值得借鉴,对目前业务当中大量可复用的功能和场景进行梳理,为业务的高速增长做好准备,同时也起到了降本增效的目的。
这个过程很像是在飞行过程中修发动机。一方面,知道飞机发动机已经存在一些问题,需要修理;另外一方面,还在飞行过程中,飞机还要飞,还要支持业务发展,不可能将发动机停了。这个过程是有一定难度,还要抢时间,为下一次业务发展做好准备。
通过机制化、产品化等方式,将企业内部具有通用性的数据、功能、产品进行统一规划和开发,从而更好地帮助前台业务部门更多地关注业务,提高业务运营效率,进而提升企业竞争力,是企业中台化建设的目标。
8、前面您也讲到,智能聊天机器人平台的研发要基于数据中台所提供的数据挖掘和处理能力,可以说 AI 产品的研发和应用离不开大数据技术的支撑。那您认为大数据技术与 AI 应用落地之间是一种什么样的关系?
王东:纵观这次人工智能的浪潮,可以说是算法、大数据等技术和硬件多方面的因素促成的。一方面算法层面有了进一步突破,更重要的是大数据相关技术的成熟,使得数据的获取变得容易,大数据计算变得可能,以前许多不可能完成的事情,现在可以通过大数据的算力来进行学习和训练。再结合现在 GPU、AI 芯片以及传感器等硬件技术,使得需要大规模计算的深度学习训练可以完成,这些都直接导致了AI应用的快速落地和到处开花。
因此,无论是传统的数据挖掘、还是机器学习、深度学习,所有的模型都离不开大量的数据,可以说大数据技术是 AI 应用的养料和土壤,大数据技术催生了 AI 应用的落地。
9、最后一个问题是关于AI的应用前景。您觉得现在 AI 技术是否已经成熟到可以大规模落地应用了?以金融行业为例,您认为要真正实现 AI 技术在金融服务中的全面落地,现在还缺少什么?比如技术方面、数据资源方面等。
王东:最近对 AI 应用讨论得挺多,有以下几种观点:
了解到人工智能历史的同行都知道,其实人工智能至今经历了三次大的热潮。每次都经历了开始是“人类要毁灭了”,后来是“骗子”的过程。
实际上,在一个特定领域的优秀表现,并不能代表 AI 技术无所不能。同样的,在通用领域不能解决的问题,不代表特定领域不能解决。
我更加相信“持久战论”,罗马从来都不是一天能够建成的,技术的突破也必然会经历一定时间的积累。AI 技术在金融服务中的落地,我比较赞同宜信 CTO 向江旭先生提的观点:“大胆拥抱,小心实践”。
首先需要选择金融领域的业务痛点,并通过 AI 技术来解决这些痛点,把非常炫酷的 AI 技术落实到实际业务需求中,而不是为炫酷而炫酷。就目前而言,我们的 AI 中台会选择在智能机器人和知识图谱构建上发力。智能聊天机器人能为公司内外提供专业领域的知识解答,知识图谱能为各业务方提供智能问答、智能搜索、精准营销等。最重要的是,我们希望按照平台化的方式去建设它们,希望建设知识图谱的方法论、工具和平台可复用。
目前在落地过程中,除了搭建 AI 中台相关平台以外,花费时间最多的是与数据相关的过程,无论是模型训练,还是知识图谱构建,很多时间用在获取数据和探索数据。
对于普通的模型训练,需要多个维度的数据,AI 科学家需要对这些数据进行观察和探索,一般这些数据都是结构化数据,这个问题会随着数据中台的成长,数据汇集越来越多后,得到逐步的解决。数据中台提供自助化探索数据的能力,能够大幅减少获取数据和探索数据的时间和成本。
对于图谱构建和自然语言处理,我们很多的金融数据,保存为非结构化的数据和语料,例如 pdf文档、表格数据、扫描图片等,一方面要求数据中台或数据平台能够提供非结构化数据的获取能力,另一方面也要求 AI 中台提供对这种非结构化数据进行在线标注、在线提取的平台级能力。
嘉宾介绍
王东:宜信科技中心 AI 中台团队负责人
北京大学软件工程专业硕士,宜信科技中心 AI 中台团队负责人,目前负责宜信 AI 中台平台的建设工作。研究领域方向包括开放AI平台建设、智能聊天机器人、实时数据归集和处理、大数据平台研发和推广等。拥有 10 年以上金融和互联网企业基础系统和数据类研发经验。宜信敏捷大数据栈 DBus 开源项目负责人,CUBRID-cluster 开源项目发起人。曾任韩国最大搜索引擎公司——Naver 资深工程师,多年负责 CUBRID-cluster 分布式数据库引擎和 CUBRID 数据库引擎研发工作。
(*本文为 AI科技大本营转载文章,转载请联系原作者)