前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >活动|腾讯大数据×2024数据智能大会技术交流回顾

活动|腾讯大数据×2024数据智能大会技术交流回顾

作者头像
腾讯大数据
发布2024-06-27 13:09:42
1630
发布2024-06-27 13:09:42
举报

6月19-20日,由中国通信标准化协会主办,中国通信标准化协会大数据技术标准推进委员会(CCSA TC601)承办的首届“数据智能大会”在京召开。

本次大会以“来这里,抓住数据智能时代”为主题,在主论坛外,设置数据智能基础设施、企业数智化转型发展、数据智能创新应用、数据要素可信流通、数据智能安全五大平行论坛及数据资源估值与入表闭门研讨会,探索数据智能在各领域的应用潜力和发展趋势,腾讯大数据平台智能负责人杨晓峰和大数据智能化项目经理黄丹青,分别参与圆桌研讨对话交流和技术专题分享。

圆桌论坛:数据智能时代下的技术和应用趋势

大会圆桌论坛环节由中国信通院云大所大数据与智能化部副主任马鹏玮主持,腾讯大数据平台智能负责人杨晓峰与来自电信、华为等企业的专家们进行了题为“数据智能时代下的技术和应用趋势”的讨论。

杨晓峰专家分享了腾讯大数据在智能化时代的数据普惠战略,以及在数据智能领域的技术创新和实践,并指出标准是打通数据协同卡点、促进数据价值发挥的关键手段之一,并呼吁业界共同协作和推动,同时,强调了技术创新、数据治理、数据伦理和数据安全的重要性,预见了数据智能在解决复杂问题、提高效率和创造新商业模式中的潜力,认为其将进一步推动社会和经济的发展。

▲点击观看现场完整视频

▍研讨问答

1.数据时代下,我们将会诞生哪些新技术,哪些重点的技术方向是值得当下产业去关注的?

杨晓峰:在数字时代,我们能够看到一些非常明显的变化,尤其是随着数字技术的发展,它对我们整个数据研发的管线带来了模式上的跃迁。未来,智能原生将不再是一个选项,而是一个基本的产品能力和属性。随着技术的进步和智能的深入,用户群体因门槛降低而扩大,从数据工程师到产品经理,甚至高层管理者,都将能够通过更自然的方式使用数据进行洞察和决策。

另一个变化是,我们将从过去的常规数据处理和分析,转向更深度的洞察和决策。数据的真正价值在于发掘信息和挖掘价值,这是真正能够赋能业务的关键。

2.在数据智能领域,哪些应用是ToB场景最先想去投入,或者最先想进入领域?

杨晓峰:从行业应用的视角来看,数字化程度的差异非常明显。互联网行业的数字化程度最高,金融和医疗行业次之,而制造业等其他行业的数字化程度相对早期。数字化不仅是一个由外到内、由浅入深的过程,而且是一个逐渐深化的过程。不同行业在数字化应用的深度和广度上各有不同,但总体上,数据智能将在各行各业发挥越来越重要的作用。

3.在数据智能时代,我们应该去学习哪些新的技能和知识,或者做哪些事情来抓住这个时代?

杨晓峰:在数据智能时代,我们应该首先去了解AI,了解它如何为当前行业带来价值。我们需要掌握如何使用AI模型,提升对行业的理解和价值。数据的理解也非常重要,我们需要思考如何更好地使用数据,支持决策,并为AI模型提供支持。数据智能时代的个人发展,需要我们不断学习和适应新技术,利用AI提升工作效率和决策质量。

4.从业内从业者的角度去看,未来5年你们的工作会为数据时代带来怎样的变化?

杨晓峰:我们将继续聚焦在数据普惠的使命上。尽管现在AI和大模型是热门话题,但要让其发挥作用,基础工作是关键,我们需要在数据协同、数据价值发挥等方面做更多,以确保数据智能的广泛应用。腾讯大数据与腾讯标准、信通院在标准建设方面,合作推动了异构硬件编程模型标准、隐私计算数据相关标准等行业标准研究及立项,我相信随着基础建设的不断成熟,数据智能将更深入地融入各行各业,成为推动社会进步的重要力量。

数据智能创新应用论坛-专题分享

数据普惠——大模型催生天穹大数据研发新范式

黄丹青专家在大会数据智能创新应用论坛,分享了腾讯大数据智能化团队如何通过构建自动驾驶的大数据平台和降低数据分析门槛来实现数据普惠,以及在数据智能领域的技术创新和业务实践。

▲点击观看现场完整视频

▍腾讯大数据天穹智能化建设全景

在大数据领域,随着技术的发展,大数据平台的规模越来越大,成本、效率和质量构成了新的“不可能三角”。为了解决这一问题,腾讯大数据智能化建设的目标瞄准了构建一个自动驾驶的大数据平台,解决稳定性保障、成本优化和查询加速等问题,同时有效降低运营运维中的人力投入。对数据应用场景,利用智能化技术降低数据分析的门槛,实现数据普惠,打造一个“人人都是数据分析师”的大数据生态。

▍为什么大模型让“数据普惠”离我们更近了?

大模型的引入,为数据普惠带来了新的可能。它通过知识推理和信息压缩,解决了数据研发智能化过程中,对数据资产、数据需求相关知识的“理解难”问题,进一步推动大数据研发范式的变革,这一变革过程需要面对找数、用数、懂数这3关的挑战。

找数:主要是数据资产理解与元数据治理,利用大模型帮助更有效地定位和了解如何使用资产, 这里大模型介入的难点在于元数据质量参差不齐、知识整理标准不一、人力维护消耗大。

用数:是指自然语言理解与业务知识融合来实现快速对数据内容的快速问答,其难点在于理解需求,千人千面的口语化问题、一些隐藏的业务背景黑话,转换成sql后对不同底层数仓的方言兼容等等,都影响大大模型介入的落地效果。

懂数:最终数据消费者做成复杂决策时,会深入准确数据背后的根因,或者期望能依赖数据做出进一步预测。这个场景下是完全业务导向的深度分析,需求多变。大模型实际上起到的是一个媒介作用,是融合各种分析手段的中控。

▍大数据智能体的角色与组成

数据智能体的设计融合了自然语言处理、领域知识理解和代码生成等多项技术,通过意图识别、问题改写和任务拆解等技术点,构建了一个能够准确响应用户查询并执行数据分析任务的智能系统。

1.使用到的能力:

a.自然语言处理(NLP)能力,特别是对话(Chat)能力,用于与用户进行有效沟通。

b.指令遵循能力,确保大模型能够准确执行编程指令。

c.知识理解能力,使模型能够理解并推理数据中蕴含的知识。

2.组成部分:

a.基座模型的选型,作为智能体成功的基础。

b.领域知识,确保模型能够理解特定领域的数据和业务逻辑。

c.代码生成能力,用于生成数据分析的代码或DSL(特定领域语言)

3.技术点:

a.意图识别,智能体需要准确识别用户的查询意图。

b.问题改写,将用户的查询转化为可执行的指令。

c.任务拆解,将复杂查询拆解为可管理和执行的子任务。

d.知识库的构建,组织好的知识库可以提高回答的准确性。

▍大数据智能体如何落地到业务场景

大数据智能体通过上游的数据治理与知识挖掘、中游的自动化分析与决策支持,以及下游的深度分析与智能决策,实现从数据到洞察再到行动的全链路业务应用。

1.数据治理与知识挖掘

a.利用大数据智能体的自然语言处理能力,进行数据资产的标注和知识库的构建,包括字段、指标和表的自动注释。

b.通过智能体对数据进行探查和采样,逆向分析出数据的维度信息和分区规则,提升数据中台的能力。

2.数据分析与决策支持

a.应用智能体的对话能力和编程能力,实现用户查询的自动化处理,如自动化生成SQL查询或使用DSL(特定领域语言)

b.结合领域知识,智能体可以提供描述性分析和基本的数据分析,支持业务决策。

3.深度分析与智能决策

a.智能体集成深度分析能力,如用户画像、异动归因和风控检测等,提供高级的分析和预测。

b.利用智能体的中控作用,调度大数据平台的数据知识和服务工具,实现智能化决策和自动化执行。

▍未来展望

大模型的加入标志着大数据研发范式的变革仅是一个开始。我们将继续在知识治理、决策智能集成和生态协同上进行深入探索,进一步加强与业界的标准共建和技术共建,推动数据分析领域的进步。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-06-26,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 腾讯大数据 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
大数据
全栈大数据产品,面向海量数据场景,帮助您 “智理无数,心中有数”!
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档