首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >泼天富贵:终于将数据中台架构体系讲明白了

泼天富贵:终于将数据中台架构体系讲明白了

原创
作者头像
曾高飞
发布于 2025-06-15 12:33:17
发布于 2025-06-15 12:33:17
2830
举报

当前,大部分企业不再建设从源数据采集到分析应用的烟囱式系统,更倾向于数据集中采集、存储,并应用分层建设。这种方式一方面有利于应用系统的快速部署,另一方面也保证了数据的集中管理与运营,体现数据的资产、资源属性。

数据中台的出现弥补了数据开发和应用开发之间由于开发速度不匹配而出现的响应力不足等缺陷问题。

数据中台是国内学者提出的概念,起始于阿里的“大中台、小前台”概念。阿里的中台是从管理的角度出发,以中台事业部集中数据搜索,技术及产品,数据共享等多个部门的功能。其他组织或企业建设数据中台不一定需要成立中台事业部,但是数据集中治理与提升数据价值转换效率的思路是一致的。

— 01

数据中台通用体系架构

不同的企业对数据有不同的需求。企业数据应用不断更新迭代,企业的中台系统也需要不断变化。

从数据处理与数据治理两个维度出发,可以设计一个解耦的数据中台体系架构。该数据中台体系架构具有一定的柔性,可按照企业应用需求进行组合,或者对单个模块进行扩充,能满足大多数企业数据中台建设的需求。

9f41285ce1c2cd95ce9d79708a435a37.png
9f41285ce1c2cd95ce9d79708a435a37.png

数据中台体系架构示例

数据中台的通用体系架构如图 2 所示。该中台体系架构以减少功能冗余和提高功能复用为原则,把数据中台解耦为 6 个可以分别独立建设、演进的功能子系统。

数据结构与数据处理子系统是数据中台体系架构的核心,数据治理是提升数据价值的重要手段。该数据中台体系架构的通用性表现在以下几点。

  • 该数据中台体系架构综合考虑了数据中台的各种要素,参考这个架构进行建设可以有效提升数据资产价值,提供数据及服务的共享。
  • 参考这个数据中台体系架构,企业可以一次规划、分步实施。首先建设处理子系统及数据存储子系统,然后根据业务发展需求,逐步补充数据采集、数据安全及数据治理子系统。
  • 该数据中台由 6 个解耦的子系统组成。企业在立项建设时可以灵活组合,每个子系统单独招标建设,也可以把多个子系统合并招标建设。数据中台通用体系架构包含数据存储框架、数据采集框架、数据处理框架、数据治理框架、数据安全框架及数据运营框架等 6 大部分。

1、数据存储框架

数据中台的核心是数据,数据通过采集系统获取,然后数据经过处理框架加工,并接受数据治理框架的管理,同时也要接受数据安全管理框架的管理,最后开放的价值数据将通过数据运营框架对外提供数据服务。

数据中台的数据架构应该独立规划,并采用合理的技术架构对不同类型的数据进行存储。

数据存储框架中,无论数据采用对象存储、块存储还是数据库存储技术,各种中台数据可按照上图所示分类管理。

源数据主要由采集框架进行管理,数据治理框架按照数据特征把数据简单分为结构化和非结构化数据两大类,而规范化分域数据则是数据治理框架对全量数据的规范化分域整理。宽表数据是数据关联的结果,利用宽表数据可以对人、事、地、物、组等对象进行完整的数据画像,同时宽表数据也可以作为上层模型数据的中间层数据。

元数据和标签数据都是对数据的描述,其中元数据用来对数据的客观属性进行表示,标签数据更倾向于管理者对数据的主观表述及等级划分,比如质量等级标签、安全标签、属性标签等。主数据需要在各系统间频繁更新、交换,且需要独立的存储空间进行维护管理。

2、数据采集框架

数据中台的采集框架应对纳入数据中台的各种源数据进行统一采集管理。数据采集框架中应提供多种数据采集方式,如文件传输协议采集、数据库采集、接口应用程序接入采集、流式采集及网络爬虫采集。

同时采集框架应按照数据采集规范对源数据进行预处理,从而去除明显不需要的数据及多余数据,并对采集过程进行管理。虽然数据中台的体系架构没有统一模板,但各企业数据采集框架基本一致。

3、数据处理框架

数据处理是每个数据应用的基本环节之一,经典的数据抽取、转换和加载(ETL)处理流程在数据采集预处理、数据整合、数据建模等多个地方均要使用。单独建设数据处理框架有利于数据处理工具组件的集中开发与管理,也有利于数据中台数据处理任务的协调与调度。

数据处理框架专门负责数据处理相关的任务,包括批处理、流处理、人工智能分析、数据清洗、数据交换及查询,此外数据处理的相关工具组件可在处理框架中配置。任务调度模块在数据处理框架中处于居中指挥的作用,并对运行的数据处理任务进行监控及异常处理等操作。

4、数据治理框架

广义的数据治理不仅包含提升数据价值的内容,如数据管理、数据目录、数据质量等,也包含数据安全管理及数据共享服务。

数据安全管理与数据价值提升是一个矛盾体,如果由一个厂商或开发团队进行数据安全管理及数据价值提升相关软件的开发,则开发者的操作难免有所偏向,而且矛盾不容易公开,少了冲突也就少了优质的解决方案。

另外,数据共享与数据治理的其他内容也存在相同的问题。因此,本文建议数据中台的数据治理框架中不包含数据安全与共享的相关内容。

数据治理框架包含数据目录、数据管理、模型管理和数据质量 4 个模块:

  • 数据地图、数据资产目录、知识图谱及数据血缘的主要作用是展示数据的属性及相互关系,因此都纳入数据目录模块。
  • 数据模型能提高数据中台对外部应用需求的反应能力,固化的中间模型数据需要专门管理。模型管理包括模型目录、模型血缘及模型地图等。
  • 数据管理又可以细分为元数据管理、主数据管理、标签数据管理及源数据管理。
  • 数据质量管理模块按照制定的数据标准及数据稽核规则对数据中台中的数据进行质量管理。

5、数据安全框架

数据已经成为数据资产,数据安全框架是数据中台必不可少的组成部分。数据安全叠加在数据中台其他功能框架之上,数据采集、处理、交换、共享等每个环节均必须实施安全控制策略。安全框架可以分为日志管理、用户认证、权限管理及加解密等几个功能模块。

此外,安全全门户也可以对外提供安全能力封装,展示数据中台的安全态势及安全视图。

6、数据运营框架

数据中台的核心功能是综合众多数据应用的数据处理及数据治理功能,集中建设、集中管理、减少冗余、增加复用。数据中台的最终目的还是为其他应用或开发者提供数据服务,而对外数据服务功能将直接面向不确定的外部对象。

因此单独建设数据运营,一方面有利于针对外部用户提供针对性功能;另一方面,数据运营模块作为用户与数据中台核心数据服务之间的中间层,可以有效隔离外部用户直接控制、接触核心数据及应用,可保护数据中台的安全性及内部功能的稳定性。

综合以上因素,数据运营应配置运营门户、能力开放、数据开放及运营监控等功能:

  • 运营门户:对数据中台管理者提供管理门户,对开发者提供开发者门户。对内部应用提供内部应用门户,对外部应用提供外部应用门户。运营门户针对不同的用户提供不同的通道并开放不同的数据中台能力。
  • 能力开放:把数据中台的数据处理能力、数据分析能力等经过适当的封装后对用户提供服务,可以是微服务,也可以是 API 接口,或者直接提供二次开发能力。
  • 数据开放:通过数据目录,数据/模型展示(可视化、数据视图等)为其他数据应用系统提供数据服务。
  • 运营监控:对数据中台的总体运营情况进行监控管理,包括硬件环境、软件环境,并且确定监控指标,按需求提供运营日报,处理告警信息。

— 02 —

数据中台典型架构

数据中台的目标是让数据持续用起来,通过数据中台提供的工具、方法和运行机制,把数据变为一种服务能力,让数据更方便地被业务所使用。下图所示为数据中台总体架构图,数据中台是在底层存储计算平台与上层的数据应用之间的一整套体系。

9470d5556b9c39ba05bd9be12febc462.png
9470d5556b9c39ba05bd9be12febc462.png

数据中台总体架构图

数据中台屏蔽掉底层存储平台的计算技术复杂性,降低对技术人才的需求,让数据的使用成本更低。通过数据中台的数据汇聚、数据开发模块建立企业数据资产。通过资产管理与治理、数据服务把数据资产变为数据服务能力,服务于企业业务。数据安全体系、数据运营体系保障数据中台可以长期健康、持续运转。

1. 数据汇聚

数据汇聚是数据中台数据接入的入口。数据中台本身几乎不产生数据,所有数据来自于业务系统、日志、文件、网络等,这些数据分散在不同的网络环境和存储平台中,难以利用,很难产生业务价值。

数据汇聚是数据中台必须提供的核心工具,把各种异构网络、异构数据源的数据能够方便地采集到数据中台进行集中存储,为后续的加工建模做准备。数据汇聚方式一般有数据库同步、埋点、网络爬虫、消息队列等;从汇聚的时效性来分,有离线批量汇聚和实时采集。

2. 数据开发

通过数据汇聚模块汇聚到中台的数据,没有经过什么处理,基本是按照数据的原始状态堆砌在一起的,这样业务还是很难使用。数据开发是一整套数据加工以及加工过程管控的工具,有经验的数据开发、算法建模人员利用数据加工模块提供的功能,可以快速把数据加工成对业务有价值的形式,提供给业务使用。

数据开发模块主要是面向开发、分析人员,提供离线、实时、算法开发工具以及任务的管理、代码发布、运维、监控、告警等一些列集成工具,方便使用,提升效率。

3. 数据资产体系

有了数据汇聚、数据开发模块,中台已经具备传统数仓平台的基本能力,可以做数据的汇聚以及各种数据开发,就可以建立企业的数据资产体系。之前说数据资产体系是中台的血肉,开发、管理、使用的都是数据。大数据时代,数据量大,增长快,业务对数据的依赖也会越来越高,必须考虑数据的一致性和可复用性,垂直烟囱式的数据和数据服务的建设方式注定不能长久存在。

不同的企业因业务不同导致数据不同,数据建设的内容也是不同的,但是建设方法可以相似,数据要统一建设,笔者建议数据按照贴源数据、统一数仓、标签数据、应用数据的标准统一建设。

4. 数据资产管理

通过数据资产体系建立起来的数据资产还是一套偏技术的数据体系,业务人员比较难理解。资产管理是以企业全员更好理解的方式,把企业的数据资产展现给企业全员(当然要考虑权限和安全管控),数据资产管理包括对数据资产目录、元数据、数据质量、数据血缘、数据生命周期等进行管理和展示,以一种更直观的方式展现企业的数据资产,提升企业的数据意识。

5. 数据服务体系

前面利用数据汇聚、数据开发建设企业数据资产,利用数据管理展现企业的数据资产,但是并没有发挥数据的价值。数据服务体系就是把数据变为一种服务能力,通过数据服务让数据参与到业务,激活整个数据中台,数据服务体系是数据中台存在的价值所在。

企业的数据服务是千变万化的,中台产品可以带有一些标准服务,但是很难满足企业的服务诉求,大部分服务还是需要通过中台的能力快速定制。数据中台的服务模块并没有自带很多服务,而是提供快速的服务生成能力以及服务的管控、鉴权、计量等功能。

6. 运营体系和安全体系

通过前面的数据汇聚、数据开发、数据资产、资产管理、数据服务,已经完成了整个数据中台的搭建和建设,也已经在业务中发挥一定的价值。

运营体系和安全体系是数据中台得以健康、持续运转的基础,如果没有它们,数据中台很可能像个一般项目一样,一期搭建起平台、建设部分数据、尝试一两个应用场景之后而止步,无法正常地持续运营,不能持续发挥数据应用价值。这也就完全达不到建设数据中台的目标。

— 03 —

12张企业数据中台架构图

一、技术中台架构图

中台概念出现之前,在信息化模式上,前端为支撑业务的应用端,后端为各个应用系统,为前端用户,如:客户、供应商、伙伴、社会,提供服务,但随着市场、用户需求、业务的多变性,底层僵硬的应用无法及时提供支撑。

企业需要一个强大的中间层为高频多变的业务提供支撑,为不同的受众用户提供多端访问渠道,基于此类需求“中台”概念出现,接着开始对企业客户、中间件厂商、数据平台厂商、甚至传统应用软件厂商都有较大的概念冲击。

恰逢此时,微服务技术和架构、容器化的生态、Devops概念和工具处于大发展的阶段,最后基于“大中台、小前台”的信息化建设模式开始流行。

8bdb1e7c250506149eee0239075c573e.png
8bdb1e7c250506149eee0239075c573e.png

二、银行数据架构体系

数据架构层面通过数据分类、分层部署等手段,从非功能性视角将数据合理布局。通过整体架构管控和设计,支持业务操作类和管理分析类应用(系统),满足业务发展及IT转型对数据的需求,架构的扩展性和适应性能够提升数据分析应用的及时性、灵活性和准确性。

那实际情况下各个银行的数据架构体系会有所不同,根据各行的业务发展、客户数据量、交易数据量、功能需求等会有不同的演变路径以及发展方向。

一般国有银行、股份制银行等全国性的银行业务较复杂,数据量也较多,数据架构也因此进化较快。常见的数据架构分区如下图所示:

54dbde008352019cf76f2602d6e8217d.png
54dbde008352019cf76f2602d6e8217d.png

三、零售行业中台架构

这是一张混合了技术和业务的中台逻辑架构示意图,前台应用部分我们将零售和消费品行业需要对接消费者的若干应用系统一一列举了出来,但是在中台架构下它们已经和传统的“应用系统”有了很大的差别,变得非常“轻量”。

5b588465e301f7fbf07b12b7551a12a8.png
5b588465e301f7fbf07b12b7551a12a8.png

四、业务中台架构

前台跟着界面走,天生就稳定不了,总是有五花八门的数据请求,这是必然的事情。

后台应该主要负责数据存储,把不同形式和规模的数据以合适的方式整理好,大数据倒腾起来动静太大,要求有一定的稳定性。

如果前台的请求都要求后台直接做,那后台管的事就太多了。

9740a92f18581ea8e1a229e11d3b4ed7.png
9740a92f18581ea8e1a229e11d3b4ed7.png

五、后台架构

后台是被许多前台共享的,如果直接向前台提供灵活数据服务,还可能导致各个前台之间的耦合程度变高,维护成本立即陡增。

同样的,把这些数据处理放在前台也不合适,一方面不太安全,另一方面,前台团队也是忙着让界面如何更好看使用更流畅,没太多工夫琢磨数据的事情。这样一个后台架构就能够相对平衡这一矛盾。

d275e3b055359c8baf08323d6b815645.png
d275e3b055359c8baf08323d6b815645.png

六、实时数据中台

下面是实现实时数据中台的一种逻辑架构,方便你去理解,其实最关键的是实时模型那一层

eb3b0f97e0dd703e569c1576b4d37332.jpeg
eb3b0f97e0dd703e569c1576b4d37332.jpeg

七、企业级中台发展过程

我用下面这张图来概括中台发展的三个阶段,最终我们发现,对于那些已经有 ERP 系统的企业来讲,中台的建设本质就是利用微服务架构构建开放业务平台来替换闭源单体架构的 ERP 系统的过程。

20776374ccc262a9de63ef8708a0b074.jpeg
20776374ccc262a9de63ef8708a0b074.jpeg

八、阿里中台架构

中台是一种架构理念和方法。任何一种架构的方法,其本质不外乎,利用分、合、打散、重组等技术手段,对系统进行有序化重构,以达到减少系统“熵”的过程,使系统得以不断进化。

8a0ba2a09a5f253337af51d3466ec154.jpeg
8a0ba2a09a5f253337af51d3466ec154.jpeg

九、阿里核心架构图

通过阿里云平台将技术中台进行部署,对集团内共享业务单元提供支撑,并最终提供服务化能力输出,如富贵论坛

e0aa5f3d996f6f2a1afe3d38a6a42a1b.jpeg
e0aa5f3d996f6f2a1afe3d38a6a42a1b.jpeg

十、全渠道零售中台

如果仅仅是把所有的东西打包在一个“大后台”并不能真正解决IT的痛点,因为毕竟它是一个IT系统。IT系统要考虑的东西除了业务功能,更重要和更有价值的地方在于:

7e2ea981ff4c6681079eacec57023b6f.png
7e2ea981ff4c6681079eacec57023b6f.png

十一、全渠道集成架构

2007~2012年是“集成模式”概念被抛出率最高的年代,它有一个名字叫“SOA”,SOA就是那个时代的“全渠道中台”

9541fa0b1fc395530108405b73a96610.png
9541fa0b1fc395530108405b73a96610.png

十二、网易严选数据中台体系

数据中台的核心职责是高效地赋能数据前台为业务提供价值。要想理解数据中台先要理解数据前台,上文说到的搜索、推荐、BI 报表、数据大屏等都属于数据前台。

3186397451f68c15850f271b9938644a.jpeg
3186397451f68c15850f271b9938644a.jpeg

— 04 —

6种行业数据中台解决方案

e31a130941441fa5d1db330536757c23.png
e31a130941441fa5d1db330536757c23.png

▲地产行业解决方案

cfed908e33ce64ec159ed7ef91e84f55.png
cfed908e33ce64ec159ed7ef91e84f55.png

▲证券行业解决方案

9f094848968aeaac8a118137e5d6a1ae.png
9f094848968aeaac8a118137e5d6a1ae.png

▲零售行业解决方案

01ab84cb506341ae8f01d2c556b2543b.png
01ab84cb506341ae8f01d2c556b2543b.png

▲制造行业解决方案

f41e0ed618661b1de1150821ed7fa2f3.png
f41e0ed618661b1de1150821ed7fa2f3.png

▲传媒行业解决方案

4fdec4040ad00599f25722d67c8387ee.png
4fdec4040ad00599f25722d67c8387ee.png

检务行业解决方案

写在最后的话

建设数据中台,实现企业或机构数据资产的高效管理和数据价值最大化,为机构带来了数据平台化的运营机制,有望解决应用开发与数据开发速度不匹配的问题。利用数据中台,可以将机构的核心技术或团队凝聚在一起,建设机构内强大的数据开发、运营等团队,提升机构的团队的硬实力和软实力。

虽然一个良好的架构对一个信息系统的后期扩容及运维有重要作用,但总体架构设计只是数据中台建设的第一步,每一个功能模块还有很大的细化空间,如不同类型数据的存储技术选型、数据安全合规审计技术、数据模型设计等。在具体项目中,数据共享与安全保护的平衡点、新技术的引用等,都需要进一步细化研究。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
语言模型GPT-2挤牙膏式开源,放出774M预训练模型,称是倒数第二版
此前,OpenAI因为担心这个语言模型效果太好被滥用,一直藏着掖着开源,还被网友调侃为“ClosedAI。
代码医生工作室
2019/08/23
6580
语言模型GPT-2挤牙膏式开源,放出774M预训练模型,称是倒数第二版
史上最强AI被喷,马斯克躺枪发推:我早就看不惯OpenAI
原因是,OpenAI并没有公布GPT-2模型及代码,只是象征性的公布了一个仅含117M参数的样本模型及代码,给到的理由:因为这个模型能力太强大了!他们目前还有点hold不住它。一旦开源后被坏人拿到,将会贻害无穷。
新智元
2019/03/07
7810
史上最强AI被喷,马斯克躺枪发推:我早就看不惯OpenAI
逆天语言模型GPT-2最新开源:345M预训练模型和1.5B参数都来了
GPT-2,这个造假新闻编故事以假乱真,能完成阅读理解、常识推理、文字预测、文章总结等多种任务的AI模型,从诞生开始就引起大量关注。
量子位
2019/05/14
1.2K0
逆天语言模型GPT-2最新开源:345M预训练模型和1.5B参数都来了
李飞飞高徒教你从0到1构建GPT
该内容刚发出来,在Twitter已吸引400万关注量,HackerNews上Points也破了900。
一点人工一点智能
2023/01/30
1.2K0
李飞飞高徒教你从0到1构建GPT
GPT-3为什么怼起了前老板?马斯克:和OpenAI道不同不相为谋
据《经济学人》报道,总部位于旧金山的 OpenAI 在7月中旬向艺术家 Arram Sabeti 等人提供了 GPT-3语言的早期版本,测试他的性能。
新智元
2020/08/11
8910
GPT-3为什么怼起了前老板?马斯克:和OpenAI道不同不相为谋
GPT现状终于有人讲清楚了!OpenAI大牛最新演讲爆火,还得是马斯克钦点的天才
前特斯拉AI总监Andrej Karpathy在演讲中认为思维树(tree of thoughts)与AlphaGo的蒙特卡洛树搜索(MCTS)有异曲同工之妙!
量子位
2023/08/03
2420
GPT现状终于有人讲清楚了!OpenAI大牛最新演讲爆火,还得是马斯克钦点的天才
马斯克加入AIGC大战!火速抢购1万张GPU,挖Deepmind墙角
梦晨 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 马斯克入局AIGC大战,紧急抢购约1万张GPU! 什么概念? 特斯拉最强超算Dojo也不趁这么多。 Dojo在2022年升级后公布的数据是7360块A100,虽然这次买的什么型号还不清楚,但光从数量来说也足够恐怖。 据Business Insider消息,这1万显卡是买给推特的。 爆料者称,推特版GPT已在准备中,而且推特本身就拥有海量数据,存在一定优势。 等一下?马斯克不是前一阵还签署公开信,呼吁比GPT-4强大的AI模型暂停6个月的吗? 真就应
量子位
2023/04/13
2730
马斯克加入AIGC大战!火速抢购1万张GPU,挖Deepmind墙角
GPT-3说:马斯克是世界最强的人,但没有他人类会更好
一位叫 Spencer Greenberg (以下简称S先生)的数学家,最近和GPT-3做了一番交谈,内容实属精彩,先来一睹为快。
量子位
2020/08/19
6140
GPT-3说:马斯克是世界最强的人,但没有他人类会更好
络腮胡大神 Ilya 离开 OpenAI,即将加入马斯克的 xAI 团队
Ilya Sutskever(伊利亚·苏茨科弗)出生于苏联,是一名计算机科学家和人工智能专家。他在多伦多大学获得博士学位,并在斯坦福大学完成博士后工作,曾师从深度学习领域先驱 Geoffrey Hinton。Ilya 在加入 OpenAI 之前,就已经因神经网络、机器学习,尤其是自动编码器、图像识别和语言建模等方面的工作而闻名于世。
LIYI
2024/05/21
5150
络腮胡大神 Ilya 离开 OpenAI,即将加入马斯克的 xAI 团队
不花钱,让「情圣」ChatGPT教你怎么追马斯克!
最近,OpenAI发布了史上最强聊天机器人ChatGPT,这个诞生于GPT-3基础上的AI很快走红网络。
新智元
2023/01/09
5620
不花钱,让「情圣」ChatGPT教你怎么追马斯克!
马斯克最新回应:OpenAI 的“邮件攻击”在说谎!斯诺登力挺:OpenAI 这么做是反人类!
近年来,人工智能技术的快速发展引起了广泛关注。然而,这项技术的发展也带来了一系列争议和问题。上周,亿万富翁埃隆·马斯克对美国人工智能公司 OpenAI 提起了法律行动,指控其背离了初衷,将人工智能用于盈利而非为人类福祉服务。
深度学习与Python
2024/03/07
1810
马斯克最新回应:OpenAI 的“邮件攻击”在说谎!斯诺登力挺:OpenAI 这么做是反人类!
OpenAI CEO:AI可能会杀死人类,已经出现我们无法解释的推理能力
来源:量子位 | 公众号 QbitAI “AI确实可能杀死人类。” 这话并非危言耸听,而是OpenAI CEO奥特曼的最新观点。 而这番观点,是奥特曼在与MIT研究科学家Lex Fridman长达2小时的对话中透露。 不仅如此,奥特曼谈及了近期围绕ChatGPT产生的诸多问题,坦承就连OpenAI团队,也根本没搞懂它是如何“进化”的: 从ChatGPT开始,AI出现了推理能力。但没人能解读这种能力出现的原因。 唯一的途径是向ChatGPT提问,从它的回答中摸索它的思路。 针对马斯克在推特上的“危险论”,他
程序猿DD
2023/04/04
4660
OpenAI CEO:AI可能会杀死人类,已经出现我们无法解释的推理能力
头条OpenAI不公开发布GPT-2,应该反对还是赞同?
AI 科技评论按:上周四,OpenAI 发布了一个非常大的语言模型 GPT-2。给定一两句开头之后,这个模型就可以生成新闻、小说同人等多种不同风格的文字,内容看起来非常逼真。然而反常的是,OpenAI 的研究人员们决定不发布训练模型的数据、也不发布最大那个模型预训练后的参数,因为他们认为如此强力的模型有遭到恶意滥用的风险。「认为可能有风险所以不发布模型」,这事引起了渲染大波,机器学习&自然语言处理界的研究人员们展开了热烈的讨论。
AI科技评论
2019/05/08
6590
头条OpenAI不公开发布GPT-2,应该反对还是赞同?
新火种AI|估值180亿美元,马斯克造了一家“AI独角兽”
4月7日,据《华尔街日报》独家报道,xAI正在和投资者们进行洽谈,计划筹集高达30亿美元的资金,而其估值也极有可能飙升到180亿美元这一天文数字。而xAI才仅仅成立不到一年的时间,它无疑是马斯克的又一个“造富神话”。
新火种
2024/04/09
1310
刚刚!马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型
本周一,马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok,这也兑现了他上周的开源承诺。截至目前,Grok 已经在 GitHub 上获得了 4.3k 颗 Star。
深度学习与Python
2024/03/18
4200
刚刚!马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型
一个续写故事达到人类水平的AI,OpenAI大规模无监督语言模型GPT-2
AI 科技评论按:模型大小的比拼还在继续!自谷歌大脑的 2.77 亿参数的语言模型 Transformer-XL 之后,OpenAI 也完成了自己具有 15 亿个参数的语言模型 GPT-2,而且这个模型还有一项惊人的能力,就是从短句续写成篇的文章。雷锋网 AI 科技评论简单介绍如下。
AI科技评论
2019/03/07
1.2K0
一个续写故事达到人类水平的AI,OpenAI大规模无监督语言模型GPT-2
一文读懂 OpenAI
OpenAI 是一家美国人工智能(AI)研究实验室,由非营利性 OpenAI Incorporated(OpenAI Inc.)及其营利性子公司 OpenAI Limited Partnership(OpenAI LP)组成。OpenAI 进行 AI 研究的目的是促进和开发友好的 AI。OpenAI 系统运行在世界上第五强大的超级计算机上。该组织于 2015 年由 Sam Altman、Reid Hoffman 在旧金山成立,杰西卡·利文斯顿(Jessica Livingston)、埃隆·马斯克(Elon Musk)、伊利亚·萨茨克维尔(Ilya Sutskever)、彼得·泰尔(Peter Thiel)等人共同认捐了 10 亿美元。马斯克于 2018 年辞去董事会职务,但仍是捐助者。微软在 2019 年向 OpenAI LP 提供了 10 亿美元的投资,并于 2023 年 1 月向其提供了第二笔多年期投资,据报道为 100 亿美元。
李维亮
2023/05/16
1.3K0
Sora不懂物理世界,翻车神图全网爆笑!LeCun马斯克DeepMind大佬激辩世界模型
它被抬到半空中时,桌子上就忽然出现了一滩平整的红色玻璃,随后玻璃杯被摔到桌子上,和这滩玻璃融为一体。
新智元
2024/02/26
1810
Sora不懂物理世界,翻车神图全网爆笑!LeCun马斯克DeepMind大佬激辩世界模型
囤了几千个GPU,挖了deepmind前工程师!马斯克的新AI公司要和OpenAI对打
大数据文摘出品 作者:Caleb 马斯克的头衔又多了一个。 除了SpaceX创始人、CEO和总工程师,特斯拉CEO兼产品架构师,推特所有者兼CEO,Neuralink和OpenAI的联合创始人之外,前几天马斯克又在内华达州成立了一家名为X.AI Corp.的新人工智能公司。 根据上个月提交的文件,马斯克是该公司唯一的上市董事,目前X.AI已授权出售1亿股股票。 对此多家外媒报道表示,马斯克成立这家人工智能公司,主要是为了与OpenAI竞争,甚至他还向SpaceX和特斯拉投资者寻求启动资金。 据法律专家称
大数据文摘
2023/04/21
3240
囤了几千个GPU,挖了deepmind前工程师!马斯克的新AI公司要和OpenAI对打
马斯克猛烈抨击 ChatGPT引轰动:“这不是我想要的”
作者 | Tina 埃隆·马斯克 (Elon Musk) 否认了他最著名的作品之一。 特斯拉、SpaceX 和 Twitter 的首席执行官以热爱工作每天睡觉不超过 6 小时而闻名,他脑子里想着几件事,其中一件事关 OpenAI 的发展,太平洋时间凌晨 1 点 36 分,他发表推文指责 OpenAI 违背初心:被微软控制,只顾赚钱。 作为联合创始人之一,马斯克对 OpenAI 的现状非常不满:“OpenAI 最初是作为一家开源(这就是为什么我把它命名为‘Open’AI)的非营利性公司而创建的,为了抗衡
深度学习与Python
2023/03/29
5900
马斯克猛烈抨击 ChatGPT引轰动:“这不是我想要的”
推荐阅读
语言模型GPT-2挤牙膏式开源,放出774M预训练模型,称是倒数第二版
6580
史上最强AI被喷,马斯克躺枪发推:我早就看不惯OpenAI
7810
逆天语言模型GPT-2最新开源:345M预训练模型和1.5B参数都来了
1.2K0
李飞飞高徒教你从0到1构建GPT
1.2K0
GPT-3为什么怼起了前老板?马斯克:和OpenAI道不同不相为谋
8910
GPT现状终于有人讲清楚了!OpenAI大牛最新演讲爆火,还得是马斯克钦点的天才
2420
马斯克加入AIGC大战!火速抢购1万张GPU,挖Deepmind墙角
2730
GPT-3说:马斯克是世界最强的人,但没有他人类会更好
6140
络腮胡大神 Ilya 离开 OpenAI,即将加入马斯克的 xAI 团队
5150
不花钱,让「情圣」ChatGPT教你怎么追马斯克!
5620
马斯克最新回应:OpenAI 的“邮件攻击”在说谎!斯诺登力挺:OpenAI 这么做是反人类!
1810
OpenAI CEO:AI可能会杀死人类,已经出现我们无法解释的推理能力
4660
头条OpenAI不公开发布GPT-2,应该反对还是赞同?
6590
新火种AI|估值180亿美元,马斯克造了一家“AI独角兽”
1310
刚刚!马斯克开源 Grok:参数量近 Llama 四倍,成全球最大开源模型
4200
一个续写故事达到人类水平的AI,OpenAI大规模无监督语言模型GPT-2
1.2K0
一文读懂 OpenAI
1.3K0
Sora不懂物理世界,翻车神图全网爆笑!LeCun马斯克DeepMind大佬激辩世界模型
1810
囤了几千个GPU,挖了deepmind前工程师!马斯克的新AI公司要和OpenAI对打
3240
马斯克猛烈抨击 ChatGPT引轰动:“这不是我想要的”
5900
相关推荐
语言模型GPT-2挤牙膏式开源,放出774M预训练模型,称是倒数第二版
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档