首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

【收藏】数据中台的起源与疑惑

数据中台的起源与疑惑 “中台”某种意义上是一个正宗的中国概念,早在2015年,马老师访问过北欧的Supercell游戏公司之后,便提出了这个概念。随之而来的,是阿里带动的“大中台、小前台”运动。...数据中台如何理解 如果说中台提供的是通用的业务解决方案+通用的技术解决方案,那么对应到数据中台,就是提供可复用的数据业务能力+可复用的数据技术能力。...那么这个时候,数据中台 = 数据仓库 + BI分析工具 + 元数据平台,最好前端能够有个自主搭建报表的工具,通过直接读取数据仓库的数据,来实现快速搭建分析平台的需求。 ?...数据中台如何体现价值 假设我们所在的公司有能力搭建数据中台,那么怎样的数据中台是合格的呢?...数据中台如何进行建设 大多数的数据人,做数据中台习惯从自顶向下进行建设。这种做法的优点是能够通盘考虑全局问题,保持数据的一致性,但坏处是变动的成本比较高,难以适应高速变化的业务结构。

78240
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    GAN的起源

    本文大约 5000 字,阅读大约需要 10 分钟 这是 GAN 学习系列的第二篇文章,这篇文章将开始介绍 GAN 的起源之作,鼻祖,也就是 Ian Goodfellow 在 2014 年发表在 ICLR...但是我们可以肯定的是,训练完成后,分类器是无法泛化到所有数据上,除非我们的训练集包含了分类类别的所有数据,但实际上我们做不到。...上图中,黑色曲线表示输入数据 x 的实际分布,绿色曲线表示的是 G 网络生成数据的分布,我们的目标自然是希望着两条曲线可以相互重合,也就是两个数据分布一致了。...而蓝色的曲线表示的是生成数据对应于 D 的分布。...在 a 图中是刚开始训练的时候,D 的分类能力还不是最好,因此有所波动,而生成数据的分布也自然和真实数据分布不同,毕竟 G 网络输入是随机生成的噪声;到了 b 图的时候,D 网络的分类能力就比较好了,可以看到对于真实数据和生成数据

    75020

    MPLS物种的起源!

    当时江湖上流行一种论调:过于简单的IP技术无法承载网络的未来,基于IP技术的因特网必将在几年之后崩溃。 ATM的野心 此时ATM跳了出来,欲收编所有帮派,一统武林。...不幸的是:信奉唯美主义的ATM走向了另一个极端,过于复杂的心法与招式导致没有任何厂商能够完全修练成功,而且无法与IP很好的融合。...ATM技术虽然没有成功,但其中的几点心法口诀,却属创新: 屏弃了繁琐的路由查找,改为简单快速的标签交换 将具有全局意义的路由表改为只有本地意义的标签表 这些都可以大大提高一台路由器的转发功力。...MPLS起源 MPLS的创始人“label大师”充分吸取了ATM的精华,但也同时认识到IP为江湖第一大帮派,无法取而代之。...遂主动与之修好,甘当IP的承载层,但为了与一般的链路层小帮有所区别,将自己定位在第2. 5层的位置。

    8710

    C语言的起源

    C语言是贝尔实验室的Dennis Ritchie于1969年~1973年间创建的。...用Ritchie的话来说,C语言是“古怪的、有缺陷的,但同时也是一个巨大的成功”。为什么会成功呢? C语言与Unⅸ操作系统关系密切。 C从一开始就是作为一种用于Unix系统的程府语言开发出来的。...C语言的设计是由一个人而非一个协会掌控的,因此这是一个简洁明了、没有什么冗赘的设计。K&R这本书用大量的例子和练习描述了完整的C语言及其标准库,而全书不过261页。...C语言的简单使它相对而言易于学习,也易于移植到不同的计算机上。 C语言是为实践目的设计的。C语言是设计用来实现Unix操作系统的。后来其他人发现能够用这门语言无障碍地编写他们想要的程序。...C语言是系统级编程的首选,同时它也非常适用于应用级程序的编写。然而,它也并非适用于所有的程序员和所有的情况。C语言的指针是造成程序员困惑和程序错误的一个常见原因。

    2.3K00

    一、 MySQL的起源

    一、 MySQL的起源 MySQL是一个开源的关系数据库管理系统。原开发者为瑞典的 MySQL AB公司,2008 年AB公司被Sun公司收购,并发布收购之后的首个版本 MySQL5.1。...「如果查询缓存有命中的查询结果,查询语句就可以直接去查询缓存中取数据。」 3.3 第三层:存储引擎层 「存储引擎负责MySQL中数据的存储与提取,与底层系统文件进行交互。」...3.4 第四层:系统文件层 「主要是将数据和日志存储在运行设备的文件系统之上,并完成于存储引擎的交互,是文件的物理存储层。」...,包括语句的发生时间、执行时长,主要用于数据库恢复和主从复制」。...但不记录select、show等不修改数据库的SQL。

    83010

    大数据的起源和错失大数据市场的鼻祖Google

    这个解决方案有两个特点,第一是计算量非常非常的大,第二是计算和计算之间相对独立。这就使得基于Hadoop的并行计算成为一个很好的选择。...比如说政府办公要上大数据,一个三线城市,放两三台机器搞定的,这数据真的非常的大。 如果我们撇开大数据这个概念不谈,自从有了数据以来,人类一直做的事情是什么?...有一段时间,MapReduce在Google和数据库元老、图灵奖获得者Michael Stonebraker之间展开了一场大撕逼。基本上的原则来说,图灵奖获得者觉得这个东西没什么,很傻逼。...这个差距就没有那么大了,技术的先进性只有这么多。一个人永远不要小看整个世界的力量。 第三个原因在于Google不是一个实诚的公司。大家对Google都有信任危机。...早年的时候,Google有过关于数据中心怎么建设的研究,内部研究表明不是越大越好,差不多是最有效的。然而对外的宣传却一直是越大越好,大的才能省能耗。关于这个误导了业界一段时间。

    1.9K140

    美团起源数据治理平台的建设与实践

    挑战 在建设起源数据治理平台的过程中,主要面临的挑战如下: · 起源数据治理平台应该在架构中的哪个位置切入,减少对原有系统的侵入,并实现数据治理目标。...元数据管理是起源数据治理平台的核心,起源平台就是通过控制好元数据,来驱动数据的生产和消费。 数据表管理模块 数据表管理模块管理了数据库信息和数据表信息。...图7 起源数据治理平台指标技术信息 业务管理 业务管理按照功能划分为业务线管理、主题管理和工单管理三部分,在系统的实际建设中是拆分为业务主题管理、数据主题管理和工单管理三大模块实现的。...其中平台操作权限管理是通过与公司将军令权限管理系统打通,并配合平台其他模块中权限控制代码,实现了权限管理、审批、审计三大功能模块;接口权限管理是通过平台内的数据应用管理和外部应用管理模块的映射关系,并在接口调用时鉴权实现...应用管理 应用管理由数据应用、外部应用、数据地图三大模块组成,它们构成了对外服务的主体,记录了外部应用与平台内管理的指标、维度、模型和表的关联关系,也提供数据查询展示、应用层ETL生产的能力。

    2.1K31

    Iphone的秘密起源故事

    在这个周年纪念日之前,我们的编辑Brian Merchant开始进行调查,以揭示iPhone的无与伦比的起源。从6月20日,追踪从肯尼亚矿这一旅程到中国的工厂一路一个无限次的循环。...这个操作系统与任何现代计算机上的操作系统一样复杂。但是,这是过去三十年来我们开发的操作系统的演变。 像许多大众采用,高利润的技术一样,iPhone有一些竞争的起源故事。...---- Fadell说:“iPhone的起源 - 好吧,让我们开始吧 - 是iPod的主导地位。“苹果的收入是百分之五十”,但是iPod在2001年初期出货,几乎没有人注意到。...“ “那是史蒂夫史上最早的原型之一。我们内置了一个iPod,我们在WiFi部分添加了硬件,所以它是一大块垃圾,我们修改了软件。“有一些点击式的iPod可以在2004年笨拙地上网。”...所以我刚刚建立了一个实际的东西,可以在你打字时学习 - 它会建立一个跟随彼此的单词的数据库。“但是这个过程还是太乏味了。 Grignon说:“很明显,我们超负荷的点击轮太多了。”

    1.8K30

    ERP的神经起源

    注:[可以通过插入脑内的微电极,分离来自单个神经元的动作电位,但通过活体细胞外记录,完全分离单个神经元的突触后电位,是不可能的,因此,活体当个神经元记录("单细胞"记录)测量的电位是动作电位,而非突触后电位...如果两个神经元产生的动作电位沿着互相平行的轴突传递,而且两个动作电位在时间上是准确同时出现的话,则来自两个神经元的电压会相加,在其附近电极所记录的电压大约等于从一个神经元记录的动作电位的两倍。...因此,导致的结果就是顶树突的负电与细胞体的正电形成一个微小的偶极子(dipole).简单讲,一个偶极子就是小距离隔开的一对正、负电位。 ?...说实话单个神经元的偶极子太小了,我们是无法从远距离的头皮电极记录到它。幸运的是,在一定的条件下,来自多个神经元的偶极子是可以叠加的。这样我们就有可能在头皮测量到结果电压。...如果神经元的朝向是随机排列的,则一个神经元的正电就有可能相邻于另一个神经元的负电,这样就会相互抵消了。

    73620

    列式存储的起源:DSM

    磁盘是由一个一个block组成的,因此连续的数据也分在了连续的block里。逻辑和物理的对应关系如下图: ?...DSM的结构优势 避免空值:分解之后,就不用属性之间对齐了,对于稀疏数据来说,能有效避免空值的存储,节省空间。 ? 减少数据冗余:能让逻辑清晰,即范式化。...类似图书后边的勘误表,和 LSM 的概念差不多,主要为了减轻数据更新负载。...但是这样搞有个前提:Differential file 比较小,大了就傻逼了。 (3)方便测试,一份不可修改的数据,两份差异文件,可以同时运行两个系统,每个系统维护一份数据和自己的差异文件。...总结 DSM 可以说是列式存储的起源之一了。关于这个 DSM 没啥特别有意思的,主要是一种表的设计方式,但是其引申的 Differential File 挺有意思的。

    2.2K10

    数据大爆炸:解析大数据的起源及其对未来的启示

    数据大爆炸:解析大数据的起源及其对未来的启示引言数据已成为当今社会的一种新型“资源”,其重要性无异于石油。我们正处于一个前所未有的数据大爆炸时代。...从社交媒体的每一次点赞,到智能设备的每一次记录,数据无处不在。本文将解析大数据的起源,并通过实际代码示例探讨其对未来的影响。...一、大数据的起源1.1 数据量的爆发大数据的概念虽然在近些年被频繁提及,但其根基早在计算机与互联网初期便已奠定。随着计算技术的发展,尤其是互联网的普及,数据量呈指数级增长。...二、大数据的特征与挑战2.1 四大特征大数据通常具备以下四大特征,被称为4V特征:Volume(体量):数据量巨大,超出传统数据库的处理能力。Velocity(速度):数据生成和处理速度快。...Variety(多样性):数据种类繁多,包括结构化和非结构化数据。Veracity(真实性):数据的准确性和可靠性成为一大挑战。

    14810

    “数”的起源 2.1 数据漫话史—抽象、表示与存储

    注:本文节选自《SOD框架"企业级"应用数据架构实战》一书之【2.1.1“数”的起源】,转发自此图书的在线试读网站,更多内容可点击了解。...2.1 数据漫话史—抽象、表示与存储 2.1.1“数”的起源 《山海经》、《周易》、《黄帝内经》并称为"上古三大奇书",书中记述的事情年代久远, 内容宏大而又神秘,其中都有“数术”方面的论述和演绎。...“序列”的重要特点就是它的元素有大小,元素排列是有序的,总是从大到小或者从小 到大的一种顺序排列。比如现在进行数据库查询的时候,对某一列数据进行排序,排序之后 的这列数据就是一个序列。...所以,用“序列”来表示数,真是一个伟 大的发明!...可见“数据”和“程序”是等价的:数据 是程序,程序是数据。一种程序语言能够体现出这个特点,Lisp 真是神奇的语言!

    80920

    【翻译】蓝绿部署的起源

    原文: http://timothyfitz.com/2009/02/08/continuous-deployment/ 蓝绿部署的故事,就像经常发生的那样,是关于辅导一个棘手的客户。...我领导的构建团队发现测试环境和生产环境之间存在很多差异。(每个测试环境之间也存在差异,但这是另一类模式!) 我们认为检查版本的最安全方法是将应用程序一起部署到与实时系统相同的物理机上。...我们的应用正在运行具有“域”概念的 WebLogic 上,“域”只是一个存放应用程序文件的目录。 我们会将新版本部署在相邻的目录中,我们称之为“影子域”(它有一个漂亮的幻想:“准备发布影子域!”...如果出现任何问题,我们可以通过修改控制器指向当前实例立即回滚,前提是我们没有进行任何破坏性的数据库更改 ....我们需要没有明显层次结构的方法来给域打标签。因此我们选择了颜色。如果你的域被称为蓝色、绿色、橙色、黄色等,那么显然没有“最好”的。 我们避免使用红色域,因为这听起来很危险。

    35310

    ERP的神经起源

    神经元的电活动 与神经有关的电活动主要包括动作电位和突触后电位两种形式。 动作电位:是一种离散的电压尖峰,而且从细胞体的轴突起始处想轴突末端传递,然后在末端释放神经递质。...如果两个神经元产生的动作电位沿着互相平行的轴突传递,而且两个动作电位在时间上是准确同时出现的话,则来自两个神经元的电压会相加,在其附近电极所记录的电压大约等于从一个神经元记录的动作电位的两倍。...因此,导致的结果就是顶树突的负电与细胞体的正电形成一个微小的偶极子(dipole).简单讲,一个偶极子就是小距离隔开的一对正、负电位。...[图1] 说实话单个神经元的偶极子太小了,我们是无法从远距离的头皮电极记录到它。幸运的是,在一定的条件下,来自多个神经元的偶极子是可以叠加的。这样我们就有可能在头皮测量到结果电压。...如果神经元的朝向是随机排列的,则一个神经元的正电就有可能相邻于另一个神经元的负电,这样就会相互抵消了。

    81100

    每行字符数(CPL)的起源

    他想与我讨论一个问题: "各种计算机语言的编码风格,有的建议源码每行的字符数(characters per line)不超过72个,还有的建议不超过80个,这是为什么?区别在哪里?怎么来的?"...每行72个字符的限制,来源于打字机。上图是20世纪60年代初,非常流行的IBM公司生产的Selectric电动打字机。 ?...当时,美国最通用的信笺大小是8.5英寸x11英寸(215.9 mm × 279.4 mm),叫做US Letter。打字的时候,左右两边至少要留出1英寸的页边距,因此每行的长度实际为6英寸。...当时,最流行的打孔卡是IBM公司生产的80栏打孔卡,每栏为一个字符,80栏就是80个字符。 ?...上图是一张Fortran语言的源码填写单,一共有80栏,程序员在每一栏选择想要输入的字符,最多为80个字符。 ? 然后,用机器自动生成打孔卡,在每栏选定的位置打一个孔。

    1.2K60

    环形RNA:生命起源的“奇点”

    其中一个备受关注的假说是“RNA世界”假说,该假说认为在生命的起源阶段,RNA分子既是遗传信息的载体,又是功能分子。...这种分工有助于解决RNA在同时担任两种角色时面临的结构性挑战。 武汉大学的这项研究为理解生命的起源提供了新的视角。...环形RNA基因组可能在早期生命进化中扮演了重要角色,其独特的结构优势使其能够在恶劣的早期地球环境中生存和繁衍。随着研究的深入,我们有望进一步揭开生命起源的神秘面纱,为生命科学的发展提供新的动力。...通过这种计算机模拟和理论探讨,我们离解开生命起源的谜题又近了一步。正如研究团队所示,环形RNA可能是理解生命如何从无机物质进化而来的关键一环。...未来的研究将继续探索这些神秘的分子,揭示它们在生命起源中的确切角色。 文章链接: https://doi.org/10.1080/15476286.2024.2380130

    16810

    美团酒旅起源数据治理平台的建设与实践

    挑战 在建设起源数据治理平台的过程中,主要面临的挑战如下: · 起源数据治理平台应该在架构中的哪个位置切入,减少对原有系统的侵入,并实现数据治理目标。...元数据管理是起源数据治理平台的核心,起源平台就是通过控制好元数据,来驱动数据的生产和消费。 数据表管理模块 数据表管理模块管理了数据库信息和数据表信息。...图7 起源数据治理平台指标技术信息 业务管理 业务管理按照功能划分为业务线管理、主题管理和工单管理三部分,在系统的实际建设中是拆分为业务主题管理、数据主题管理和工单管理三大模块实现的。...其中平台操作权限管理是通过与公司将军令权限管理系统打通,并配合平台其他模块中权限控制代码,实现了权限管理、审批、审计三大功能模块;接口权限管理是通过平台内的数据应用管理和外部应用管理模块的映射关系,并在接口调用时鉴权实现...应用管理 应用管理由数据应用、外部应用、数据地图三大模块组成,它们构成了对外服务的主体,记录了外部应用与平台内管理的指标、维度、模型和表的关联关系,也提供数据查询展示、应用层ETL生产的能力。

    66450
    领券