首页
学习
活动
专区
圈层
工具
发布
首页标签大数据处理套件 TBDS

#大数据处理套件 TBDS

安全、易用的一站式大数据存算分析平台

StarTree支持Apache Iceberg扩展湖仓用例

用户11764306

基于Apache Pinot开源在线分析处理数据库的实时分析平台和云服务提供商StarTree Inc.今日宣布全面支持Apache Iceberg。

4400

自动化数据操作平台获3000万美元融资

用户11764306

由人工智能驱动的自动化数据操作平台初创公司Pantomath今日宣布,已在B轮融资中筹集3000万美元,旨在超越传统数据可观测性,发展成为其所谓的"数据操作操作...

4610

新一代数据平台替代传统大数据技术栈

用户11764306

一家名为Definite的初创公司在今日获得1000万美元种子轮融资后,宣称能帮助企业淘汰笨重的大数据技术栈和商业智能工具。本轮融资由某机构领投,某中心及其他战...

5510

MongoDB财报超预期,文档数据库技术解析

用户11764306

文档数据库公司某机构在第二季度实现营收5.914亿美元,同比增长24%,大幅超出市场预期。调整后每股收益达1美元,远超预期的66美分。公司净亏损收窄至4700万...

3310

基于python的医院智慧门诊系统

计算机程序设计

在21世纪信息技术飞速发展的背景下,医院智慧门诊系统作为一种融合了最新互联网、大数据、人工智能等信息技术的医疗服务体系,日渐成为提高医疗服务质量和效率、优化患者...

15910

基于python的汽车数据可视化、推荐及预测系统

计算机程序设计

汽车数据可视化、推荐及预测系统的研究源于对汽车行业发展和用户需求的深入理解,以及对大数据分析和人工智能技术在汽车领域应用的探索。这一研究背景主要包括以下几个方面...

9810

Pandas与Snowpark Pandas API数据处理框架深度解析

qife122

本文是对现有Pandas工作流迁移至Snowpark Pandas API的过程分析,采用近乎"直接迁移"的方式满足不断增长的数据需求。

13810

Apache Arrow:跨语言的内存分析工具集

qife122

Apache Arrow是一个跨语言的开发平台,用于内存数据分析。它提供了一种标准化的列式内存格式,支持高效的数据交换和处理,适用于各种大数据处理场景。Arro...

18610

第四章:数据治理的目标

数据小吏

如果是一个ToB的厂商,在说数据治理的时候,大概率说的是一套数据治理工具,他不会提组织架构、业务流程、规章制度等等。仅仅提供了一套数据治理的工具产品,这套工具按...

7500

第二章:数据治理的边界在哪里

数据小吏

面对数据治理,不知道其他人什么感受,我的感受好像面对一个庞然大物,无从下手。似乎有很多的事情需要做,但是具体做哪些?先做什么,再做什么?有没有牵一发而动全身的那...

11500

大数据挖掘实战-PyODPS基础操作

fanstuck

文章链接:https://cloud.tencent.com/developer/article/2465951

87530

数据资产管理体系与标准

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

数据资产管理(DAM,Data Asset Management)是指规划、控制和提供数据及信息资产的一组业务职能,包括开发、执行和监督有关数据的计划、政策、方...

1.3K100

大数据平台:计算资源优化技术&作业诊断

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

大数据平台的资源管理组件主要针对存储资源与计算资源进行分析优化。前文《大数据平台:资源管理及存储优化技术》主要介绍了存储资源优化,本文主要介绍大数据平台构建过程...

95790

大数据平台:资源管理及存储优化技术

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

大数据平台的资源管理组件主要涉及存储资源和计算资源管理两部分,属于大数据平台运维管理系统。基于资源管理系统,大数据平台的开发运维人员能够清晰掌控平台的资源使用情...

1.4K90

大数据平台:Ambari集群管理

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

Ambari是Hortonworks主导发行的开源管理平台,作为Apache顶级项目,Ambari也是最早且最成熟的大数据集群管理开源组件,可类比于Cloude...

1.3K70

Presto CBO统计元数据

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

Presto:2012年秋季Facebook内部开始研发,2013年正式对外开源。Presto是Facebook用于补充和替代Hive的产品,主要用于实时场景的...

39040

Spark CBO统计元数据

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

Statistics 统计信息,参考:org.apache.spark.sql.catalyst.plans.logical.Statistics

50791

Hive CBO优化剖析

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

Hive是较早的SQL on Hadoop系统,对大数据SQL执行有广泛和深远的影响。它最初由Facebook开发,后来成为Apache软件基金会的一个开源项目...

70560

Calcite系列(十二):可插拔性&JDBC驱动

Yiwenwu

腾讯 | 后台开发工程师 (已认证)

为了实现动态数据源管理框架的目标,Calcite提供了丰富的可插拔能力和扩展性。用户可以根据使用场景进行自定义扩展。相关可插拔扩展的组件包括:

1.1K30
领券