首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
首页标签数据仓库

#数据仓库

Apache Doris 存算分离实现弹性与性能双重提升

SelectDB技术团队

在数据驱动决策的时代,数据规模增长加快、分析需求不断变化。数据从多种渠道(如应用日志、网络交互、移动设备等)源源不断地流入,包含结构化、半结构化、非格式化等多种...

2800

Apache Doris 3.0.4 版本正式发布

SelectDB技术团队

亲爱的社区小伙伴们,Apache Doris 3.0.4 版本已于 2025 年 02 月 28 日正式发布。 该版本持续在存算分离、湖仓一体、异步物化视图等方...

6810

数据无界、湖仓无界,Apache Doris 湖仓一体典型场景实战指南(下篇)

SelectDB技术团队

在数据驱动决策的时代,湖仓一体架构以统一存储、统一计算、统一管理的创新形式,补齐了传统数据仓库和数据湖的短板,逐步成为企业大数据解决方案新的标准。

10110

数据湖与数据仓库:初学者的指南

Echo_Wish

在当今大数据时代,企业需要处理和存储海量数据。数据湖与数据仓库作为两种主要的数据存储解决方案,各自有其独特的优势与适用场景。本文将为初学者介绍数据湖与数据仓库的...

10010

湖仓分析|浙江霖梓基于 Doris + Paimon 打造实时/离线一体化湖仓架构

SelectDB技术团队

浙江霖梓是一家专注于深度学习和人工智能应用的金融创新企业,为企业提供精准经营决策,并基于大数据的风控能力的一系列高效便捷的金融服务产品。随着业务的持续扩展,大数...

14020

大模型时代的软件进化论:恐龙式软件 vs. 猴群式软件

郭大侠说开源

春节期间,IT圈内两件大事持续发酵,一件是中国大模型DeepSeek R1的开源震动全球AI界,让中国科技界扬眉吐气,廉价大模型走入千家万户;另一件是SAP被客...

13110

大数据揭秘:从数据湖到数据仓库的全面解析

Echo_Wish

数据仓库则是一个用于存储和管理结构化数据的系统,数据在进入数据仓库之前会经过ETL(Extract, Transform, Load)处理,确保数据的一致性和完...

11410

数据仓库实验四:聚类分析实验

Francek Chen

  通过本实验,进一步理解基于划分的、基于层次的、基于密度的聚类分析方法以及经典的聚类分析算法,并掌握利用 SQL Server 等工具平台进行聚类分析的方法,...

10610

数据仓库作业六:第9章 分类规则挖掘

Francek Chen

1、设网球俱乐部有打球与气候条件的历史统计数据如下表1所示。它有“天气”、“气温”、“适度”和“风力”4个描述气候的条件属性,类别属性为“是”与“否”的二元取值...

4100

数据仓库作业四:第7章 数据的属性与相似性

Francek Chen

4000

数据仓库作业五:第8章 关联规则挖掘

Francek Chen

2、设有交易数据库如下表1所示,令MinS=0.3,试用Apriori算法求出其所有的频繁项集。

2800

数据仓库实验二:关联规则挖掘实验

Francek Chen

  通过挖掘数据仓库中的关联规则,我们可以发现数据之间的潜在关联性,从而为业务决策提供重要的参考依据。

9110

数据仓库实验三:分类规则挖掘实验

Francek Chen

  在挖掘数据仓库中的分类规则实验前,需要对数据进行预处理和清洗,确保数据的质量和完整性,数据的完整性和准确性直接影响了挖掘结果的可信度。这包括去除重复值、处理...

3600

数据仓库实验一:数据仓库建立实验

Francek Chen

  能够针对某个领域的分析主题,建立事实表与维度表,设计星型模型或雪花模型。查看、编辑数据仓库的基本模型(即事实表与维度表之间的关系)。针对某一系统需求,从无到...

5200

数据仓库作业二:第2章 数据仓库原理

Francek Chen

  位图索引是数据仓库中的物理模型,用于在数据仓库中进行快速的数据检索和查询。它通过对数据仓库中的某些列或属性建立位图索引表,来描述这些列或属性中的每个取值在数...

4700

警务数据仓库的实现

Francek Chen

本文介绍在警务信息数据仓库分析与设计的基础上,应用 Microsoft SQL Server 2008 R2 的集成服务(SQL Server Integrat...

6400

数据仓库作业三:第5章 联机分析处理技术

Francek Chen

  OLAP 的5个特征 FASMI 包括快速性、分析性、共享性、多维性和信息性。其中快速性和多维性就是 OLAP 系统的两个关键特性。在线性表现为对用户请求的...

4500

数据仓库与数据挖掘概述

Francek Chen

定义1-5:数据仓库管理系统(Data Warehouse Manage-ment System,简称DWMS)是位于用户与操作系统(OS)之间的一层数据分析管...

10910

数据仓库的设计开发应用(三)

Francek Chen

  根据逻辑设计阶段的结果,创建一个数据库文件,并在其中创建事实表、维度表以及详细类别表结构(没有任何数据记录),同时根据物理结构设计结果完成存储位置、存储分配...

10910
领券