首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

为什么我不使用Databricks作为我的数据集市?

作为一个云计算领域的专家和开发工程师,我了解到Databricks是一个非常强大的数据集市解决方案,但是我不选择使用Databricks的原因有以下几点:

  1. 依赖性:Databricks是基于Apache Spark构建的,因此使用Databricks需要具备一定的Spark知识和经验。如果团队中没有相关的技术人员,那么使用Databricks可能需要额外的培训和学习成本。
  2. 成本:Databricks是一个商业化的解决方案,使用Databricks需要支付相应的许可费用。对于一些中小型企业或个人开发者来说,成本可能会成为一个考虑因素。
  3. 灵活性:Databricks是一个托管式的解决方案,这意味着你需要将数据和计算任务迁移到Databricks平台上进行处理。对于一些有特殊需求或已经有自己的数据处理基础设施的企业来说,可能更倾向于使用自建的解决方案,以便更好地控制和定制数据处理流程。
  4. 生态系统:Databricks虽然提供了一些内置的功能和工具,但是相比其他云计算品牌商,它的生态系统可能相对较小。这意味着在使用Databricks时,你可能无法享受到其他云计算品牌商提供的丰富的生态系统和第三方集成。

尽管我不选择使用Databricks作为我的数据集市,但这并不意味着Databricks不是一个好的解决方案。对于那些已经熟悉Spark和有足够预算的企业来说,Databricks可能是一个非常强大和高效的选择。然而,对于其他一些情况,可能需要综合考虑以上因素来决定是否选择Databricks作为数据集市解决方案。

请注意,以上回答仅代表个人观点,不涉及任何特定品牌商的推荐。

页面内容是否对你有帮助?
有帮助
没帮助

相关·内容

  • 一篇文章搞懂数据仓库:数据仓库的8个发展阶段

    数据仓库最早的概念可以追溯到20世纪70年代MIT的一项研究,该研究致力于开发一种优化的技术架构并提出这些架构的指导性意见。第一次,MIT的研究员将业务系统和分析系统分开,将业务处理和分析处理分成不同的层次,并采用单独的数据存储和完全不同的设计准则。同时,MIT的研究成果与80年代提出的信息中心(InformationCenter)相吻合:即把那些新出现的、不可以预测的、但是大量存在的分析型的负载从业务处理系统中剥离出来。但是限于当时的信息处理和数据存储能力,该研究只是确立了一个论点:这两种信息处理的方式差别如此之大,以至于它们只能采用完全不同的架构和设计方法。

    03

    数据仓库系列之维度建模

    上一篇文章我已经简单介绍了数据分析中为啥要建立数据仓库,从本周开始我们开始一起学习数据仓库。学习数据仓库,你一定会了解到两个人:数据仓库之父比尔·恩门(Bill Inmon)和数据仓库权威专家Ralph Kimball。Inmon和Kimball两种DW架构支撑了数据仓库以及商业智能近二十年的发展,其中Inmon主张自上而下的架构,不同的OLTP数据集中到面向主题、集成的、不易失的和时间变化的结构中,用于以后的分析;且数据可以通过下钻到最细层,或者上卷到汇总层;数据集市应该是数据仓库的子集;每个数据集市是针对独立部门特殊设计的。而Kimball正好与Inmon相反,Kimball架构是一种自下而上的架构,它认为数据仓库是一系列数据集市的集合。企业可以通过一系列维数相同的数据集市递增地构建数据仓库,通过使用一致的维度,能够共同看到不同数据集市中的信息,这表示它们拥有公共定义的元素。

    03

    ❤️ 爆肝三万字《数据仓库体系》轻松拿下字节offer ❤️【建议收藏】

    🍅 作者主页:不吃西红柿 🍅 简介:CSDN博客专家🏆、信息技术智库公号作者✌  华为云享专家、HDZ核心组成员。 简历模板、PPT模板、学习资料、面试题库、技术互助。 目录 🍅 信息技术智库 🍅 ---- 文章很长,前言一定要看 拥有本篇文章,意味着你拥有一本完善的书籍,本篇文章整理了数据仓库领域,几乎所有的知识点,文章内容主要来源于以下几个方面: 源于「数据仓库交流群」资深数据仓库工程师的交流讨论,如《sql行转列的千种写法》。 源于群友面试大厂遇到的面试真题,整理投稿给我,形成《面试题库》。 源于笔

    02

    系统架构师论文-论异构数据库的集成

    本文讨论了某数据集市项目的数据集成方法与过程。该系统在2008年12月启动,在2009年5月正式上线使用。该系统是以oracle系统为主要的数据库,同时集成DB2系统中的数据。每天的话费清单系在DB2数据库中存储,通过E71调度程IWEDB2中的数据进行汇总并把结果写入到ORACLE数据仓库中。本文首先讨论了建立数据集市项目异构数据库的两个数据库系统的背景以及用户対该项目的需求。接着讨论了使用Perl技术来集成两个数据库中的业务逻辑的过程,并说明了该技术在集成过程中出现的问题,如:数据分层,E71调度程序改造,以及参数化SQL处理等问题。最后讨论了该集成方法的优点和缺点,并対改进该项目提出了优化Perl技术的设想。在本次的项目开发过程中,我主要担任了系统分析与设计的工作。

    01
    领券