前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >0511-正式合并完成后Cloudera推出新的大数据平台CDP

0511-正式合并完成后Cloudera推出新的大数据平台CDP

作者头像
Fayson
发布于 2019-11-28 15:34:55
发布于 2019-11-28 15:34:55
1.5K0
举报
文章被收录于专栏:Hadoop实操Hadoop实操

Cloudera在今天主要阐述了将要推出的统一旗舰产品CDP(Cloudera Data Platform),它也是Cloudera新兴的“企业数据云”战略的核心。同时宣布的还有他们将继续支持现有的CDH和HDP平台一直到2022年,同时在这3年对现有的产品还会进行交叉组合。

Cloudera新的CDP平台会同时支持运行在本地,私有云,以及5个最大的公有云包括Amazon,Microsoft,Google,IBM和Oracle。但Cloudera并没有披露交付CDP的时间表。

Cloudera在上周完成与Hortonworks的正式合并,透露计划将进行两次CDP的迭代,所谓CDP其实也就是之前说的统一(Unity)版本。据Cloudera的首席产品官Arun Murthy,之前Hortonworks的联合创始人描述,第一个CDP版本将包含CDH6.x和HDP3.x中的一系列组件,并将专注于运行客户现有的工作负载和数据。

“一旦我们完成并交付第一版CDP,则会开始第二个后续版本,然后你可以考虑升级和迁移到CDP,这将是一个全新的平台,”他说。“很显然,CDP的关键并不仅仅只是提供支持你现有的工作负载,同时还提供围绕关键工作负载的全新的直观感受,例如data warehousing, data flow, the edge or streaming, AI and machine learning。”

Cloudera同时还宣布,将会支持CDH5.x/6.x和HDP3.x直到2022年1月,这与之前的说法一致。Cloudera相信3年时间足够让现有的客户规划如何从旧的CDH和HDP迁移到统一平台CDP并进行实施。对HDP 2.x的支持将在此之前结束。

今天发布的另一个消息是:Hortonworks Data Flow(HDF)将集成到CDH,从而可以在CDP平台推出之前,让CDH的客户能够受益于Hortonworks的实时数据抽取和流计算技术。

同样的,Cloudera Data Science Workbench(CDSW)也会整合到HDP,CDSW是Cloudera的机器学习和AI开发工具。这可以让HDP的客户开始使用CDSW,有趣的是,没有关于CDH客户使用IBM Data Science Experience产品的消息,这是Hortonworks之前比较推荐的ML和AL开发工具,尽管很少有人真正期望Cloudera支持它。

Cloudera CPO Arun Murthy绘制了CDP迁移路径

除了提供SQL分析和机器学习,CDP平台同时还需要为客户保证数据安全数据治理,对于复杂的CDP来说这其实并非易事。

“要实现这一目的,关键是帮助你运行所有这些工作负载并能够管理这些数据,无论是在本地,私有云还是公有云,”Murthy说。“其中很大一部分是包含安全和治理的,这样你不用担心将你的数据或工作负载从一个公有云迁移到另一个公有云,或者从物理本地迁移到公有云。”

Cloudera Tom Reilly表示,云计算在Cloudera的前瞻战略中占据重要位置,实际上也是投资和增长的第一大领域。但Cloudera的战略也不是完全基于云,因为这不是企业所需要的。

“几乎每个企业都在走向公有云,”Reilly说。“他们喜欢云提供的简单和弹性。但他们也知道如果只是基于公有云服务也会是一个非常昂贵的选择,无论是在短期内因意外导致的运营成本提升,还是长期来看可能被锁定。”

“很明显,客户都系统同时拥有 - 云选择和云体验,”Reilly继续道。“我们也同意。在Cloudera,我们始终在拥抱云。我们相信,从边缘到AI的机器学习和分析,在所有云(公有和私有)中始终如一地无缝运行,正是企业所需要的。这就是我们所说的企业数据云(enterprise data cloud)。”

Cloudera机器学习GM Hilary Mason说,CDP开发期间,HDP用户也可以使用CDSW

Cloudera机器学习GM Hilary Mason表示,Cloudera希望帮助客户构建跨越多学科和交付模式的智能应用程序,这在大规模场景下并非易事。

“在Cloudera我们看到一些成功的组织在其业务中嵌入机器学习和人工智能,以改善客户体验,自动化运营,降低风险并创造真正的价值,”她说。“这不是建立一个应用或者模型。优秀的机器学习需要团队,组织和基础架构来构建和管理数百甚至数千个应用程序和模型。”

“这需要能够快速进行实验并采取行动,降低整个组织的预测成本,”她继续道。“在Cloudera,我们将这种趋势称为AI的工业化。这是我们的战略重点,实现了一个目标即快速和简单的识别机器学习申请,然后构建,部署和维护,并且很好理解以及在整个业务中保持一致。”

原文参考: https://www.datanami.com/2019/01/10/cloudera-unveils-cdp-talks-up-enterprise-data-cloud/

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-01-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Hadoop实操 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大数据先驱Cloudera拥抱云计算,探索后Hadoop时代的下一代数据平台 | Q推荐
未来十年,企业数据管理模式将如何进化?Cloudera 的答案是 — 企业数据云。 在数据爆炸时代“掘金” 数字正在“吞噬”世界。 过去的十几年里,我们进入了一个数据爆炸、信息过载的时代。 数据规模在以惊人的速度增长。 2006 年,个人用户才刚刚迈入 TB 时代,当年全球共产生了约 180EB(1 EB = 1024 TB)的数据;2012 年,这个数字增长到了 3.7 ZB(1ZB=10 亿 TB)。 据国际权威机构 Statista 统计和预测,2020 年全球数据产生量预计达到 47ZB。而到 20
深度学习与Python
2023/04/01
6530
大数据先驱Cloudera拥抱云计算,探索后Hadoop时代的下一代数据平台 | Q推荐
Cloudera和Hortonworks 合并的整体梳理
0. 下一代的企业数据云     将创建世界领先的下一代数据平台提供商,涵盖多云,内部部署和Edge。该组合为混合云数据管理建立了行业标准,加速了客户采用,社区发展和合作伙伴参与。     我们两家公司的业务具有很强的互补性和战略性。通过将Hortonworks在端到端数据管理方面的投资与Cloudera在数据仓库和机器学习方面的投资结合起来,我们将提供业界首个从Edge到AI的企业数据云。这一愿景将使我们的公司能够在追求数字化转型的过程中推动我们对客户成功的共同承诺。     两个公司希望通过合并,创造出一个年收入达到 7.2 亿美元的新实体,并制定清晰的行业标准,成为下一代数据平台领先者,提供业界第一个企业级数据云,提高公共云的易用性和灵活性     一直以来 Hortonworks 团队投资于实时数据流和数据摄取以支持边缘的物联网使用案例,而 Cloudera 更专注于 AI 和 ML 领域,使数据科学家能够使用极其复杂的工具来自动化机器学习工作流。     Cloudera新的CDP平台会同时支持运行在本地,私有云,以及5个最大的公有云包括Amazon,Microsoft,Google,IBM和Oracle     第一个CDP版本将包含CDH6.x和HDP3.x中的一系列组件,并将专注于运行客户现有的工作负载和数据     两家公司对外正式宣称统一版本会基于最新的HDP3.0+CDH6.0     Hadoop 商业化最典型的公司就是Hadoop的三驾马车——Hortonworks、Cloudera和MapR。     昨天我们是 Hortonworks,今天,随着我们合并的正式完成,我们是 Cloudera——现在是全球第二大开源软件公司。”,目前全球第一大开源软件公司仍旧是红帽。 1. 新的趋势     1.1 企业向公有云转变(aws,azure,google cloud)         hadoop/spark 只是其一部分     1.2 云存储成本底 对象存储服务(aws s3,axure blob,google 云端存储)         比hadoop/spark 便宜了5倍     1.3 云服务器 以完全不一样的方式解决了同样的问题,运行即席查询         用户按计算时间计费,无需维护操作hadoop/spark集群     1.4 容器,kenernates和机器学习,今天在python/R语言下进行机器学习,容器与kubernates 为分布式计算提供了更加强大灵活的框架         不打算基于hadoop/spark 进行分发心得饿微服务应用程序 2. 产品影像     2.1  毫无疑问         对于一些无论是Cloudera还是Hortonworks都打包的较为通用的的组件,基本可以毫无疑问的确定会包含在统一版本中。具体包括核心的Apache Hadoop项目如MapReduce,HDFS和YARN - 以及Apache Spark,Apache Hive,Apache HBase,Apache Kafka,Apache Solr,Apache Oozie,Apache Pig,Apache Sqoop和Apache Zookeeper。             我们对新兴的对象存储项目Apache Hadoop Ozone的信心略有不足     2.2 存疑的          有一些开源项目目前仅包含在CDH或HDP中,而Cloudera也没有与之专门对标的产品,它们是否能包含在合并版中目前还存疑。比如说Apache Kudu和Apache Impala,这2个最初都是由Cloudera开发的,用于提供列式数据存储和ad hoc的分析,而最近Hortonworks引入了Apache Druid与之对应。     2.3 有争议的         Apache Ambari直接与Cloudera Manager竞争,再比如Cloudera使用Cloudera Navigator来实现数据治理和数据溯源,而Hortonworks则使用Apache Atlas。     Cloudera将清楚地意识到任何关于它想要扼杀开源功能的建议都将被认为是“大棒”,而不是“胡萝卜”,它将不会被Hortonworks客户和Apache软件基金会开发社区所接受。这是我们认为Cloudera如果想要退出开源需要很谨慎的考虑的另一个原因 - 至少在短期内如此     注:“Carrot and stick”(胡萝卜加大棒)
Freedom123
2024/03/29
1770
重磅 | Hadoop的第二个十年
https://medium.com/swlh/hadoop-evolution-decade2-ca46e5514713
Fayson
2020/02/18
6370
重磅 | Hadoop的第二个十年
0484-Cloudera和Hortonworks合并后面临的选择
Cloudera与Hortonworks两家公司在前一段时间提出来合并,虽然两家公司都同时强调两者在产品或者技术上的互补性,但其实合并后的公司也面临一些艰难的选择,可能会对各种与Hadoop相关的开源Apache项目产生较大的影响。本文主要讨论它们接下来可能会如何发展。
Fayson
2019/11/28
1.5K0
开始CDP之旅必知
最近,我的同事发布了一个通 构建投资来通 过迁移或升级到 CDP 数据中心 的博客,其中阐明了CDP私有云基础版的强大功能。现有的CDH和HDP客户可以立即从此新功能中受益。该博客重点介绍了加速CDP之旅到CDP私有云基础版的过程,包括专业服务合作和自助服务升级。
大数据杂货铺
2020/10/29
8890
开始CDP之旅必知
CDP中的运营数据库
CDP 中的 Cloudera 运营数据库( OpDB ) 提供了实时、始终可用的可扩展OpDB,它在统一的运营和仓储平台中为传统结构化数据以及新的非结构化数据提供服务。Cloudera提供了一个可运营的数据库,该数据库在统一的开源平台中为传统的结构化数据以及新的非结构化数据提供服务。
大数据杂货铺
2020/04/21
9140
CDP中的运营数据库
Cloudera宣布更新一系列机器学习产品,为数据团队提速
软件公司Cloudera今天在Strata Data伦敦会议上宣布了一系列机器学习产品更新:Cloudera Data Science Workbench 1.4,Microsoft Azure Cloudera Altus数据工程和Cloudera Enterprise 6.0。首席执行官Tom Reilly表示,这三种产品主要负责促进数据团队之间的协作。
AiTechYun
2018/07/27
4570
Cloudera宣布更新一系列机器学习产品,为数据团队提速
Cloudera独家回应:Hadoop到底怎么了?
五年前,Gartner 研究总监就曾 发文 说 Hadoop 光环幻灭;到现在,我们看到了更多的质疑文字,认为“Hadoop 气数已尽”。而这次质疑的起因是 Cloudera 和 Hortonworks 的合并,MapR 的裁员。
Fayson
2019/07/17
9170
Cloudera独家回应:Hadoop到底怎么了?
一文看懂大数据生态圈完整知识体系
👆点击“博文视点Broadview”,获取更多书讯 随着大数据行业的发展,大数据生态圈中相关的技术也在一直迭代进步,作者有幸亲身经历了国内大数据行业从零到一的发展历程,通过本文希望能够帮助大家快速构建大数据生态圈完整知识体系。 目前大数据生态圈中的核心技术总结下来如图1所示,分为以下9类,下面分别介绍。 图1 1 数据采集技术框架 数据采集也被称为数据同步。 随着互联网、移动互联网、物联网等技术的兴起,产生了海量数据。这些数据散落在各个地方,我们需要将这些数据融合到一起,然后从这些海量数据中计算出一些
博文视点Broadview
2022/08/26
6240
一文看懂大数据生态圈完整知识体系
0462-Hadoop和大数据要完蛋了吗?
几个星期以前,Hadoop时代的两大巨头Cloudera和Hortonworks宣布他们将合并。该公告声称这将是“merger of equals(平等的合并)”。看到这两个开创性的先驱能走到一起是非常有趣的。
Fayson
2018/12/17
6091
CDP-DC7.1中的 YARN:新增功能和升级方法
该博客文章将介绍客户如何将集群和工作负载迁移到新的CDP-DC7.1,以及此新版本的重点。
大数据杂货铺
2020/07/16
1.4K0
CDP-DC7.1中的 YARN:新增功能和升级方法
Hadoop已死,Hadoop万岁
最近又有很多关于“Hadoop已死”的论调,似乎每隔一段时间就会有一些类似的文章或声音。几年前Cloudera就已经停止了以Hadoop来营销自己,而是一家企业数据公司。如今,Cloudera也已进入企业数据云市场:混合/多云和多功能分析,具有通用的安全和治理,所有这些都由开源提供支持。
Fayson
2019/09/16
1.6K0
Hadoop已死,Hadoop万岁
撕掉“Hadoop”标签,Cloudera 未来还可期吗?
2000 年初,Google 的三篇论文奠定了最近二十年大数据的技术发展基调,也催生了 Hadoop 生态的发展和繁荣。借助 Hadoop 的东风,一批大数据企业成长了起来,Cloudera 便是代表之一。不过,Hadoop 势弱、Spark 和云计算快速崛起后,Cloudera 等大数据企业面临着或淘汰或转型的命运。
深度学习与Python
2021/12/28
5720
撕掉“Hadoop”标签,Cloudera 未来还可期吗?
从遗留发行版到CDP的四种升级和迁移路径
从遗留平台的发行版到CDP的所有路径的每种机制都有共同的工作、缓解风险和取得成功成果的方面。其中包括工作负载审查、测试和验证、管理服务级别协议(SLA)、以及在移动期间最大程度地减少工作负载的不可用。
大数据杂货铺
2021/07/02
1K0
Cloudera Data Platform如何帮助以数据为中心的企业IT
2019年9月在纽约举行的Strata Data会议上,Cloudera团队发布了Cloudera Data Platform。这代表了Cloudera对开源大规模数据处理的新承诺。提供最佳的Hortonworks和Cloudera产品组合,Cloudera Data Platform使组织能够在任何云或本地基础结构上统一运行大规模数据处理。这不仅对Cloudera公司而言是一个巨大的里程碑,对于世界各地的用户来说也是一个巨大的飞跃。
大数据杂货铺
2020/02/11
9870
基于投资,通过迁移或者升级到CDP-DC
Cloudera数据平台(CDP)数据中心版(CDP-DC)是Cloudera数据平台的本地版本。CDP-DC结合了Cloudera Enterprise Data Hub和Hortonworks Data Platform Enterprise的最佳服务和组件,以及在堆栈中的增加了新功能和增强功能,提供一流的本地企业数据平台。此统一分发是可扩展和可定制的平台,您可以在其中安全地运行多种类型的工作负载。
大数据杂货铺
2020/07/16
5780
基于投资,通过迁移或者升级到CDP-DC
Cloudera与Hortonworks合并完成
Hadoop大数据领域最大的两家公司Cloudera和Hortonworks在1月3日宣布,完成了所有股票的合并。新的公司会继续使用‘Cloudera’这个品牌,并且在纽交所的交易代号依旧是CLDR。
Fayson
2019/11/28
1.3K0
经过认证的技术合作伙伴解决方案可帮助客户通过CDP取得成功
8月18日,我们完成了企业数据云的愿景,即通过Cloudera 数据平台私有云( CDP 私有云) 的全面可用带来真正的混合云体验。基于Kubernetes(RedHat OpenShift)的CDP私有云将云原生的速度/简单性和经济性扩展到了本地环境,从而使连接的数据生命周期扩展到了本地环境,使IT能够更快地响应业务需求并提供坚如磐石的服务水平,这样人们就可以提高数据生产力。
大数据杂货铺
2020/09/03
7680
经过认证的技术合作伙伴解决方案可帮助客户通过CDP取得成功
CDP PvC Base的参考架构
Cloudera发布的Cloudera的数据平台(CDP)私有云基础版为用户提供了下一代混合云架构。这篇博文概述了设计和部署包含硬件和操作系统配置的集群的最佳实践,以及有关网络和安全以及与现有企业基础架构集成的指南。
大数据杂货铺
2021/07/27
1.2K0
CDP PvC Base的参考架构
Cloudera对开源的承诺
7 月 10 日,合并后的 Cloudera 宣布了新的开源许可模式,并计划对所有产品的新版本实施许可证变更,不追溯已经发布的版本。在合并之前,这两家公司是在不同的开源许可模式下发布各自的产品,新模式将 Hortonworks 和 Cloudera 之前使用的许可模式进行了整合。
Fayson
2019/07/17
3.8K1
推荐阅读
相关推荐
大数据先驱Cloudera拥抱云计算,探索后Hadoop时代的下一代数据平台 | Q推荐
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档