首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
  • 您找到你想要的搜索结果了吗?
    是的
    没有找到

    痛并快乐着:浅谈大数据时代的分布式存储架构

    从全球知名咨询公司麦肯锡宣称“大数据”时代的到来,时至今日,数据量已经几何倍数的翻增,麦肯锡称:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。 大数据的第一个特征是数据量大,大数据的起始计量单位至少是P、E甚至ZB级别;第二个特征是数据类型繁多,包括网络日志、音频、视频、图片、地理位置信息等等。同时,海量多类型的数据对数据的处理能力提出了更高的要求,不仅要提供海量的数据存储空间,又要满足多种类文件的高效存储。 目前,解决这种需求最常用的方式就是采用分布式存储系统。 分布式存储存放的数据

    07

    腾讯云大数据技术介绍-云 HDFS

    大数据虽然是一个比较宽泛的词,但对于我们来说其实可以简单理解为“海量数据的存储与处理”。之所以人们专门大数据这个课题,是因为海量数据的处理和较小量级数据的处理是不一样的,例如我们对一个mysql表中的数据进行查询,如果是100条数据,那对于mysql来说毫无压力,但如果是从十亿条数据里面定位到一条呢?情况就变得复杂了,换个角度想,十亿条数据是否适合存在mysql里也是尚待讨论的。实时上从功能角度的出发,我们完全可以使用以往的一些技术栈去处理这些问题,只不过高并发高可用高实时性这些都别想了。接下来要介绍的这些腾讯大数据组件就是在这一个问题背景下一个个诞生的。

    012

    存储领域基于场景的技术创新案例分析

    随着互联网深入生活的方方面面,企业需要处理的数据更多的来自外部而非内部,基于数据驱动的商业模式,平台主导着数字经济的发展。作为数字经济的中介和基础设施,在平台上的互动会产生数据,平台又能对这些数据进行收集、分析和使用,进而实现价值创造。平台覆盖面越大,上传的物理范围和数据总量就越大,由此我们需要思考海量数据从四面八方高效上传的问题。一个应用开发者要存储数据,方案之一是把数据存在某一个资源池,比如放到上海,靠近华东地区的体验是比较好的,离华东比较远的用户体验就相对较差。方案之二是自行调度,选择几个资源池分布在全国范围内,东北地区放在长春,华北放在北京等。这种情况下,作为应用开发者,当终端发起请求时首先要找到平台,平台根据发起请求的位置,再将离终端最近的资源池返回给终端,最后终端才开始访问资源池,如此一来,终端和平台之间增加了延迟。同时要自己维护这种关系,当数据量很大的时候,维护的成本和难度是很高的,针对这个问题,我们需要一个能就近写入数据的解决方案。

    01
    领券