Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >2021年大数据基础(一):大数据概念

2021年大数据基础(一):大数据概念

作者头像
Lansonli
发布于 2021-10-11 07:25:48
发布于 2021-10-11 07:25:48
7120
举报
文章被收录于专栏:Lansonli技术博客Lansonli技术博客

大数据概念

最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,大数据是当前很热的一个词。这几年来,云计算、继而大数据,成了整个社会的热点,大数据究竟是什么东西?有哪些相关技术?对普通人的生活会有怎样的影响?我们来一步步弄清这些问题。

在讲什么是大数据之前,我们首先需要厘清数据的基本概念。

数据

数据是可以获取和存储的信息,直观而言,表达某种客观事实的数值是最容易被人们识别的数据(因为那是“数”)。但实际上,人类的一切语言文字、图形图画、音像记录,所有感官可以察觉的事物,只要能被记下来,能够查询到,就都是数据(data)。

随着互联网快速发展、智能手机以及“可佩带”计算设备的出现,我们的行为、位置,甚至身体生理数据等每一点变化都成为了可被记录和分析的数据。这些新技术推动着大数据时代的来临,各行各业每天都在产生数量巨大的数据碎片,数据计量单位已从Byte、KB、MB、GB、TB发展到PB、EB、ZB、YB甚至BB来衡量。

常见数据存储单位

1Byte = 8bit    1K(千)= 1024Byte  1MB(兆)=1024K  1G(吉) = 1024M

1T(太)=1024G   1P(拍)=1024T     1E(艾)=1024P     1Z(泽)=1024E

1Y (尧)=1024Z   1B(布)=1024Y     1N(诺)=1024B    1D(刀)=1024N

大数据

大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

数据分析的前提是有数据,数据存储的目的是支撑数据分析。究竟怎么去存储庞大的数据量,是开展数据分析的企业在当下面临的一个问题。传统的数据存储模式存储容量是有大小限制或者空间局限限制的,怎么去设计出一个可以支撑大量数据的存储方案是开展数据分析的首要前提。

当解决了海量数据的存储问题,接下来面临的海量数据的计算问题也是比较让人头疼,因为企业不仅追求可以计算,还会追求计算的速度、效率。

以目前互联网行业产生的数据量级别,要处理这些数据,就需要一个更好、更便捷的分析计算方式了。传统的显然力不从心了,而且效率也会非常低下。这正是传统数据分析领域面临的另一个挑战,如何让去分析、计算。这个时候就需要有新的技术去解决这些问题,这个技术就是大数据。

大数据主要解决的问题: 海量数据的存储和海量数据的计算问题

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2021/05/22 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
一文了解大数据生态体系-Hadoop
大数据(big data):指无法在一定时间范围内用常规软件工具进行捕捉、管理 和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程 优化能力的海量、高增长率和多样化的信息资产。
架构狂人
2023/08/16
9120
一文了解大数据生态体系-Hadoop
大数据基本概念及技术
关注我的人都成为了月薪5w以上的技术大牛 大数据是当前很热的一个词。这几年来,云计算、继而大数据,成了整个社会的热点,不管什么,都要带上“大数据”三个字才显得时髦。大数据究竟是什么东西?有哪些相关技术
企鹅号小编
2018/02/01
3.4K0
大数据基本概念及技术
什么是大数据?2022大数据时代
数据分析离不开数据。百科对数据(data)的定义:是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。数据可以是连续的值,比如声音、图像,称为模拟数据;也可以是离散的,如符号、文字,称为数字数据。
陶然同学
2023/02/24
1.9K0
什么是大数据?2022大数据时代
大数据,云计算和物联网的关系图_大数据和物联网的关系
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。
全栈程序员站长
2022/11/08
2.2K0
大数据,云计算和物联网的关系图_大数据和物联网的关系
大数据概况及Hadoop生态系统总结
大数据(big data):指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
全栈程序员站长
2022/08/30
6750
大数据概况及Hadoop生态系统总结
大数据的安全底线
当企业迈进大数据时代,信息安全面临多重挑战。数据大集中的安全隐患重重,而大数据不仅被用来找出潜在威胁,也被黑客用来实现更精准的打击。大数据来袭,企业不仅要学习如何挖掘数据价值,使其价值最大化,还要统筹安全部署,以免遭到更强有力的攻击,降低企业风险。 大数据会捅大娄子? 毫无疑问,企业正在拥抱大数据,并且将大数据挖掘和分析能力作为企业核心竞争力的关键。Gartner一个悲观的预测认为:到2015年,超过85%的财富500强企业将无法有效利用大数据带来的竞争优势。Garnter认为,大数据不仅是
小莹莹
2018/04/18
8400
计算机基础(一)
计算机基础(一)     最近准备配置一台台式机,就看了一下《鸟哥的linux私房菜:基础学习篇 (第四版)》,觉得里面写的挺好,本篇博客均摘自此书。 一、简介 1、概念 1.电脑     所谓的电脑就是一种计算机,而计算机其实是:接受使用者输入指令与数据,经由中央处理器的数学与逻辑单元运算处理后,以产生或储存成有用的信息。 2.位     位:指的是CPU一次数据读取的最大量。     64位CPU代表CPU一次可以读写64bits的数据,     32位CPU则是CPU一次只能读取32位的意思。    
云飞扬
2018/06/19
9780
大数据
基于海量数据的存储与处理面临挑战,TB级到PB级; 行业技术标准的日益形成,Hadoop; 趋势:
matt
2022/10/25
3640
大数据
大数据,第三只眼看安全
随着互联网的飞速发展,信息化已经无处不在,人类正在由IT时代进入DT时代,大数据在不断影响着各个行业,即将开启一次重大的时代转型。就像蒸汽机带来工业革命一样,大数据正在改变我们的生活以及理解世界的方式,一个大规模生产、分享和应用数据的时代正在开启。 如何利用大数据改变传统安全思维,充分发挥大数据的价值,应对各种高级持续威胁和日益复杂化的网络安全形势,是对安全而言需要重点关注的问题。而大数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山的一角,绝大部分都隐藏在表面之下。对与安全威胁而言也是如此,当前的
安恒信息
2018/04/11
1.1K0
大数据,第三只眼看安全
【数据分析】大数据下的用户行为分析
1. Consumer behaviour is the study of when,why,how and where people do or don't buy a product。 用户行为一般指用户通过中间资源,购买、使用和评价某种产品的记录。同时辅以用户、资源、产品自身及环境的信息。 用户行为记录一般可以表示一组属性的集合:{属性1,属性2,...,属性N} 2. 用户行为分析主要是研究对象用户的行为。数据来源包括用户的日志信息、用户主体信息和外界环境信息。通过特定的工具对用户在互联网/移动互联
陆勤_数据人网
2018/02/27
2.7K0
大数据_03【大数据基础知识】
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/135887.html原文链接:https://javaforall.cn
全栈程序员站长
2022/08/19
2680
大数据_03【大数据基础知识】
大数据和云计算之间的区别
云计算爱好者
2018/01/03
2.8K0
鱼和熊掌可以兼得,云原生开启“数据库大数据一体化”新时代
允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 10月23日数据湖高峰论坛上,阿里巴巴集团副总裁、阿里云智能数据库产品事业部负责人、达摩院数据库与存储实验室负责人李飞飞表示:“云原生作为云计算领域的关键技术与基础创新,正在加速数据分析全面进入数据库大数据一体化时代”。 △ 阿里巴巴集团副总裁、阿里云智能数据库产品事业部负责人李飞飞 他表示,随着数字化转型进程深入推进,企业的数据存储、处理、增长速度发生了巨大的变化,传统数据分析系统在成本、规模、数据多样性等方面面临很大的挑战。云计算的发展正在加
量子位
2023/03/10
4470
鱼和熊掌可以兼得,云原生开启“数据库大数据一体化”新时代
大数据5大关键处理技术
大数据已经逐渐普及,大数据处理关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全等)。
程序狗
2021/03/12
10.2K0
大数据5大关键处理技术
大数据的核心是什么?云技术和BI?
关于大数据和云计算的关系人们通常会有误解。而且也会把它们混起来说,分别做一句话直白解释就是:云计算就是硬件资源的虚拟化;大数据就是海量数据的高效处理。如果做一个更形象的解释,云计算相当于我们的计算机和操作系统,将大量的硬件资源虚拟化之后再进行分配使用;大数据则相当于海量数据的“数据库”。
加米谷大数据
2019/01/09
1.3K0
为什么大数据应用需要敏捷?敏捷大数据方法论
本文系投稿作品 作者 | 杜圣东 大数据文摘欢迎各类优质稿件 请联系tougao@bigdatadigest.cn 前段时间有报道称,有学者质疑“大数据”理论,也有硅谷公司负责人质疑大数据应用的效果。结合2011年Gartner关于BI(Business Intelligence)应用70%-80%都失败的一个调查结论(这里的fail是夸张的说法,更确切地讲应该是没有达到预期效果),本文就来谈谈为什么会出现这样的问题,大数据应用落地的瓶颈是什么?为什么大数据应用容易失败?为什么大数据应用需要敏捷?敏捷
大数据文摘
2018/05/24
1K0
Hadoop(一)之初识大数据与Hadoop
前言   从今天起,我将一步一步的分享大数据相关的知识,其实很多程序员感觉大数据很难学,其实并不是你想象的这样,只要自己想学,还有什么难得呢?   学习Hadoop有一个8020原则,80%都是在不断
用户1195962
2018/01/18
1.4K0
Hadoop(一)之初识大数据与Hadoop
大数据学习笔记0:大数据基本框架
这是我的学习笔记,大量摘抄网上、书本里的内容,将我自己认为关联度较高的内容呈现上来。
泊浮目
2023/12/30
2810
大数据应用导论 Chapter1 | 大数据技术与应用概述
下面是一些机构的定义: 维基百科: 传统数据处理应用软件不足以处理的大型而复杂的数据集; 包含的数据大小超过了传统软件在可接受时间内处理的能力。 互联网数据中心(IDC): 为了能够更经济地从高频率、大容量、不同结构和类型的数据中获取价值而设计的新一代架构和技术。
不温卜火
2020/10/28
1.1K0
大数据应用导论 Chapter1 | 大数据技术与应用概述
大数据架构:全网最全大数据架构生态
随着大数据行业的发展,大数据生态圈中相关的技术也在一直迭代进步,作者有幸亲身经历了国内大数据行业从零到一的发展历程,通过本文希望能够帮助大家快速构建大数据生态圈完整知识体系。
Freedom123
2024/03/29
8720
大数据架构:全网最全大数据架构生态
相关推荐
一文了解大数据生态体系-Hadoop
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档