首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >普通人如何全面了解大数据的特点,意义和发展前景

普通人如何全面了解大数据的特点,意义和发展前景

作者头像
用户7656790
发布于 2020-08-13 07:11:59
发布于 2020-08-13 07:11:59
1K00
代码可运行
举报
运行总次数:0
代码可运行

参考尚硅谷Hadoop公开课教程

1 大数据概念

对于“大数据”(Big data)研究机构Gartner给出了定义,“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。

从技术上看,大数据云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘,但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

随着云时代的来临,大数据(Big data)也吸引了越来越多的关注。《著云台》的分析师团队认为,大数据(Big data)通常用来形容一个公司创造的大量非结构化数据和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像MapReduce一样的框架来向数十、数百或甚至数千的电脑分配工作。

大数据需要特殊的技术,以有效地处理大量的容忍经过时间内的数据。适用于大数据的技术,包括大规模并行处理(MPP)数据库、数据挖掘电网、分布式文件系统、分布式数据库、云计算平台、互联网和可扩展的存储系统

最小的基本单位是bit,按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB,它们按照进率1024(2的十次方)来计算:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
8bit= 1Byte

1KB= 1,024 Bytes

1MB= 1,024 KB = 1,048,576 Bytes

1GB= 1,024 MB = 1,048,576 KB

1TB= 1,024 GB = 1,048,576 MB

1PB= 1,024 TB = 1,048,576 GB

1EB= 1,024 PB = 1,048,576 TB

1ZB= 1,024 EB = 1,048,576 PB

1YB= 1,024 ZB = 1,048,576 EB

1BB= 1,024 YB = 1,048,576 ZB

1NB= 1,024 BB = 1,048,576 YB

1 DB = 1,024 NB = 1,048,576 BB

2 大数据特点(4V)

1、Volume (大量)

截至目前,人类生产的所有印刷材料的数据量是200PB,而历史上全人类总共说过的话的数据量大约是5EB。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。

2、Velocity (高速)

这是大数据区分于传统数据挖掘的最显著特征。根据IDC的"数字宇宙”的.报告,预计到2020年,全球数据使用量将达到35.2ZB。在如此海量的数据面前,处理数据的效率就是企业的生命。天猫双十一: 2017年3分01秒,天猫交易额超过100亿

3、Variety (多样)

这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以数据库/文本为主的结构化数据,非结构化数据越来越多,包括网络日志、音频、视频、图片、地理位置信息等,这些多类型的数据对数据的处理能力提出了更高要求。

4、Value (低价值密度)

价值密度的高低与数据总量的大小成反比。数据量越大我们越要从中筛查出对我们有用的价值数据。如何快速对有价值数据"提纯”成为目前大数据背景下待解决的难题

3 大数据应用场景 1、物流仓储, 大数据分析系统助力商家精西细化运营, 提升销量节约成本。

2、零售:分析用户消费习惯,为用户购买商品提供方便,从而提升商品销量。 经典案例,子尿布+啤酒

3、旅游:深度结合大数据能力与旅游行业需求,共建旅游产业智慧管理、智慧服务和智慧营销的未来。

4、商品广告推荐:给用户推荐可能喜欢的商品

5、保险:海量数据挖掘及风险预测,助力保险行业精准营销,提升精细化定价能力。

6、金融:多维度体现用户特征,帮助金融机构推荐优质客户,防范欺诈风险。

7、房产:大数据全面助力房地产行业,打造精准投策与营销,选出更合适的地,建造更合适的楼,卖给更合适的人。

8、人工智能:

4 大数据发展前景

1、党的十八大提出"实施国家大数据战略”,国务院印发《促进大数据发展行动纲要》,大数据技术和应用处于创新突破期,国内市场需求处于爆发期,我国大数据产业面临重要的发展机遇。

2、党的十九大提出"推动互联网、大数据、人工智能和实体经济深度融合"

3、国际数据公司IDC预测,到2020年, 企业基于大数据计算分析平台的支出将突破5000亿美元。目前,我国大数据人才只有46万,未来3到5年人才缺口达150万之多

4、2017年北京大学、中国人民大学、北京邮电大学等25所高校成功申请开设大数据课程。

5、大数据属于高新技术,大牛少,升职竞争小;

6、在北京大数据开发T程师的平均薪水已经到24060元(数据统计来职友集) ,,而且目前还保持强劲的发展势头。

7、智联招聘网站上的大数据工程师薪水如下

5 大数据部门业务流程分析

大数据部门业务流程分析如图所示。

6.大数据部门组织结构(重点)

大数据部门组织结构,适用于大中型企业,如图2-18所示。

结束!!!

END

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-08-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 五角钱的程序员 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
大数据概论
用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的
用户11332765
2024/10/28
1710
大数据概论
企业案例04:AI时代分布式存储产品架构长什么样
根据 2025年数据中心(IDC)统计报告 <<IDC专题报告:AIDC周期来临,各厂竞逐份额.pdf>>
早起的鸟儿有虫吃
2025/08/02
1600
企业案例04:AI时代分布式存储产品架构长什么样
一文了解大数据生态体系-Hadoop
大数据(big data):指无法在一定时间范围内用常规软件工具进行捕捉、管理 和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程 优化能力的海量、高增长率和多样化的信息资产。
架构狂人
2023/08/16
1.1K0
一文了解大数据生态体系-Hadoop
从Hadoop到Spark、Flink,大数据处理框架十年激荡发展史
当前这个数据时代,各领域各业务场景时时刻刻都有大量的数据产生,如何理解大数据,对这些数据进行有效的处理成为很多企业和研究机构所面临的问题。本文将从大数据的基础特性开始,进而解释分而治之的处理思想,最后介绍一些流行的大数据技术和组件,读者能够通过本文了解大数据的概念、处理方法和流行技术。
PP鲁
2019/12/25
4.4K0
【Hadoop学习笔记】——Hadoop基础
版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/huyuyang6688/article/details/73457827
DannyHoo
2018/09/13
1K0
【Hadoop学习笔记】——Hadoop基础
大数据简介
1、数据保存在数据库中。处理时以处理器为中心,应用程序到数据库中检索数据再进行计算(移动数据到程序端)
全栈程序员站长
2022/08/19
1.2K0
大数据简介
大数据_03【大数据基础知识】
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/135887.html原文链接:https://javaforall.cn
全栈程序员站长
2022/08/19
3070
大数据_03【大数据基础知识】
The BigData,Hadoop组成及生态
随着科技的发展,我们在网上留下的数据越来越多,大到网上购物、商品交易,小到浏览网页、微信聊天、手机自动记录日常行程等,可以说,在如今的生活里,只要你还在,你就会每时每刻产生数据,但是这些数据能称为大数据么?不,这些还不能称为大数据。那么大数据数据到底是什么呢?
Simon郎
2021/05/21
5000
2021年大数据基础(二):​​​​​​​​​​​​​​大数据的特点(5v)
大 数据的采集,计算,存储量都非常的庞大。是数据体量巨大(Volume)。截至目前,人类生产的所有印刷材料的数据量是200PB(1PB=1024TB),而历史上全人类说过的所有的话的数据量大约是5EB(1EB=1024PB)。当前,典型个人计算机硬盘的容量为TB量级,而一些大企业的数据量已经接近EB量级。
Lansonli
2021/10/11
1.1K0
终于有人把大数据和边缘计算说清楚了
我们知道网络无秘密,在网页上敲击的每一个数据,都会被自动记录。当数据的积累量足够大的时候,量变引起了质变。“大数据”通过对海量数据有针对性的分析,赋予了互联网智商,这使得互联网的作用,从简单的数据交流和信息传递,上升到基于海量数据的分析,一句话“他开始思考了”。那么大数据到底是什么?他和边缘计算有什么关系呢?一起来了解一下!
边缘计算
2019/07/03
1.6K0
终于有人把大数据和边缘计算说清楚了
大数据概念
大数据概念 最早提出“大数据”时代到来的是全球知名咨询公司麦肯锡,大数据是当前很热的一个词。这几年来,云计算、继而大数据,成了整个社会的热点,大数据究竟是什么东西?有哪些相关技术?对普通人的生活会有怎
Lansonli
2021/10/01
6500
大数据概念
【观点】大数据,真不是概念炒作
刚开始,以为大数据概念,只是数据仓库、数据分析改头换面后的一次作秀,只是商业智能、数据挖掘乔装打扮后的一个噱头。 本想无视它的热烈炒作和美丽包装,用挑剔的眼光审视它的思想核心。最终发现,它的横空出世,包涵着真知灼见。 大数据,涵盖了从数据采集、数据处理,到数据分析、数据挖掘的全过程。 大数据最根本的推力,来源于技术突破。尤其是内存容量、存储介质、网络速度、CPU性能的集体突破和胜利会师。 大数据最根本的拉力,来源于应用需求。尤其是KB、MB、GB,到TB、PB、EB,到ZB、YB、BB的几何级数膨胀的信息量
CDA数据分析师
2018/02/08
8090
大数据只是因为"大"么?
大数据是具有海量、高增长率和多样化的信息资产,它需要全新的处理模式来增强决策力、洞察发现力和流程优化能力。
鲜枣课堂
2019/07/22
5380
大数据只是因为"大"么?
什么是大数据?看这一篇就足够了!
近几年,"大数据"这个词以烈火燎原之势,在互联网领域迅速的扎根生长。尤其是"大数据"时代的到来,刺激了各大行业发展,也增加了很多相关岗位。许多人了解情况之后,毅然决定学习大数据技术,进入相关行业,而有的人还在观望,不知道未来大数据前景怎么样?今日博主有幸在1024"程序员节"上,为大家(更多是有一定编程能力的大数据学者)科普一下与大数据相关的知识!
大数据梦想家
2021/01/21
9800
51单片机开发板(W25Q16学习)
---恢复内容开始--- 今天测试开发板的W25Q16(16Mbit--Flash)写一篇文章备忘一下 先说一下容量的单位 计算机存储单位一般用B,KB、MB、GB、TB、PB、EB、ZB、YB、BB来表示,它们之间的关系是:     位 bit (比特)(Binary Digits):存放一位二进制数,即 0 或 1,最小的存储单位。    字节 byte:8个二进制位为一个字节(B),最常用的单位。 1KB(Kilobyte 千字节) = 2^10 B = 1024 B;     1MB(Megab
杨奉武
2018/04/13
1.1K0
51单片机开发板(W25Q16学习)
带您了解大数据
第三次浪潮的华彩乐章   1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。大约从2009年开始,“大数据”成为互联网信息技术行业的流行词汇。 什么是大数据   1980年,著名未来学家阿尔文·托夫勒便在《第三次浪潮》一书中,将大数据热情地赞颂为“第三次浪潮的华彩乐章”。大约从2009年开始,“大数据”成为互联网信息技术行业的流行词汇。   大数据,或称巨量数据、海量数据;是由数量巨大、结构复杂、类型众多数据构成的数据集合,是基于云计算的数据处
小莹莹
2018/04/23
7810
带您了解大数据
纯干货收藏版丨数据处理之数据精简概述(附大数据存储单位)
本文导读:数据处理、数据挖掘、数据分析、大数据处理、数据精简、大数据存储单位基础知识整理,欢迎收藏。 本文概述:一、数据处理基础知识;二、大数据时代数据处理分支——数据精简;三、附录:大数据存储单位(
灯塔大数据
2018/04/10
2.2K0
纯干货收藏版丨数据处理之数据精简概述(附大数据存储单位)
数据浩若繁星 细数10个云指数的关键数字
如今,网络越来越发达,全球大数据产业日趋活跃,数据呈现井喷式增长,人们日常工作生活的每一个数据都源源不断的通过网络传送着,为了给个人和企业提供资金更多的云服务,云流量的增长比数据中心流量增长速度更快。 根据全球云指数的最新报告表明,公共云和私有云增长的流量将占数据中心增长总流量的80%,这将从2014年2.1ZB增长到2019年的8.6ZB。而传统的作负载将以很慢的速度增长,从2014年的1.3ZB增长到2019年的1.8ZB。 “全球云指数的报告更加凸显了云计算成为全球区域趋势,越来越成为了主流解决方案。
静一
2018/03/23
7260
Redis---NoSQL数据库介绍
1、解决功能性的问题:Java、Jsp、RDBMS、Tomcat、HTML、Linux、JDBC、SVN
大忽悠爱学习
2021/11/15
4180
Redis 数据库简介
Web1.0的时代,数据访问量很有限,用一夫当关的高性能的单点服务器可以解决大部分问题。
用户9615083
2022/12/25
6100
Redis 数据库简介
相关推荐
大数据概论
更多 >
LV.0
这个人很懒,什么都没有留下~
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档