本文作者 耿立超,架构师,14年IT系统开发和架构设计经验,CSDN博客专家,著有《大数据平台架构与原型实现:数据中台建设实战》一书。 原文链接: https://laurence.blog.csdn.net/article/details/106851739 故事缘起 我们需要工程原型! 从2008年Hadoop成为Apache的顶级项目开始,大数据技术迎来了十多年的持续发展,其间随着Spark的异军突起,整个大数据生态圈又经历了一次“装备升级”,变得更加完善和强大。 今天,很多企业已经完成了早期对大数据
👆点击“博文视点Broadview”,获取更多书讯 最近有不少小伙伴在问有没有架构类的书单,博文菌收到了大家的需要,这就安排上! 俗话说:不想当架构师的程序员不是好程序员。成为架构师几乎是每位开发者入行初期的共同理想。 如何站在架构的视角去看代码世界,如何依托企业业务需求搭建可高用架构,云端架构的设计原则有哪些…… 本期书单为你带来今年出版的10本架构类好书,希望能够帮你建立架构思维,解开架构谜团! ---- 01 ▊《业务架构・应用架构・数据架构实战(第2版)》 温昱 著 国内知名架构专家创新
大数据已不再是一个单纯的热门词汇了,随着技术的发展大数据已在企业、政府、金融、医疗、电信等领域得到了广泛的部署和应用,并通过持续不断的发展,大数据也已在各领域产生了明显的应用价值。 企业已开始热衷于利用大数据技术收集和存储海量数据,并对其进行分析。企业所收集的数据量也呈指数级增长,包括交易数据、位置数据、用户交互数据、物流数据、供应链数据、企业经营数据、硬件监控数据、应用日志数据等。由于这些海量数据中包含大量企业或个人的敏感信息,数据安全和隐私保护的问题逐渐突显出来。而这些问题由于大数据的三大主要特性而
揭开大数据生态圈背后的真相,切实了解开发者对大数据平台的需求,用真实数据分析大数据行业发展趋势及产品方向。近日,在2014中国大数据技术大会召开前夕,CSDN特推出“2014中国大数据有奖调查”活动,旨在更全方位地洞察中国大数据产业现状,为大数据技术从业者和创业者们提供良好的参考与建议。 公司使用大数据的基本情况 时至今日,无论你是来自互联网行业、通信行业,还是金融行业、服务业或是零售业,相信都不会对大数据感到陌生。据调查报告显示,32.5%的公司正在搭建大数据平台,处于测试阶段;29.5%的公司已经在生
现在很多人都在谈论大数据,初创公司也在探索大数据,深度学习也是科学研究的一个热点。显而易见我们正面临着一场信息革命。数据正以惊人的速度增长,过去两年全世界共产生了2 ZB的数据(1 ZB=十亿 TB)。这些数据主要的来源是服务器日志的大量使用、物联网、各种传感器、社交媒体以及电子邮件。 大数据要多大? 如果你觉得你的10GB硬盘就叫大数据了,我只能说呵呵。100GB的服务器数据库也只能叫“小数据”。就算是11TB的分布式数据库也算不上是大数据。100TB的大规模并行处理系统勉强称得上是大数据。现在数据规模
2017年被称为“新零售元年”,电商与商店不再水火不容,而是联手做大全渠道零售这块蛋糕。2018年,智慧零售再次突破性发展,成为各大零售商发展的重点。
关注技术博客的读者肯定有这样感受,Spring Boot 相关的文章铺天盖地。 仿佛一切都在证明,Spring Boot 已成为Java 程序员必备技能。 未来 Spring Boot 的发展还会更好,说 Spring Boot 是当今最重要的 Java 框架也不为过。今天我们就来推荐一些李刚老师的高能课程,一站式学到并掌握Spring Boot所整合的各种技术!内容涉及: MongoDB RabbitMQ Neo4j Kafka 全文检索 即便你是入门水平,完整学习后,也将能够在企业级Spring Boo
进几年A(人工智能)B(大数据)C(云计算)发展火热,由于笔者在一二线互联网行业从事过大数据相关工作,因此决定在大数据领域对自己的所见所闻,来对该行业之外的人士所做一个讲述,以及对想进入该行业的从业人员做个简单的讲述和分享。
在业务增涨过程中,每个企业不知不觉积累积累了一些数据。无论数据是多是少,企业都希望让“数据说话”,通过对数据的采集、存储、分析、计算最终提供对业务有价值信息。
随着数据成为生产要素,数据安全风险与数字经济发展如影随形,如何解决好数据安全领域的突出问题、提升数据安全治理能力都是社会各界的关注重点。
如何对人员流动加以管控,如何准确识别潜在的传染风险,成为摆在各地防控部门面前的难题。
随着数字化转型的不断深入,在企业中,大数据平台建设是许多技术人关心的内容。随着企业的发展,数据量不断增长,原有的数据平台和数据库已经无法满足企业的需求。这时,企业需要对数据平台和数据库进行升级或迁移。但是,这个过程并不容易,需要耗费大量的时间和精力。 在大数据平台升级或迁移过程中,企业需要考虑很多因素,如数据的安全性、可靠性、稳定性等。同时,企业还需要考虑如何保证数据的一致性和完整性。如果在升级或迁移过程中出现问题,可能会导致数据丢失或损坏,给企业带来不可估量的损失。 为你给你提供更多可靠的实践案例,在即将
9月9日,由腾讯安全联合北京城市大数据研究院有限公司、中安威士(北京)科技有限公司、闪捷信息科技有限公司、北京三未信安科技有限公司、杭州世平信息科技有限公司等生态合作伙伴,共同举办的《政务大数据平台数据安全体系建设指南》(以下简称《指南》)发布会在线上举办。
日前,中国信息通信研究院正式发布《城市大数据平台白皮书》,阐述了城市大数据的概念和内涵,分析了建设城市大数据平台对于破解智慧城市建设难题的意义,并介绍了我国城市大数据平台的发展现状。
我在一次社区活动中做过一次分享,演讲题目为《大数据平台架构技术选型与场景运用》。在演讲中,我主要分析了大数据平台架构的生态环境,并主要以数据源、数据采集、数据存储与数据处理四个方面展开分析与讲解,并结合具体的技术选型与需求场景,给出了我个人对大数据平台的理解。本文是演讲内容的第一部分。 大数据平台是一个整体的生态系统,内容涵盖非常丰富,涉及到大数据处理过程的诸多技术。在这些技术中,除了一些最基础的平台框架之外,针对不同的需求场景,也有不同的技术选择。这其中,显然有共性与差异性的特征。若从整个开发生命周期的角
大数据文摘作品,转载要求见文末 作者 | Aileen、钱天培、加号 8 月 13 日至 8 月 17 日,每年一度的数据挖掘领域的顶级会议 ACM SIGKDD 2017 在加拿大的 Halifax 召开。 8月15日下午,SIGKDD中国分会组织了本次会议中的分支活动Data Science of China。这是SIGKDD继2016年后第二次举办中国专场。也是现场除了印度专场之外,另外一家完全为了一个国家举办的专场会议。 大数据文摘前方记者为你带回了三场讲座的文字报道,同时附上新鲜出炉的PPT全文。
面对复杂的大数据安全环境,需要从四个层面综合考虑以建立全方位的大数据安全体系:边界安全、访问控制和授权、数据保护、审计和监控。如下图所示:
招商引资是实现城市发展目标、构建现代化产业体系、形成发展优势的重要抓手,是促进经济社会高质量发展的重要手段和必然选择。改革开放以来,各个地方都不遗余力大力开展招商引资活动,很多经济发达地区都是招商引资活动成功开展的典范。有效的招商引资活动对于合理配置社会资源、推动地方经济更具有现实意义。
本文内容整理自《数据安全与数据要素治理研讨会》中,清华大学软件学院教授叶晓俊所做的《信息安全技术 大数据服务安全能力要求》国家标准修订思考的主题演讲。 下面由我向大家介绍由清华大学牵头制定的GB/T 35274-2017 《信息安全技术 大数据服务安全能力要求》国家标准在本次修订过程中我们的一些感想。今天汇报包括以下部分:1)标准修订的背景2)标准修订情况3)标准内容介绍4)标准修订思考5)后续工作安排。 首先回顾该标准修订的背景。2016年全国信息技术安全标准化委员会(简称信安标委)成立大数据安全标准特
今天越来越多的企业认识到,大数据的掌控和分析能力将成为竞争力的核心,企业对大数据的投资也在不断扩大。Gartner调查显示,73%的企业计划在未来两年内投资大数据。以开源Hadoop、Spark等为基础的大数据基础平台解决方案和云服务如雨后春笋不断涌现,形成了近200亿美元的市场规模。然而对于很多企业用户来说,如何评价一个大数据平台的综合能力,常常是选型、平台建设和系统优化时面临的一大挑战。目前来看,国内外还缺乏一套能体现大数据特点,又简便易行,且被工业界广泛认可的大数据平台性能测试标准与工具。 记者日前
金融科技&大数据产品推荐:BIGDAF——专业的Hadoop大数据安全防火墙
摘要:国家标准委正在着手制定首批共十项大数据标准,分别是大数据术语、大数据技术参考模型、数据交易平台交易数据描述、数据交易服务平台通用功能要求、数据能力成熟度评价模型、多媒体数据语义描述要求、科学数据引用、数据溯源描述模型、数据质量评价指标和通用数据导入接口规范。大数据企业如何发展,市场正在做出自己的选择。 8月末,北京某酒店的一场大数据企业展上,聚集了全国各地的企业。现场展示有随着《江南style》起舞的机器人,有早期科幻电影里走出来的“触摸式数据可视化屏幕”…… “你们的具体业务是做什么的”、“和大数据
摘要 国家标准委正在着手制定首批共十项大数据标准,分别是大数据术语、大数据技术参考模型、数据交易平台交易数据描述、数据交易服务平台通用功能要求、数据能力成熟度评价模型、多媒体数据语义描述要求、科学数据引用、数据溯源描述模型、数据质量评价指标和通用数据导入接口规范。大数据企业如何发展,市场正在做出自己的选择。 8月末,北京某酒店的一场大数据企业展上,聚集了全国各地的企业。现场展示有随着《江南style》起舞的机器人,有早期科幻电影里走出来的“触摸式数据可视化屏幕”…… “你们的具体业务是做什么的”、“和大数
数据猿导读 随着数据量的不断增大、接入的系统越来越多,系统加工效率逐步降低,满足内部数据分析和监管机构的监管数据不断增加的需求,农业银行在2013年开始建设完全自主可控的大数据平台。 本篇案例为数据猿
*本文原创作者:mcvoodoo,本文属FreeBuf原创奖励计划,转载请联系help@freebuf.com 随着大数据的发展,从银行到P2P再到保险、证券等,越来越多的金融企业开始建设自己的大数据平台。传统上对于数据的管理,金融界是有经验的。 但在当前以Hadoop为基础的大数据平台,接触数据的人更多,数据使用的更频繁,数据的内外交互实时,数据种类更复杂,对安全带来了更严峻的挑战。 从金融业态上来说,包括征信、消费金融、P2P、众筹、互联网银行、互联网保险等金融企业,都会需要大数据平台来支撑业务需要。
5月13日,京东硅谷研究院迎来了“京东大数据及智慧供应链技术”首次开放日。恰逢京东硅谷研究院正式乔迁山景城(Mountain View)新居,一切都是崭新的模样。 京东硅谷职场 此次开放日活动一经推出
参加活动赢取话费和一个月免费会员 点击底部阅读原文,参加PPV课玩转可视化图表,赢取话费和PPV课一个月免费会员,精品课程免费看! 目录: 什么是大数据 Hadoop介绍-HDFS、MR、Hbase
在企业数字化转型的当下,数据仓库的云端构建成为主流趋势,Gartner 预测,到2023年全球3/4的数据库都会跑在云上。
腾讯启动“疼爱医疗”战略 用大数据构建互联网+医疗连接器 近日,腾讯公司副总裁丁珂在“互联网+慢病管理”发布会上宣布正式启动“腾爱医疗”战略,将利用腾讯的社交基因和大数据能力,搭建“互联网+医疗”
近日,由金科创新社主办,全球金融专业人士协会支持的“2023鑫智奖·第五届金融数据智能优秀解决方案评选”榜单正式发布。腾讯安全申报的“SOC+基于新一代安全日志大数据平台架构的高级威胁安全治理解决方案”获评“鑫智奖·网络信息安全创新优秀解决方案”。
气象情况、土壤信息、收割机工作进度……所有的数据都在你面前的屏幕上展开,而你只需要点点鼠标就可以完成整个农场的管理。模拟农场游戏让人们坐在家里也能体会一把种田的快乐。
从教育行业的需求出发,去分析互联网时代教育行业需要了解的大数据,以及大数据平台的搭建应该注意什么?
自建开源大数据平台会随着企业数据的增长遇到:性能慢、扩容周期长、平台稳定性差、运维难、投入成本高等问题。在这里我们将从 EMR 的简介、EMR与自建Hadoop对比优势、自建迁移上云的实践案例来介绍 EMR 是如何解决这些问题的。
东方金信CEO王伟哲:金融大数据将推进全社会的诚信建设
“2016易观A10大数据应用峰会”主论坛“大数据基础框架设计-实时分析技术平台洞察与实践”上,易观CTO郭炜发表了“企业大数据的实时分析之路”的主题演讲,从技术角度给大家讲述如何用实时分析帮助企业进行数据运营。 各位嘉宾,各位领导,各位技术的小伙伴们,早上好! 非常荣幸今天站在这里和大家分享一下我们易观对于实时分析技术的一些理解。其实昨天于老师也曾经讲过,我们的实时分析会助力我们的用户资产增长,究竟什么是实时分析,实时分析究竟怎么样帮助企业能够做到他的用户资产增长。今天上午主要有几个技术大咖,后面我相信王
导·读 近日,“2016易观A10大数据应用峰会”主论坛“大数据基础框架设计-实时分析技术平台洞察与实践”上,易观CTO郭炜发表了“企业大数据的实时分析之路”的主题演讲,从技术角度给大家讲述如何用实时
导读 随着2016全国两会的到来,“大数据”再次成为媒体报道的高频词汇。利用大数据打造智慧城市、提高扶贫精准度、关注农业发展、促进居家养老服务业发展、建立两会大数据平台……两会委员“提案夹”中关于大数
近日,中国计算机学会青年计算机科技论坛(CCF YOCSEF)与腾讯公司合作主办“数据云图”犀牛鸟峰会,YOCSEF 主席胡春明、副主席韩银河、祝烈煌、芦东昕、荣誉委员袁晓如、腾讯数据平台部负责人蒋杰、高校合作总监管刚、YOCSEF全国分论坛主席、副主席、企业代表等100多位学者、专家相聚昆明,共同探讨基于大数据、人工智能等领域的创新、研发、应用、实践的产学研合作及高端人才培养之道。 CCF大数据专家委员会委员、CCF-腾讯犀牛鸟基金特邀专家、腾讯数据平台部负责人蒋杰和CCF理事、语音及语言信息处理国家
大数据这个词为什么现在这么火,个人的理解是用一个新瓶装了很多旧酒,也就是说之前的很多技术,概念或者应用现在都可以往大数据这个词里放,比如分布式处理,数据挖掘,机器学习,文本处理,语音/图像处理,个性化
随着越来越多的安全漏洞和网络欺诈事故充斥着国际新闻头条,各大企业也在积极寻找解决这种高级持久威胁、诈骗和内部攻击的方法。 传统的网络安全技术,缺乏发现和规避复杂恶意攻击的能力。他们最多只能解决简单的问
站长以前介绍过这个开源项目,最近又有人在问,索性挂在Dotnet9网站上,方便大家在线浏览,先声明,模板来自下面的仓库:
5月26日,由工业和信息化部、国家发展和改革委员会、国家互联网信息办公室和贵州省人民政府主办,国家工业信息安全发展研究中心承办的《大数据优秀产品和应用解决方案案例系列丛书》发布会暨数博会“十佳大数据案例”揭晓活动在2019中国国际大数据产业博览会上成功举办。 2019年数博会案例评选,是有史以来参与厂家最多,条件最苛刻的。专家评审团透露,为贯彻落实国家大数据战略,全面掌握我国大数据产业发展和应用情况,本次大数据案例评选成立了专家评审团,制定案例应用需求、产品架构、关键技术、应用效果和企业综合实力五
先说观点:因为还没找到更好的。 接下来说原因,首先来看看大数据平台都在干什么。 原因 结构化数据计算仍是重中之重 大数据平台主要是为了应对海量数据存储和分析的需求,海量数据存储的确不假,除了生产经营产生的结构化数据,还有大量音视频等非结构化数据,这部分数据很大,占用的空间也很多,有时大数据平台 80% 以上都存储着非结构化数据。不过,数据光存储还不行,只有利用起来才能产生价值,这就要进行分析了。 大数据分析要分结构化和非结构化数据两部分讨论。 结构化数据主要是企业生产经营过程中产生的业务数据,可以说是企业的
数据猿导读 在金融服务业开放政策和云计算、大数据技术双重推动下,互联网金融领域的跨界融合正在成为一种趋势。但在互联网金融与普惠金融业务中存在的风险不可小觑,需要借助大数据手段进行智能营销和风控。 本篇
母婴相对一般的电子商务网站有一些特点:第一个特点是商品周期短,在母婴网站上的商品,在线的时间不会超过5-7天,第二个是用户需求的变化快,在母婴行业,可能是用户的需求变化最快的领域,比如是用户处在怀孕当
贝贝网的主要产品是垂直的母婴类,母婴相对一般的电子商务网站有一些特点:第一个特点是商品周期短,在母婴网站上的商品,在线的时间不会超过5-7天,第二个是用户需求的变化快,在母婴行业,可能是用户的需求变化
数据猿导读 证券行业是中国计算机应用高度密集的行业之一,如何利用好各项数据是券商摆脱低层次的同质化竞争,走向差异化服务优势的重要途径。那么以数据为基础,通过数据分析指导服务和决策就显得尤为重要。 本篇
数据猿导读 全国首个“大数据试验场”联盟问世,落户上海;河北省推出全民健身大数据平台“e众体育”;数据堂正式切入医疗大数据领域,拟500万元收购食药网10%股份……以下为您奉上更多本周大数据热点事件
领取专属 10元无门槛券
手把手带您无忧上云