前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >2014中国大数据行业大调查:开发者究竟需要什么?

2014中国大数据行业大调查:开发者究竟需要什么?

作者头像
CSDN技术头条
发布于 2018-02-08 10:07:41
发布于 2018-02-08 10:07:41
7080
举报
文章被收录于专栏:CSDN技术头条CSDN技术头条

揭开大数据生态圈背后的真相,切实了解开发者对大数据平台的需求,用真实数据分析大数据行业发展趋势及产品方向。近日,在2014中国大数据技术大会召开前夕,CSDN特推出“2014中国大数据有奖调查”活动,旨在更全方位地洞察中国大数据产业现状,为大数据技术从业者和创业者们提供良好的参考与建议。

公司使用大数据的基本情况

时至今日,无论你是来自互联网行业、通信行业,还是金融行业、服务业或是零售业,相信都不会对大数据感到陌生。据调查报告显示,32.5%的公司正在搭建大数据平台,处于测试阶段;29.5%的公司已经在生产环境实践大数据,并有成功的用例/产品;24.5%的公司已经做了足够的了解,开发准备就绪;基本不了解的只占3000+用户的13.5%。

现有公司大数据的使用情况

其中,大家对大数据平台提出的的主要需求有:36.5%是进行海量数据的离线处理,比如大数据BI;23.2%是为了大量数据的实时处理,比如在线交互式分析;40.3%的公司的大数据平台则同时负责这两种业务。

大数据平台主要负责的业务

传统观念下,大数据往往是大型互联网公司的玩物。然而,通过本次调查,我们却发现在那些对大数据平台有需求的公司中,研发团队规模远没有我们想象的大,29.11%的研发团队仅有1-10人,次居第二的10-50人的规模占到了25.77%,两种规模的研发团队就超过了一半。可见,当下大数据的需求已不止步于大型公司。

研发团队规模

从传统架构到大数据时代应用程序架构的转变往往都会遇到一些问题和挑战。在对计算框架门槛调查中,非专业人士难于入手这一难题的比例达到了46.5%,这对企业人才的培训提出了迫切的要求。

当下计算框架使用过程中存在的问题

打造大数据平台需要企业克服诸多问题和挑战,尤其是安全性和可靠性方面。

大数据平台打造的主要挑战

大数据技术现状

大数据技术在开发者或从业人员的应用中逐步走向成熟,这些成熟的技术在开发人员的探索中得到了初步的稳定发展,公司的使用便是对这些技术的肯定。包括开发语言,数据分析语言、数据库等在内的大数据工具,究竟哪个更适合自己的业务,相信开发者们都有自己的评判标准。

在众多的开发语言中,大数据平台开发者们尤为青睐Java,占到了总比例的65%,远远超过其他开发语言。值得一提的是,Hadoop本身就由Java实现的。

大数据开发语言

大数据分析语言中,SQL的使用比例达到了64%,是R语言使用者人数的2倍之多。我们从中不难看出SQL-on-XXX项目的前景;同时从R的支持率上,也看到了更多非技术人员,比如数据分析师对低门槛分析类语言的需求。

大数据分析通常用的语言

大数据存储上,HBase则以67.55%的比例位居榜首,远超其他数据仓库,当然这点与Hadoop原生支持是分不开的。

数据存储中适合的数据库

对存储在HBase或Cassandra这样NOSQL数据库中的数据进行复杂查询,Solr、Elasticsearch、Splunk等主流的搜索引擎差距并不大。

对存储在NOSQL数据库中的数据进行复杂查询,比较合适的工具

大数据未来发展

诚如上文所说,许多对大数据有需求的公司并不一定具备强大的研发团队,在大数据处理过程中往往遭遇众多挑战。那么,在面临这些挑战时,开发者最迫切需要的是什么?

为了解决公司中的实际问题,39.28%的人希望拥有更犀利和通用的计算框架;37.88%的人希望能拥有更好的数据挖掘算法;21.59%的人则对保障性更高的运维有了更多的期盼。

为了解决公司的实际问题,最希望拥有的新技术

良好的大数据计算平台能够有效地支撑企业的海量数据,对于下一代通用大数据技术平台,Spark和Hadoop是公司的主要选择。同时,我们也看到了新贵Spark的发展前景,对比老将Hadoop,差距也仅有3.7%。

人们看好的下一代通用大数据计算平台

现有公司中,大数据平台已包含的部件位居前三的主要是SQL数据库(90.3%)、NoSQL数据库(50.7%)和HDFS(47.2%),在此基础上,公司计划添加的部件主要包含SQL数据库(57.2%)、Spark(41.5%)和NoSQL数据库(26.9%)。从各公司已有大数据部件和计划添加的部件可以看出,SQL数据库和NoSQL数据库在公司的大数据平台中发挥了重要的作用,得到了各公司的青睐。

现有大数据平台已包含的部件

现有大数据平台计划添加的部件

为了获取更高的收益,企业在前期需要进行有效地成本投入,对大数据平台的投资,公司更加不会吝啬,其中被调查的人群中,45.7%的人所在企业有追加投资大数据平台的打算,同时,公司也期望能够通过多种途径完善大数据平台,主要的完善途径包括基于开源平台自主研发、购买成熟的解决方案,使用公有云

企业期望完善大数据平台的途径

使用公有云也是企业期望完善大数据平台的有效途径之一,在选择公有云平台方面,企业也面临着很大的倾向性,45.26%的人将阿里云作为首选。

公有云平台的选择

大数据技术培训

技术培训能够对开发者起到一定的指导作用,使得听众可以系统全面的把握新技术的知识脉络,了解技术的发展趋势。在此次调查活动中,69.4%的被调查者表示从未参加过大数据平台构建的技术培训。对于技术培训的形式,49%的人希望是线上培训,收费,成系列型的大数据解决方案,专攻一个方向,解决实际问题;37%的被调查者还是希望免费进行技术培训,即使不成系列,无论是线上线下,能听一节是一节。虽然收费在一定程度上影响了开发者对大数据技术培训的热情,但是能够切实解决实际问题,得到技术和能力的提升,仍是相关技术人员追求的培训目标。

更适合的技术培训形式

那么,对开发者来说,大家特别期望从技术培训中获取的知识又会是什么?

大数据领域,迫切学习或参加培训的新技术

写在最后

根据本次调查,我们不难发现,大数据仍然只在少数公司的生产环境投入使用,造成这个情况的原因主要有两个:首先,当下的大数据计算框架在使用上仍然存在很高的门槛;其次,受限于公司研发团队的实力。在大数据平台打造上,大部分机构都期望通过自主研发来完成这个过程,同时也期望获得更符合使用习惯的计算框架,比如SQL。同时,在自主研发和购买解决方案添加大数据属性之外,很多机构将注意力集中到云计算,其中国内云供应商阿里云45.26%的得票率更是值得欣慰。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2014-12-09,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CSDN技术头条 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
1 条评论
热度
最新
mark
mark
回复回复点赞举报
推荐阅读
C++/C++11中头文件cmath的使用
<math.h>是C标准函数库中的头文件。在C++中一般用<cmath>。此头文件中声明了一系列函数来计算常见的数学运算和变换:
用户7886150
2021/02/11
8320
tanh函数求导激活函数_tanh()函数以及C ++中的示例
tanh() function is a library function of cmath header, it is used to find the hyperbolic tangent of the given value (hyperbolic angle), it accepts a number (x) and returns the hyperbolic tangent of x.
用户7886150
2021/02/12
1.1K0
c++一些问题2.0 友元函数,运算符的重载
---- 友元类:打破了类的封装。 a普通类声明为友元函数. 友元函数可以访问类中的私有成员,打破了类的封装。 b友元成员函数。一个类的成员函数是另一个类的友元函数。 c友元类。 将一个类声明为另一类的友元类。 ---- 代码如下 #include<iostream> #include<string> #include<cmath> using namespace std; class Triangle; class Point { private: int x, y;
热心的社会主义接班人
2018/04/27
7890
c++一些问题2.0 友元函数,运算符的重载
C语言函数大全--l开头的函数
上述示例程序中,首先通过 open() 函数打开一个名为 test.txt 的文件,并设置文件访问模式为可读写。接着,调用 lock() 函数对该文件进行加锁操作,保护写入数据的过程。然后,通过 write() 函数将数据写入到文件中。最后,调用 lock() 函数对该文件进行解锁操作,释放锁定的资源。
huazie
2025/04/29
1170
C语言函数大全--l开头的函数
【C++】探索C++库函数的奇妙世界:深入了解如何发挥其强大功能
SarPro
2024/02/20
1040
【C++】探索C++库函数的奇妙世界:深入了解如何发挥其强大功能
C++知识点
还没有整理过的笔记,有点乱 C++ 程序设计 II 兼谈对象模型 Conversion function - 转换函数 operator type() // this type -> other type class Fraction { // 分数类,分数可以被看成 double public: Fraction(int num, int den = 1) : m_numerator(num), m_denominator(den) {} operator double() co
yhlin
2023/02/13
9000
C++知识点
C++函数模板(模板函数)详解
大家好,又见面了,我是你们的朋友全栈君。 C++函数模板(模板函数)详解 定义 用法: 函数模板的原理 延申用法 2.1为什么需要类模板 2.2单个类模板语法 2.3继承中的类模板语法 案例1: 案例2: 2.4类模板的基础语法 2.5类模板语法知识体系梳理 1.所有的类模板函数写在类的内部 复数类: 2.所有的类模板函数写在类的外部,在一个cpp中 2.5总结 关于类模板的几点说明: 2.6类模板中的static关键字 案例2:以下来自:C++类模板遇上static关键字 2.7类模板在项目开发中的
全栈程序员站长
2022/07/22
2K0
C++函数模板(模板函数)详解
【C++】侯捷C++面向对象高级编程(下)
转换函数(conversion function) 可以把"这种"东西,转化为"别种"东西。 即Fraction ——> double class Fraction { public: Fraction(int num, int den = 1) : m_numerator(num), m_denominator(den) { } operator double()const { return ((double)m_numerator / m_denominator); }
半生瓜的blog
2023/05/13
7270
【C++】侯捷C++面向对象高级编程(下)
C++ 模板沉思录(上)
如果你对Python很熟悉,你一定会觉得:“哇!这太简单了!”,然后写出以下代码:
Python猫
2020/08/04
1.4K0
C++常用的函数
通常,在程序设计中,我们会发现一些程序段在程序的不同地方反复出现,此时可以将这些程序段作为相对独立的整体,用一个标识符给它起一个名字,凡是程序中出现该程序段的地方,只要简单地写上标识符即可。这样的程序段,我们称之为子程序(函数)。下面介绍一下C++提供的各种标准函数。
用户7886150
2021/02/11
1.6K0
C++23 std::expected:一种新的词汇表类型,用于返回函数的结果
在C++编程中,错误处理一直是一个重要且具有挑战性的任务。传统的错误处理方法,如返回码和异常,虽然在一定程度上能够解决问题,但也存在各自的局限性。例如,返回码可能会导致代码的可读性和可维护性降低,而异常则可能带来性能开销和资源管理的问题。为了解决这些问题,C++23引入了std::expected这一全新的词汇表类型,它为函数返回结果的处理提供了一种更加优雅、类型安全的解决方案。
码事漫谈
2025/04/26
690
C++23 std::expected:一种新的词汇表类型,用于返回函数的结果
【Artificial Intelligence篇】智能技术的力量,重新定义我们的工作模式
在当今这个快速发展的数字时代,人工智能(AI)正以前所未有的速度渗透到我们生活和工作的各个方面,为传统的工作模式带来了革命性的变革。从自动化日常任务到辅助复杂决策,AI 的应用正逐步成为企业和组织提高效率、创新和竞争力的关键因素。
羑悻的小杀马特.
2025/01/23
1140
C语言中你可能不熟悉的头文件(stdlib.h)
C Standard General Utilities Library (header)
Enjoy233
2019/03/05
1.6K0
C++003-C++变量和数据类型2
前两个数采用了科学记数法(scientific notation),第三个数保留了5位小数。浮点数用默认记数法defaultfloat编写:这种表示方法尽可能用多的位数,这个位数包括小数点前及小数点后的位数。 默认记数法特点
用户2225445
2023/10/16
3800
C++003-C++变量和数据类型2
C++ 自定义复数类
C++练习。 功能:自定义复数类型,实现复数的加、减、乘、除、求共轭复数、乘方、开方等运算。 涉及到的基础知识点有: 运算符重载(+,-,*,/, <<, ^, ==, != 等运算符的重载) 友元函数(友元函数可访问类的私有属性) 函数返回指向数组的指针。此例中数组的元素是类的对象。 左值引用与右值引用 主动抛出异常(使用关键字throw) #include <iostream> #include <cmath> using namespace std; class Division_by_zer
用户6021899
2021/05/20
1.4K0
C++ 多值返回:从版本1到版本6秒杀​
本篇文章将会给大家用不同的方法来解答这道题目,首先我们转化一下这个题目,使用a / b来模拟(下面不考虑被除数为0的场景),返回商与余数。简单来说转化为一个函数返回商与余数有多少种办法?
公众号guangcity
2024/01/10
2270
C++ 多值返回:从版本1到版本6秒杀​
C语言中函数参数传递的三种方式
(1)传值,就是把你的变量的值传递给函数的形式参数,实际就是用变量的值来新生成一个形式参数,因而在函数里对形参的改变不会影响到函数外的变量的值。 (2)传址,就是传变量的地址赋给函数里形式参数的指针,使指针指向真实的变量的地址,因为对指针所指地址的内容的改变能反映到函数外,也就是能改变函数外的变量的值。 (3)传引用,实际是通过指针来实现的,能达到使用的效果如传址,可是使用方式如传值。 说几点建议:如果传值的话,会生成新的对象,花费时间和空间,而在退出函数的时候,又会销毁该对象,花费时间和空间。 因而如果int,char等固有类型,而是你自己定义的类或结构等,都建议传指针或引用,因为他们不会创建新的对象。
全栈程序员站长
2022/07/02
4.7K0
C语言中函数参数传递的三种方式
2006北京市小学生程序设计友谊赛详细答案
分析: 祖冲之密率355/113是圆周率pi的近似值。 注意: 本题第一个输入输出样例有误。输入为4时,输出应为5。 算法实现:
海天一树
2019/01/02
3800
C语言(C++)中:详解floor函数、ceil函数和round函数
cout << "The floor of 2.2 is " << i << endl;
用户7886150
2021/02/11
4.9K0
C++17 中的 std::gcd:探索最大公约数的现代 C++ 实现
在数学和编程中,最大公约数(GCD,Greatest Common Divisor)是一个非常重要的概念。它表示两个或多个整数共有约数中最大的一个。在 C++17 中,标准库引入了 std::gcd 函数,这使得计算最大公约数变得更加简单和高效。本文将详细介绍 std::gcd 的使用方法、实现原理以及一些实际应用场景。
码事漫谈
2025/02/12
3310
C++17 中的 std::gcd:探索最大公约数的现代 C++ 实现
相关推荐
C++/C++11中头文件cmath的使用
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档