腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
大数
据分析
参考文献
我正在寻找一个好的入门书或课程的
大数
据分析
。在实际应用方面,我对在R中使用
大数
据工具特别感兴趣。谢谢!
浏览 0
提问于2016-11-21
得票数 1
回答已采纳
1
回答
如果我的数据不能存储在内存中,执行EDA并将其可视化?我的数据集大小是200 G
、
、
、
、
执行探索性数
据分析
是任何机器学习项目的第一步,我主要是用熊猫来使用内存中的数据集
进行
数据探索。但是我想知道如何
进行
数据清理,如何处理丢失的数据和数据离群点,单变量图,特征如何影响标签的密度图,相关性等等。我看过一些教程,其中他们使用星星之火过滤出基于规则的数据,并生成一个适合于内存的数据格式.最终,总有完全驻留在内存中的数据,但我想知道如何使用
大数
据集并执行探索性数
据分析
另一个挑战是可视化<e
浏览 0
提问于2018-08-03
得票数 0
回答已采纳
9
回答
R语言是否适合
大数
据
、
R有许多针对数
据分析
(如JAGS、BUGS、ARULES等)的库,并在流行的教科书中被提到,如: J.Krusche,
进行
贝叶斯数
据分析
;B.Lantz,“机器学习与R”。我已经看到了5TB的指南,将数据集视为
大数
据。 我的问题是:R是否适合在
大数
据问题中通常看到的数据量?在这样的数据集中使用R时是否使用策略?
浏览 0
提问于2014-05-14
得票数 55
回答已采纳
1
回答
寻找规模较小的类似Hadoop的解决方案
、
、
、
我们有一个大约1000 GB (千兆字节)的数据库,我们正在考虑使用Hadoop来执行时间序列分析。问题是Hadoop需要一些时间才能进入,而且对于我们的数据库大小来说,Hadoop实际上是一个超大的解决方案。我的问题是,是否有人知道更小规模的Hadoop类似的解决方案。它还需要一些类似SQL的查询语言。我脑海中唯一浮现的就是JBoss Infinispan.但我想看看是否有其他已知的解决方案。
浏览 1
提问于2013-11-20
得票数 2
1
回答
深层神经网络与
大数
据分析
、
、
、
现在,我有两个主要的和最近出现的领域可供选择,即深度神经网络和
大数
据分析
。然而,我必须选择一个作为我未来的工作领域。 深层神经网络与
大数
据分析
相比,未来还有更大的发展空间吗?
浏览 4
提问于2017-06-06
得票数 0
回答已采纳
3
回答
Kibana、Logstash用于
大数
据环境
、
、
、
、
我们可以使用Logstash和Kibana
进行
大数
据分析
吗? 我将使用Hadoop来存储我的数据。在尝试任何东西之前,我想知道是否有人已经尝试过了。
浏览 0
提问于2013-12-12
得票数 1
2
回答
天蓝色水滴存储与天蓝色数据湖存储的区别
、
对于像我这样的用户来说,这似乎是一种困惑,因为azure blob存储和蔚蓝数据湖存储有什么主要区别,在哪个用户情况下,azure blob存储比蔚蓝数据湖存储更适合,反之亦然?
浏览 9
提问于2020-04-05
得票数 4
回答已采纳
7
回答
如何利用
大数
据技术整治药品网络制假售假?
、
、
、
2月1 号阿斯利康与腾讯达成战略合作,共同为“健康中国”保驾护航,其中腾讯将以
大数
据为驱动的互联网技术,精准打击药品网络制假售假,那么这是如何实现的呢?
浏览 541
提问于2018-03-30
1
回答
数
据分析
中的数据量是否重要?
、
、
、
、
因此,我想知道数
据分析
是否可以通过使用少量的数据来完成,比如存储在database.If中的100到1000个记录--我这样做了--那么它是数
据分析
吗?有人说,如果你分析的是少量的数据,那根本就不是数
据分析
。我要提前感谢你
浏览 0
提问于2019-02-01
得票数 0
回答已采纳
2
回答
大数
据分析
# 1.0#=GF AC CD7.8awk '{print $0 > $2 NR}' RS='//' assignment.txt
浏览 0
提问于2018-11-20
得票数 0
回答已采纳
2
回答
处理
大数
据和数据可视化的最佳工具
、
、
我目前正在做(开始)我的
大数
据和数据可视化项目。所以请让我知道有没有最好的软件来处理
大数
据和数据可视化,即数
据分析
。
浏览 3
提问于2013-01-17
得票数 0
回答已采纳
3
回答
可以使用哪种工具来生成此图?
、
我在
大数
据分析
的图形工具方面是新手。尽管以下内容不是来自
大数
据,但我想知道是使用什么工具来创建这种复杂的图形: 与论文相关
浏览 5
提问于2013-01-11
得票数 0
回答已采纳
4
回答
Google Dataflow对Apache Spark
、
、
、
我正在调查、Google、Dataflow、和Apache ,以决定哪种解决方案更适合我们的
大数
据分析
业务需求。我发现在spark平台中有Spark SQL和MLlib来
进行
结构化数据查询和机器学习。 我想知道谷歌数据流平台中是否有相应的解决方案?
浏览 2
提问于2015-11-04
得票数 32
回答已采纳
1
回答
PermissionError:[Errno 13]权限被拒绝
、
、
、
我在最后一年的项目中使用AWS EC2,我开始设置来
进行
大数
据分析
。当我执行步骤13并在我的终端中键入jupyter notebook时,我无法访问该网站?
浏览 1
提问于2019-02-26
得票数 0
2
回答
大数
据分析
、
、
、
、
我正试图分析大量的GitHub存档数据,并被许多限制所困扰。我想绘制每个存储库自创建以来拥有的星星数。(仅适用于目前超过1000的回购)我的另一个选择是搜索我的本地副本,但是在每个文件中搜索一个特定的字符串(存储库名)太长了。在一个SSD驱动器上花了一个
浏览 6
提问于2014-08-02
得票数 1
回答已采纳
1
回答
NAS与CFS的优势区别及应用?
NAS与CFS的优势区别及应用
浏览 799
提问于2018-08-04
1
回答
谷歌云DataProc的性能监控
、
我们正在使用GoogleCloudPlatform
进行
大数
据分析
。对于处理,我们目前使用的是google cloud dataproc & spark-streaming。
浏览 0
提问于2016-06-13
得票数 0
1
回答
使用dbplyr
进行
数据库内处理与直接编写SQL代码
、
问题是,在企业级应用程序中使用dbplyr
进行
大数
据分析
是有意义的吗?
浏览 2
提问于2022-11-05
得票数 1
回答已采纳
1
回答
Dataproc :通过REST API提交Spark作业
、
我们正在使用GoogleCloudPlatform
进行
大数
据分析
。对于处理,我们目前使用的是google cloud dataproc & spark-streaming。
浏览 2
提问于2016-06-13
得票数 0
1
回答
分区拼花文件需要更多的空间和更多的时间来查询。
理论上,Parquet文件所占用的空间比CSV要小,并且应该能更快地提供结果。我的实验正好相反。这项活动需要700万英镑。使用“城市”过滤标准查询Parquet需要350 CSV,而CSV需要111 CSV。PDF格式的执行笔记簿在这里
浏览 1
提问于2021-07-26
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
加米谷大数据:如何进行大数据分析与处理?
加米谷大数据:如何进行大数据分析与处理
大数据分析
大数据分析领域
大数据分析方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券