腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如果我的数据不能存储在内存中,执行EDA并将其可视化?我的数据集大小是200 G
、
、
、
、
执行探索性数
据分析
是任何机器学习项目的第一步,我主要是用熊猫来使用内存中的数据集进行数据探索。熊猫很容易用Python进行数
据分析
。但是,由于系统内存有限,我发现在Pandas中处理多个更大的数据文件很困难。对于大于RAM大小的数据集.千兆字节 我看过一些
教程
,其中他们使用星星之火过滤出基于规则的数据,并生成一个适合于内存的数据格式.最终,总有完全驻留在内存中的数据,但我想知道如何使用
大数
据集并执行探索性数
据分析
另一个挑战是可视化
大数
据进行探索性数
据分析
.如果它适合内存
浏览 0
提问于2018-08-03
得票数 0
回答已采纳
1
回答
大数
据分析
参考文献
我正在寻找一个好的入门书或课程的
大数
据分析
。在实际应用方面,我对在R中使用
大数
据工具特别感兴趣。谢谢!
浏览 0
提问于2016-11-21
得票数 1
回答已采纳
1
回答
深层神经网络与
大数
据分析
、
、
、
现在,我有两个主要的和最近出现的领域可供选择,即深度神经网络和
大数
据分析
。然而,我必须选择一个作为我未来的工作领域。 深层神经网络与
大数
据分析
相比,未来还有更大的发展空间吗?
浏览 4
提问于2017-06-06
得票数 0
回答已采纳
2
回答
天蓝色水滴存储与天蓝色数据湖存储的区别
、
对于像我这样的用户来说,这似乎是一种困惑,因为azure blob存储和蔚蓝数据湖存储有什么主要区别,在哪个用户情况下,azure blob存储比蔚蓝数据湖存储更适合,反之亦然?
浏览 9
提问于2020-04-05
得票数 4
回答已采纳
1
回答
数
据分析
中的数据量是否重要?
、
、
、
、
因此,我想知道数
据分析
是否可以通过使用少量的数据来完成,比如存储在database.If中的100到1000个记录--我这样做了--那么它是数
据分析
吗?有人说,如果你分析的是少量的数据,那根本就不是数
据分析
。我要提前感谢你
浏览 0
提问于2019-02-01
得票数 0
回答已采纳
9
回答
R语言是否适合
大数
据
、
R有许多针对数
据分析
(如JAGS、BUGS、ARULES等)的库,并在流行的教科书中被提到,如: J.Krusche,进行贝叶斯数
据分析
;B.Lantz,“机器学习与R”。我已经看到了5TB的指南,将数据集视为
大数
据。 我的问题是:R是否适合在
大数
据问题中通常看到的数据量?在这样的数据集中使用R时是否使用策略?
浏览 0
提问于2014-05-14
得票数 55
回答已采纳
2
回答
大数
据分析
# 1.0#=GF AC CD7.8awk '{print $0 > $2 NR}' RS='//' assignment.txt
浏览 0
提问于2018-11-20
得票数 0
回答已采纳
2
回答
处理
大数
据和数据可视化的最佳工具
、
、
我目前正在做(开始)我的
大数
据和数据可视化项目。所以请让我知道有没有最好的软件来处理
大数
据和数据可视化,即数
据分析
。
浏览 3
提问于2013-01-17
得票数 0
回答已采纳
3
回答
可以使用哪种工具来生成此图?
、
我在
大数
据分析
的图形工具方面是新手。尽管以下内容不是来自
大数
据,但我想知道是使用什么工具来创建这种复杂的图形: 与论文相关
浏览 5
提问于2013-01-11
得票数 0
回答已采纳
2
回答
大数
据分析
、
、
、
、
我正试图分析大量的GitHub存档数据,并被许多限制所困扰。我想绘制每个存储库自创建以来拥有的星星数。(仅适用于目前超过1000的回购)我的另一个选择是搜索我的本地副本,但是在每个文件中搜索一个特定的字符串(存储库名)太长了。在一个SSD驱动器上花了一个
浏览 6
提问于2014-08-02
得票数 1
回答已采纳
1
回答
NAS与CFS的优势区别及应用?
NAS与CFS的优势区别及应用
浏览 799
提问于2018-08-04
1
回答
Zookeeper需要有自己的HAMR服务器吗?
、
、
这与发布的
大数
据分析
引擎有关 Zookeeper必须在自己的服务器上安装HAMR吗?
浏览 2
提问于2014-09-16
得票数 0
1
回答
数据库中的多个单元格
我是数据库新手。问题是为什么笔记本中有多个单元格,当我们可以在一个单元格中编写完整的指令/程序时?
浏览 2
提问于2022-04-10
得票数 0
1
回答
寻找规模较小的类似Hadoop的解决方案
、
、
、
我们有一个大约1000 GB (千兆字节)的数据库,我们正在考虑使用Hadoop来执行时间序列分析。问题是Hadoop需要一些时间才能进入,而且对于我们的数据库大小来说,Hadoop实际上是一个超大的解决方案。我的问题是,是否有人知道更小规模的Hadoop类似的解决方案。它还需要一些类似SQL的查询语言。我脑海中唯一浮现的就是JBoss Infinispan.但我想看看是否有其他已知的解决方案。
浏览 1
提问于2013-11-20
得票数 2
1
回答
如何显示变焦投票结果文件中的数据?
、
我正在努力弄清楚如何显示最近的变焦会议的投票结果。缩放导出数据的方式如下(.csv格式):0001 Favorite Color? Red0003 Favorite Color? Red;Blue0001 Favorite Season?
浏览 2
提问于2020-05-26
得票数 1
回答已采纳
1
回答
基于室内微定位数据的BI建设
我们将很快将通过iBeacon部署和客户端应用程序收集的室内微位置数据记录到我们的数据库中,我们现在开始探索有哪些工具可以在持久化数据上构建BI信息,例如:
浏览 3
提问于2014-02-22
得票数 0
6
回答
facebook数据泄漏:
大数
据分析
竟能操控美国大选?
、
、
、
近日,facebook的数据泄露事件引起广泛讨论,罪魁祸首剑桥分析公司通过数
据分析
来帮助企业和政党改变受众行为。他甚至声称“只要了解用户的十个赞,就能比用户的同事更准确地评价用户”。那么
大数
据分析
真的有他们所说的那么强吗?这是怎么样做到的?公众的个人隐私又该如何保护?
浏览 856
提问于2018-03-26
1
回答
星火堆中的火花调度器与独立调度器
、
火花核心中的调度程序和下面的Stack中的独立调度程序之间有什么区别(来自学习火花:闪电-快速
大数
据分析
书)?
浏览 0
提问于2018-04-10
得票数 4
回答已采纳
1
回答
WebApp /服务器/服务统计报告
、
、
、
有人能建议像AwStats这样的工具来收集关于我的LAMP堆栈和我的WebApp的报告吗?这有助于收集有关正常运行时间/服务/ aplication..etc的统计数据
浏览 0
提问于2017-04-23
得票数 0
1
回答
在Excel中添加大型数据
、
我在excel中有大约200,000个数据,这些数据在两年内每天每15分钟被分开。现在,我想添加每一天(包括所有15分钟的数据一次)例如。2014年1月1日至2016年12月31日我使用了一个基本的公式(=sum(range)),但它非常耗时。有人能帮我找到一个简单的方法来解决这个问题吗?
浏览 1
提问于2016-10-20
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
大数据分析Python列表使用教程
大数据分析Python的datetime日期时间教程
大数据分析
数据分析高级教程(三)
大数据分析领域
热门
标签
更多标签
云服务器
ICP备案
对象存储
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券