进行大数据分析_怎么进行大数据分析_如何进行大数据分析 - 腾讯云开发者社区 - 腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

1回答

大数据分析参考文献

我正在寻找一个好的入门书或课程的大数据分析。在实际应用方面，我对在R中使用大数据工具特别感兴趣。谢谢!

浏览 0提问于2016-11-21得票数 1

回答已采纳

1回答

如果我的数据不能存储在内存中，执行EDA并将其可视化？我的数据集大小是200 G

、、、、

执行探索性数据分析是任何机器学习项目的第一步，我主要是用熊猫来使用内存中的数据集进行数据探索。但是我想知道如何进行数据清理，如何处理丢失的数据和数据离群点，单变量图，特征如何影响标签的密度图，相关性等等。我看过一些教程，其中他们使用星星之火过滤出基于规则的数据，并生成一个适合于内存的数据格式.最终，总有完全驻留在内存中的数据，但我想知道如何使用大数据集并执行探索性数据分析另一个挑战是可视化<e

浏览 0提问于2018-08-03得票数 0

回答已采纳

9回答

R语言是否适合大数据

、

R有许多针对数据分析(如JAGS、BUGS、ARULES等)的库，并在流行的教科书中被提到，如: J.Krusche，进行贝叶斯数据分析；B.Lantz，“机器学习与R”。我已经看到了5TB的指南，将数据集视为大数据。我的问题是:R是否适合在大数据问题中通常看到的数据量？在这样的数据集中使用R时是否使用策略？

浏览 0提问于2014-05-14得票数 55

回答已采纳

1回答

寻找规模较小的类似Hadoop的解决方案

、、、

我们有一个大约1000 GB (千兆字节)的数据库，我们正在考虑使用Hadoop来执行时间序列分析。问题是Hadoop需要一些时间才能进入，而且对于我们的数据库大小来说，Hadoop实际上是一个超大的解决方案。我的问题是，是否有人知道更小规模的Hadoop类似的解决方案。它还需要一些类似SQL的查询语言。我脑海中唯一浮现的就是JBoss Infinispan.但我想看看是否有其他已知的解决方案。

浏览 1提问于2013-11-20得票数 2

1回答

深层神经网络与大数据分析

、、、

现在，我有两个主要的和最近出现的领域可供选择，即深度神经网络和大数据分析。然而，我必须选择一个作为我未来的工作领域。深层神经网络与大数据分析相比，未来还有更大的发展空间吗？

浏览 4提问于2017-06-06得票数 0

回答已采纳

3回答

Kibana、Logstash用于大数据环境

、、、、

我们可以使用Logstash和Kibana进行大数据分析吗？我将使用Hadoop来存储我的数据。在尝试任何东西之前，我想知道是否有人已经尝试过了。

浏览 0提问于2013-12-12得票数 1

2回答

天蓝色水滴存储与天蓝色数据湖存储的区别

、

对于像我这样的用户来说，这似乎是一种困惑，因为azure blob存储和蔚蓝数据湖存储有什么主要区别，在哪个用户情况下，azure blob存储比蔚蓝数据湖存储更适合，反之亦然？

浏览 9提问于2020-04-05得票数 4

回答已采纳

7回答

如何利用大数据技术整治药品网络制假售假？

、、、

2月1 号阿斯利康与腾讯达成战略合作，共同为“健康中国”保驾护航，其中腾讯将以大数据为驱动的互联网技术，精准打击药品网络制假售假，那么这是如何实现的呢？

浏览 541提问于2018-03-30

1回答

数据分析中的数据量是否重要？

、、、、

因此，我想知道数据分析是否可以通过使用少量的数据来完成，比如存储在database.If中的100到1000个记录--我这样做了--那么它是数据分析吗？有人说，如果你分析的是少量的数据，那根本就不是数据分析。我要提前感谢你

浏览 0提问于2019-02-01得票数 0

回答已采纳

2回答

大数据分析

# 1.0#=GF AC CD7.8awk '{print $0 > $2 NR}' RS='//' assignment.txt

浏览 0提问于2018-11-20得票数 0

回答已采纳

2回答

处理大数据和数据可视化的最佳工具

、、

我目前正在做(开始)我的大数据和数据可视化项目。所以请让我知道有没有最好的软件来处理大数据和数据可视化，即数据分析。

浏览 3提问于2013-01-17得票数 0

回答已采纳

3回答

可以使用哪种工具来生成此图？

、

我在大数据分析的图形工具方面是新手。尽管以下内容不是来自大数据，但我想知道是使用什么工具来创建这种复杂的图形：与论文相关

浏览 5提问于2013-01-11得票数 0

回答已采纳

4回答

Google Dataflow对Apache Spark

、、、

我正在调查、Google、Dataflow、和Apache ，以决定哪种解决方案更适合我们的大数据分析业务需求。我发现在spark平台中有Spark SQL和MLlib来进行结构化数据查询和机器学习。我想知道谷歌数据流平台中是否有相应的解决方案？

浏览 2提问于2015-11-04得票数 32

回答已采纳

1回答

PermissionError：[Errno 13]权限被拒绝

、、、

我在最后一年的项目中使用AWS EC2，我开始设置来进行大数据分析。当我执行步骤13并在我的终端中键入jupyter notebook时，我无法访问该网站？

浏览 1提问于2019-02-26得票数 0

2回答

大数据分析

、、、、

我正试图分析大量的GitHub存档数据，并被许多限制所困扰。我想绘制每个存储库自创建以来拥有的星星数。(仅适用于目前超过1000的回购)我的另一个选择是搜索我的本地副本，但是在每个文件中搜索一个特定的字符串(存储库名)太长了。在一个SSD驱动器上花了一个

浏览 6提问于2014-08-02得票数 1

回答已采纳

1回答

NAS与CFS的优势区别及应用？

NAS与CFS的优势区别及应用

浏览 799提问于2018-08-04

1回答

谷歌云DataProc的性能监控

、

我们正在使用GoogleCloudPlatform进行大数据分析。对于处理，我们目前使用的是google cloud dataproc & spark-streaming。

浏览 0提问于2016-06-13得票数 0

1回答

使用dbplyr进行数据库内处理与直接编写SQL代码

、

问题是，在企业级应用程序中使用dbplyr进行大数据分析是有意义的吗？

浏览 2提问于2022-11-05得票数 1

回答已采纳

1回答

Dataproc :通过REST API提交Spark作业

、

我们正在使用GoogleCloudPlatform进行大数据分析。对于处理，我们目前使用的是google cloud dataproc & spark-streaming。

浏览 2提问于2016-06-13得票数 0

1回答

分区拼花文件需要更多的空间和更多的时间来查询。

理论上，Parquet文件所占用的空间比CSV要小，并且应该能更快地提供结果。我的实验正好相反。这项活动需要700万英镑。使用“城市”过滤标准查询Parquet需要350 CSV，而CSV需要111 CSV。PDF格式的执行笔记簿在这里

浏览 1提问于2021-07-26得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭