腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
9
回答
R语言是否适合大数据
、
R有许多针对数据分析(如JAGS、BUGS、ARULES等)的库,并在流行的教科书中被提到,如: J.Krusche,进行贝叶斯数据分析;B.Lantz,“机器学习与R”。 我已经看到了5TB的指南,将数据集视为大数据。 我的问题是:R是否适合在大数据问题中通常看到的数据量?在这样的数据集中使用R时是否使用策略?
浏览 0
提问于2014-05-14
得票数 55
回答已采纳
1
回答
深层神经网络与大数据分析
、
、
、
我是一名准PhD (CS)学生。在我的MS研究期间,我在异常检测领域工作过。现在,我有两个主要的和最近出现的领域可供选择,即深度神经网络和大数据分析。然而,我必须选择一个作为我未来的工作领域。 我想把其中一个领域和我以前的工作联系起来,那就是异常检测。此外,我还要问两个问题: 深层神经网络与大数据分析,哪一种更适合异常检测? 深层神经网络与大数据分析相比,未来还有更大的发展空间吗?
浏览 4
提问于2017-06-06
得票数 0
回答已采纳
1
回答
数据分析中的数据量是否重要?
、
、
、
、
因此,我想知道数据分析是否可以通过使用少量的数据来完成,比如存储在database.If中的100到1000个记录--我这样做了--那么它是数据分析吗? 有人说,如果你分析的是少量的数据,那根本就不是数据分析。 所以我把数据分析和大数据混淆了。有人能回答我这个问题吗? 我要提前感谢你
浏览 0
提问于2019-02-01
得票数 0
回答已采纳
1
回答
大数据分析参考文献
我正在寻找一个好的入门书或课程的大数据分析。在实际应用方面,我对在R中使用大数据工具特别感兴趣。 我想要一本书,但欢迎其他参考资料。 谢谢!
浏览 0
提问于2016-11-21
得票数 1
回答已采纳
1
回答
业务与财务和数据分析员之间的差异
、
、
有谁能告诉我, 业务分析师金融分析师数据分析员 一个人需要学些什么才能达到这两种形象。
浏览 0
提问于2016-11-06
得票数 0
回答已采纳
3
回答
大数据案例研究或用例示例
、
、
我读过很多关于不同行业如何使用大数据分析的博客文章。但这些文章大多没有提到 这些公司使用了什么样的数据。数据有多大? 他们用来处理数据的工具是什么? 他们面临的问题是什么,他们得到的数据是如何帮助他们解决问题的。 他们如何选择工具\技术来满足他们的需要。 他们从数据中识别出了什么样的模式&他们从数据中看到了什么样的模式。 我想知道是否有人能为我提供所有这些问题的答案或一个链接,至少回答一些问题。我正在寻找现实世界的例子。 如果有人能分享金融业是如何利用大数据分析的,那就太好了。
浏览 0
提问于2014-06-11
得票数 14
2
回答
NoSQL数据库在数据科学中的应用
、
、
如何使用NoSQL数据库(如MongoDB )进行数据分析?它们中有哪些特性可以使数据分析更快、更强大?
浏览 0
提问于2014-07-21
得票数 21
回答已采纳
1
回答
500G 在哪儿能找到资料?
、
、
、
、
500G python web、爬虫、数据分析、机器学习、大数据、前端实战项目视频代码免费分享 在哪儿能下载到资料,在线等,挺急的~, 感谢各位大佬~
浏览 248
提问于2019-05-10
6
回答
facebook数据泄漏:大数据分析竟能操控美国大选?
、
、
、
近日,facebook的数据泄露事件引起广泛讨论,罪魁祸首剑桥分析公司通过数据分析来帮助企业和政党改变受众行为。他甚至声称“只要了解用户的十个赞,就能比用户的同事更准确地评价用户”。那么大数据分析真的有他们所说的那么强吗?这是怎么样做到的?公众的个人隐私又该如何保护?
浏览 856
提问于2018-03-26
2
回答
实现公平的硬币翻转
、
、
我觉得很无聊,所以我开始研究密码学。我对这个公平硬币翻转协议很感兴趣。该协议适用于公钥密码体制,但要求算法通勤(我猜类似于RSA )。我认为用C或C++编写这篇文章会很有趣,我想知道人们通常是如何用C或C++来实现这种公钥加密的。例如,议定书的最初几个步骤是: Alice和Bob都生成一个公钥/私钥对(这是交换的秘密)。 Alice生成两条消息,一条指示头,另一条指示尾,并使用她的密钥对这两条消息进行加密,并将它们发送给Bob。 ..。 ..。 现在,对于这个消息,我将使用一个字符串,但是在生成公钥/私钥和加密给定字符串等方面有什么好的库吗?
浏览 5
提问于2010-10-22
得票数 4
回答已采纳
1
回答
R中的pgmm函数和gmm函数
、
、
关于R中的这两个函数,我有一个非常基本的问题。 当我尝试使用广义矩量法进行面板数据分析时,我意识到gmm和pgmm都是这种方法的函数。它们之间的区别是什么?我是否应该为面板数据使用pgmm one而不是gmm (我想做不同的GMM估计)? 提前谢谢你!
浏览 33
提问于2020-05-13
得票数 0
回答已采纳
2
回答
最佳编程语言
、
、
我精通纯粹的统计学。我不懂任何编程语言。这是我应该学习的最好的编程语言,它将有助于提高我在数据分析方面的职业生涯。 我对概念只有理论知识。请推荐一项技能,我应该发展成为一名数据分析员。
浏览 0
提问于2018-07-06
得票数 1
2
回答
处理大数据和数据可视化的最佳工具
、
、
我目前正在做(开始)我的大数据和数据可视化项目。所以请让我知道有没有最好的软件来处理大数据和数据可视化,即数据分析。
浏览 3
提问于2013-01-17
得票数 0
回答已采纳
2
回答
DataOps是什么?
、
这个网站已经有了很好的答案,比如什么是DevOps和什么是SecOps。 随着时间的推移,我逐渐认识到,当敏捷方法的哲学应用于运营时,意见就诞生了DevOps。SecOps也是如此。 那么,将敏捷方法应用于大数据和数据分析的DataOps会是什么样子呢?这与敏捷软件开发和DevOps有何相似之处?
浏览 0
提问于2019-11-13
得票数 3
1
回答
求和与积分的区别
、
我懂微积分和数学,但当我把统计学和数字相加时,它们看起来都是一样的。 有谁能用一点细节和简单的方式解释一下这个区别吗?
浏览 0
提问于2016-11-05
得票数 -1
回答已采纳
1
回答
如何在大数据和网络分析中起步
、
、
、
、
我目前对大数据分析和网络分析感兴趣,但我不知道如何开始和从哪里开始。我试着上网看看,但有些对我来说是先进的。走这条路之前,我首先需要的是统计学和数学方面的技能和知识吗? 我目前的计划是每个周末参加在线课程,因为我目前在工作日做软件助理工程师,练习大数据所需的编程语言,比如R。我已经获得了计算机科学学位,所以熟悉一些统计和数学方法并不是个问题。任何建议和意见都是非常感谢的! 对于那些已经有经验的人来说,你的经验是怎样的,你最擅长的是什么?
浏览 3
提问于2016-04-01
得票数 0
回答已采纳
2
回答
大数据到哪里去了,它是如何存储的?
、
、
、
我试图掌握大数据,主要是如何管理大数据。 我熟悉数据管理和数据生命周期的传统形式;例如: 收集的结构化数据(如网页表格) 存储在数据库服务器RDBMS中的表中的数据 数据清理后,ETL进入数据仓库 数据使用OLAP多维数据集和其他各种BI工具/技术进行分析。 但是,在大数据的情况下,我对第2点和第3点的等效版本感到困惑,主要是因为我不确定每个大数据“解决方案”是否总是涉及使用NoSQL数据库来处理和存储非结构化数据,以及数据仓库的大数据等效是什么。 据我所见,在某些情况下,NoSQL并不总是被使用,而且可以完全省略--这是真的吗? 对我来说,大数据生命周期就是这样的:
浏览 7
提问于2017-04-20
得票数 7
回答已采纳
1
回答
大数的Elgamal解密计算
我是密码学的初学者。我研究了Elgamal算法。 secret key= (p,g,a) Encryption= c1=(g^k mod p) , c2=(m.B^k mod p) // 0<k<p-1 Decryption= c1^(p-1-a)*c2 mod p 一个简单的解密示例: a=4 p=7 g=3 c1=2 , c2=3 decrypted message= 2^(7-1-4)*3 mod 7 = 2^(2)*3 mod 7 = 4*3 mod 7 = 12 mod 7 = 5 这个例子中的数字很小(2^2 *3),如果它们是很大的数字,我如何计算它们(幂和乘法)
浏览 0
提问于2017-05-16
得票数 -1
1
回答
大数据和小数据的优缺点?
我在寻找更深入的答案。我知道基础知识--小数据分析起来更快,使用大数据你会有更多的能力,等等。但我想知道更多(也许是关于因果推断?)关于每种方法的优点和缺点。谢谢!
浏览 3
提问于2017-10-11
得票数 1
1
回答
匿名空间数据
、
、
、
、
我正在为考古学空间数据分析的R研讨会准备一些培训材料,并且需要匿名真实的站点位置(机密信息),同时在站点的边界框中保持特征的空间完整性。 我最初的想法是从所有的几何图形中减去边框的最小X&Y值(都在UTM弦中)--也就是说,使整个事物成为一个任意的相对网格。 我有ESRI点和多边形形状文件导入到R与sf,和一些栅格装载了地球,但不知道如何继续进行全球空间调整。 我也使用QGIS,所以在加载到R之前,通过一些解决方案对几何进行预处理也是有效的--但是,我也不知道该如何做。
浏览 6
提问于2022-04-27
得票数 0
1
回答
长时间运行的进程和托管提供商?
、
、
、
我有一个运行了好几个小时的python数据分析脚本,当它在我的桌面上运行时,随着粉丝们的狂热,我意识到我可以在bkgnd中的一个托管账户上远程运行它,然后让它破解。 但我想知道--托管提供商通常不赞成这样的做法吗?他们是否假设我所有的CPU/内存使用都是突发性的--来自我的Apache2实例的使用率,一个运行了12小时的进程会被他们的sysop杀死? 或者他们会认为我是在为使用付费,所以你自己动手吧?我的脚本及其数据是自包含的,没有使用任何网络或数据库资源。 有这方面的经验吗?
浏览 8
提问于2015-11-12
得票数 0
1
回答
亚马逊Aurora RDS的大数据分析
、
、
、
我有一张极光表,里面有五亿张唱片。我需要执行大数据分析,比如查找两个表之间的差异。到目前为止,我一直在使用文件系统上的HIVE来完成这项工作,但是现在我们已经将所有文件行插入到Aurora中。但仍然每月我需要做同样的事情,找到差异。 那么,对此,什么是最好的选择? 将Aurora数据作为文件导出回S3,然后对其运行单元查询(将所有Aurora行导出到S3需要多长时间)? 我可以在Aurora表上运行蜂箱查询吗?(我猜Aurora上的蜂箱不支持) 在Aurora上运行spark (性能如何)? 或者有什么更好的方法。
浏览 1
提问于2018-10-09
得票数 0
3
回答
如何使用python pandas在本地系统Jupyter Notebook中读取两个更大的5 5GB文件?如何在本地连接两个数据帧进行数据分析?
、
、
、
、
如何使用python pandas在本地系统Jupyter Notebook中上传两个大(5 5GB)的csv文件。请建议任何配置来处理用于数据分析的大型csv文件? Local System Configuration: OS: Windows 10 RAM: 16 GB Processor: Intel-Core-i7 代码: dpath = 'p_flg_tmp1.csv' pdf = pd.read_csv(dpath, sep="|") Error: MemoryError: Unable to allocate array 或 pd.read_c
浏览 1
提问于2020-01-24
得票数 4
1
回答
我如何将我的分类变量之一绘制成不同的颜色或形状?
、
、
我是R编程的初学者,主要用于政治学和经济学的基本数据分析,因此我只熟悉一组非常有选择性的函数。话虽如此,我一直在玩弄印度COVID19地区数据可视化的数据,并希望将不同颜色或形状的“邦”变量可视化,但这并没有发生。请帮我解决这个问题。 ggplot(district_wise,aes(x=Confirmed,y=Deceased)+ geom_point() ggplot(district_wise,aes(x=Confirmed,y=Deceased),shape=States)+ geom_point() ggplot(district_wise,aes(x=Confirmed,y=Dec
浏览 2
提问于2021-04-09
得票数 1
回答已采纳
2
回答
在Jupyter Notebook中使用netcdf4
、
、
、
、
我目前正在攻读学士学位,在那里我将使用Jupyter Notebook进行数据分析。通常我只写“普通”的Python和Java代码。为此,我需要打开.NC文件,在谷歌上快速搜索一下,就会告诉我要使用netcdf4。在我的Anaconda Manager中,这不是问题,但我似乎无法让它在Jupyter中工作。 我可以执行"import sys“和"!{sys.executable} -m pip install netcdf4”(这是我从另一个堆栈溢出线程获得的),但"import netcdf4 as nc“不起作用。(错误代码 ModuleNotFoundError
浏览 204
提问于2021-01-20
得票数 0
6
回答
成为一名数据科学家需要多少编程背景?
、
我曾经知道一些Java,但那是近10年前的事了。假设我能学到一门语言进入数据分析..。你推荐哪种语言?
浏览 0
提问于2015-02-05
得票数 3
2
回答
hadoop与mongodb和hadoop对mongodb
、
、
我试图理解mongoDB和Hadoop之间的关键区别。我理解mongoDB是一个数据库,而Hadoop是一个包含HDFS的生态系统。使用这两种技术处理数据的方式有一些相似之处,但也有很大的不同。 我不明白为什么有人会在Hadoop集群上使用mongoDB,主要是mongoDB比Hadoop具有什么优势。两者都执行并行处理,两者都可以与Spark一起用于进一步的数据分析,那么什么是一个比另一个的增值。 现在,如果要将两者结合起来,为什么要在mongoDB和HDFS中存储数据呢?MongoDB有map/reduce,所以为什么要将数据发送到hadoop进行处理,而且两者都与Spark兼容。
浏览 1
提问于2019-05-07
得票数 0
回答已采纳
2
回答
Hadoop -保存日志数据和开发GUI
、
、
我正在为我的新项目做研究,以下是我的项目、研究和问题的详细情况: 项目: 保存日志(例如。格式是来自不同来源的TimeStamp、日志条目、位置、备注等。在这里,不同的源类似于,从世界各地不同的系统获取日志数据(只是一个Overview)(After,如1所指定的那样保存Hadoop中的日志条目),生成按需保存在Hadoop中的日志的报告,如钻取、向上钻取等。 注:每分钟大约。它们将是来自系统的50到60 MB的日志条目(我检查过了)。 研究和问题: 用于将日志条目从不同来源保存到Hadoop中,我们使用ApacheFlum.我们正在创建自己的MR程序和servlet. 除了水槽,他们还有其他
浏览 4
提问于2011-12-26
得票数 0
4
回答
C++有限公司定义
、
、
我正在学习C++中的初学者密码学,并在研究极限。h。 有人能给我解释一下这个代码片段是干什么的吗?它是否定义了这些类型可以容纳的二进制数?特别是,什么是0 0xffu? 抱歉,为了这个烂标题。
浏览 8
提问于2013-11-19
得票数 0
回答已采纳
1
回答
SQLite的尺寸限制和性能
、
、
我已经研究过一些数据库,比如MySQL,但我从来没有专门处理过数据库。我正在进行一个项目,我们打算使用SQLite (出于一些原因:小型、轻量级、快速等),然后我对它有一些疑问: SQLite支持多少千兆字节的数据?有限度吗?(我将为每个用户提供一些大型数据表(例如,18列X 80.000行)) 读取大量数据快吗?(例如,18列X 80.000行) 关于SQLite,还有其他相关的信息我需要知道吗?(注:我将在Windows和OS上使用它) 附加信息 我正在开发的软件是一个数据分析软件,我只需要使用DB来保存使用一些传感器从用户那里收集到的数据。 我在项目中使用QT5.3.2 (C++)。
浏览 0
提问于2016-12-02
得票数 0
1
回答
自动化客户端自注册的原始导出数据清理-格式始终不同
、
、
、
、
所以这是一个比较普遍的问题。我是一家初创公司的数据分析师。我的主要流程包括获取客户拥有的现有客户数据,并将其清理/标准化以适应我们的平台,这是我们自注册过程的一部分。我们团队的一名成员从他们正在转换的系统中导出他们的数据,或者,如果他们在内部跟踪数据,我们会收到他们用来跟踪数据的Excel日志。它总是采用不同的格式,并且需要广泛的清理(平均1分钟/条)。我们通常是一个大表(.xlxs格式),在清理之后,将它拆分为四个.csv文件;我们在我们的平台上以四个表的形式加载它们。 我觉得我已经很好地优化了流程,包括流程步骤和excel函数(if、concat、text-to-column等)的清理。我
浏览 0
提问于2017-09-29
得票数 0
4
回答
我应该使用哪些初始步骤来理解大型数据集,以及应该使用哪些工具?
、
、
、
注意:在机器学习方面,我是一个完全的初学者,但我渴望学习。 我有一个很大的数据集,我试图在其中找到模式。数据之间可能没有关联,无论是与已知变量,还是包含在数据中但我还没有意识到的变量实际上都是相关的变量。 我猜这将是数据分析领域中一个常见的问题,所以我有几个问题: “灵丹妙药”是将所有这些数据扔到一个统计/数据分析程序中,然后对数据进行处理,寻找已知/未知的模式,试图找出它们之间的关系。是否适合SPSS,或者是否有其他更适合的应用程序。 我应该学习像R这样的语言,并弄清楚如何手动处理数据。这难道不是像我必须手动指定什么以及如何分析数据那样去寻找关系吗? 专业的数据采掘者将如何处理这一问题,S/
浏览 0
提问于2014-08-19
得票数 10
回答已采纳
1
回答
当数据不是新的广告/社交媒体/零售时尚的一部分时,声称拥有大数据的体验是合乎道德的吗?
、
显然,大多数雇主在聘用数据科学家时,更喜欢使用大数据和/或数据科学方面的经验。但是,一个人能安全地假定他们会承认什么是经验呢? 假设有人经常在计算集群上启动软件,该软件通常会生成大量数据。我不知道数据科学最好的衡量标准是什么。我将称它为每row...certainly在500 K以下的1或2000行,200 K或300 K点。然后,对于每一点,让我们称之为25或30个值。这相当于30或40千兆的数据。这其中有300到400次,你可以称之为一项研究--也许每年一到两项研究。我的印象是,这比谷歌或Facebook的数据科学家所习惯的要小得多,但对于我的家庭计算系统来说,它肯定太大了。 如果有人多年
浏览 0
提问于2015-04-06
得票数 1
1
回答
服务器间快速传输大数据
、
、
、
这是一个常见的问题,但在谷歌上搜索会产生很多垃圾。 随着数据量越来越大,加上处理能力和云能力,我们看到对快速数据传输技术的需求越来越大,这些技术能够通过在不同的服务器/客户端之间传播/移动/共享数据来释放所有这些可用数据的能力。 在我们的例子中,我们记录实时二进制数据(每天50吉),我们需要每天将其上传/下载到/从订阅者(是的,所有这些都是每个订阅服务器本地需要的,用于计算和各种数据分析)。 因此,简单地说,今天有哪些选择可以在远程windows服务器(VPS,Cloud)之间快速传输大量数据(VPS,Cloud,具有“相当一致的”带宽-(光纤除外)) 这是一个悬而未决的问题。不管协议是什么,
浏览 3
提问于2012-07-19
得票数 5
回答已采纳
2
回答
有了公开密码学,私钥冷冻术还有用吗?
看来,在公钥密码学中,不需要使用私钥加密技术.但是很明显,公钥密码学和私钥都是在密码学课上教授的.有人能告诉我私人密码术在实际操作中什么时候有用吗?如果是这样的话,它能被公钥密码系统取代吗?
浏览 0
提问于2018-03-31
得票数 4
回答已采纳
1
回答
没有模运算的公钥密码?
、
、
、
该Reddit数学评论针对一个关于人们如何在第三方监听的情况下相互通信秘密的声明,有一个非常小的、简单的公钥密码学示例: 接受你的信息,把它当作一个数字,乘以一串素数。寄给我。然后我也会乘以一串素数。我把它寄给你。然后除以你所有的素数。把它还给我。我除以我所有的素数,得到原来的信息。 这条评论得到了Reddit数学学院(Reddit)的支持,但它给我的印象是不寻常的,因为没有模块运算,只有素数。 如果使用了足够大的素数,此示例是否实际有效?
浏览 0
提问于2016-02-20
得票数 5
回答已采纳
1
回答
ESRI提供了谷歌BigQuery无法提供的功能,以及如何将这两种工具结合使用?
、
、
、
目前,我正在寻找支持大数据地球空间分析的大数据技术。我来到ESRI,发现它主要支持地球空间数据分析和可视化。然而,目前,除了需要许可的ArcGIS GeoAnalytics服务器之外,它们还没有对大数据地理空间分析的广泛支持。同时,我发现Google BigQuery是多么强大,它最近提供了对地理空间处理和分析的支持(为您使用的东西付费,每秒)。 我想知道的是:我应该选择哪个工具进行地理空间大数据处理、分析和可视化?哪个工具(ESRI和BigQuery)更适合用于什么? 我想在非常大的时间地理空间数据集上运行复杂的查询,最后在地图上可视化结果。 请注意,我刚刚开始了对地理空间大数据处理的研究,
浏览 5
提问于2019-10-28
得票数 0
回答已采纳
3
回答
如何从“大数据”转到网页?
、
、
、
我花了很多时间阅读和观看人们谈论如何在他们的架构中使用为处理海量数据集和实时处理而设计的工具的视频。虽然我知道Hadoop/Cassandra/Kafka等工具是做什么的,但似乎没有人解释数据是如何从这些大型处理工具中获得的,以便在客户端/网页上呈现一些东西。 根据我对大数据工具的理解,你不能用标准的web应用查询MySQL的方式来构建你的应用程序,考虑到流经这些工具的数据的大小,我可以理解这一点,然而,对于所有这些“实时数据分析”的说法,我找不到任何解释来解释实际的分析是如何以图表/表格等形式呈现在某人面前的?
浏览 0
提问于2017-09-07
得票数 0
7
回答
职业转换为大数据分析
我是一个35岁的IT专业人士,纯粹是技术人员。我擅长编程,学习新技术,了解它们和实现。我在学校里不喜欢数学,所以我的数学成绩不好。我对追求大数据分析的职业非常感兴趣。我更感兴趣的是分析,而不是大数据技术(Hadoop等),尽管我并不不喜欢它。然而,当我在互联网上环顾四周时,我发现,擅长分析的人(数据科学家)主要是数学毕业生,他们完成了PHds课程,听起来像聪明的生物,远远领先于我。有时候,我会害怕自己的决定是否正确,因为你自己学习预先的统计数据是非常困难的,需要艰苦的工作和时间的投入。 我想知道我的决定是否正确,还是应该把这份工作留给那些一生在名校学习并获得学位和博士学位的知识分子。
浏览 0
提问于2014-10-06
得票数 9
回答已采纳
2
回答
数据分析背后的思维过程
、
我正在寻找书籍/教程,帮助您获得对数据分析背后的思想过程的洞察。 我读过的大部分书都是文档--作者向您展示了他应用该函数的一个函数和一些数据。它们还展示了如何使用图表和直方图/盒图等。他们经过像numpy这样的流行图书馆,熊猫,以及如何使用它们。 我感兴趣的是,“泰坦尼克号”上的Kaggle如何从(例如)Kaggle的内核中获得他们的想法,以及如何应用于数据集。这些人知道哪些列是彼此之间的函数,什么时候绘制直方图,什么时候绘制密度函数等等。 我对机器学习有一定的经验。很明显,哪种算法可以应用于何种情况。数据探索似乎是一项非常模棱两可的工作,有许多解决方案/想法。 另一种说法是:从哪里可以得到数
浏览 0
提问于2017-06-17
得票数 2
1
回答
NetCDF:如何创建366天年份的时间值列表(all_leap或366_day日历)?
、
、
我想写一个NetCDF,它将包含所有年份的每年366天,在非闰年的情况下,将2月28日的值重复为2月29日的值。我如何构建时间值的列表/数组,以便在非闰年期间,2月29日时隙包含与2月28日相同的时间值?这真的是我想要做的吗,还是有另一种通常用于此的方法?我还没有找到如何创建具有日历属性all_leap或366_day的时间坐标变量的示例。 我担心的是,为了满足Panoply等软件的要求,我需要对非闰年的“填充物”2月29日做一些说明。Panoply是我在进行数据分析时用于快速绘图的软件。我指的不是数据变量值,我指的是实际的时间步长值,例如“自1900年以来的5894天”。例如,当我一步一步地
浏览 1
提问于2018-03-09
得票数 0
2
回答
与云中数据分析(数据清理)相关的成本
、
、
、
、
我是数据分析员。我的公司正在将所有的数据科学转移到云提供商(可能是Azure,GCP,AWS)。所有的数据科学编程工具,如木星笔记本,都将安装在云环境中(不会在本地安装Python,也不会在笔记本电脑上安装木星笔记本)。 在我的大部分工作中,我将直接从一个前提数据库中读取/吸收关系数据库表。而且,我的大部分数据分析工作不需要任何GPU实例来进行数据处理。有时,我也做一些简单的研究或实验数据分析编程,例如使用木星笔记本进行数据清理,而不需要使用GPU实例。 我想知道,在我的任务都不使用GPU的情况下,我的公司在他们的数据科学云计算平台上是否有可能进行这样的活动,而不用支付任何每次使用的费用或不必
浏览 2
提问于2021-10-17
得票数 0
回答已采纳
4
回答
机器学习/数据分析的类型
我正在寻找一个框架或图表,分类所有不同类型的数据分析/机器学习。我想用这个分类来组织我的知识/领域学习。 我所指的数据分析/ML类型的例子包括:-地理地图-图像识别(CV,OCR.)-信号处理-文本/语音理解 是否有对所有这些领域进行分类的图表/框架?
浏览 0
提问于2019-11-21
得票数 1
1
回答
Drupal 7中的多个站点和性能
、
我帮助管理与课程课程相关的一组网站。每个站点都是一个单独的Drupal 7安装,有自己的主题、模块、用户列表、内容类型、实体结构和代码库--所有这些都是相同的(不是共享的,而是在所有站点之间复制的)。它们都运行在同一台服务器上,作为不同的Drupal实例。我不太喜欢管理每个单独的站点及其模块、库和主题,但这是我继承的设置。 现在我们正在考虑在集群中添加几个站点。这是一个以不同方式组织的机会,我还没有找到任何关于哪种方法更好的足够数据。在我看来,这是我的三个选择。 多个Drupal实例(我们现在拥有的方式)。 优势: 如果一个实例的代码中断,其他实例将继续运行。 独立的用户列表、分类法等的机会(
浏览 0
提问于2016-08-23
得票数 1
1
回答
使用Spark将Cassandra数据持久化到S3的最简单方法
、
、
、
、
我正在尝试找出如何最好地存储和检索数据,从S3到Cassandra,使用Spark:我在Cassandra中存储了日志数据。我使用DSE运行Spark来执行数据分析,它工作得很好。日志数据每天都在增长,在任何给定的时间,我只需要在Cassandra中使用两周。我仍然需要在某个地方存储较旧的日志至少6个月,经过研究,带有Glaciar的S3看起来是最有希望的解决方案。我想使用Spark来运行一个日常作业,该作业查找第15天的日志,将它们从Cassandra中删除,然后将它们发送到S3。我的问题是:我似乎无法确定正确的格式来将Cassandra行保存到文件中,这样有一天我可能会将文件重新加载到Sp
浏览 0
提问于2015-07-18
得票数 4
2
回答
如何将Kinesis数据流合并为一个数据流以进行Kinesis数据分析?
、
、
、
我有多个AWS kinesis数据流/firehose和CSV格式的结构化数据。我需要使用运动数据分析对这些数据执行分析。但是如何将多个流合并为一个流呢?因为Kinesis数据分析仅从一个流中获取数据。数据流可以存在于不同的地域。 问题:如何将Kinesis数据流合并为一个用于Kinesis数据分析的数据流?
浏览 3
提问于2020-08-25
得票数 0
1
回答
AWS弹性MapReduce和AWS红移有什么区别?
、
、
我看到AWS弹性MapReduce和AWS都使用集群结构,并且可以用于数据分析。它们的不同用例是什么? 支持与多种应用程序的客户端连接,包括商业智能(BI)、报告、数据和分析工具。 (Amazon )是一个托管集群平台,它简化了在AWS上运行大数据框架(如Apache和Apache )来处理和分析大量数据的过程。
浏览 1
提问于2016-06-04
得票数 15
回答已采纳
1
回答
数据库:导出数据分析报告
、
、
在使用display(dataframe_name)之后,Databricks可以创建数据分析报告。 我已经使用创建了一个数据分析报告,但是我不知道如何导出它。请你建议如何将这份报告导出/下载到我的本地系统好吗?
浏览 8
提问于2022-11-25
得票数 0
回答已采纳
1
回答
在DBLP数据集中查找聚类数
我正在尝试使用研究领域来查找DBLP V11数据集中的聚类数。 我已经尝试使用doc2vec预训练和word2vec预训练平均,并使用DBSCAN、层次聚类对结果进行聚类,并使用肘部方法、轮廓方法和差距统计获得聚类的数量。 我从这里得到一个或两个集群,因为所有的文章都与计算机科学相关,但我需要找出计算机科学中的子领域的数量。
浏览 16
提问于2019-05-22
得票数 0
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
大数据分析为什么要学概率统计
如何学习大数据分析课程?
如何分析和激活大数据:大数据分析
鹰眼大数据分析如何去助力制造行业?
Smartbi数据分析工具处理大数据性能如何?
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券