腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
视频
沙龙
9
回答
R语言是否适合大数据
、
R有许多针对数据分析(如JAGS、BUGS、ARULES等)的库,并在流行的教科书中被提到,如: J.Krusche,进行贝叶斯数据分析;B.Lantz,“机器学习与R”。 我已经看到了5TB的指南,将数据集视为大数据。 我的问题是:R是否适合在大数据问题中通常看到的数据量?在这样的数据集中使用R时是否使用策略?
浏览 0
提问于2014-05-14
得票数 55
回答已采纳
1
回答
500G 在哪儿能找到资料?
、
、
、
、
500G python web、爬虫、数据分析、机器学习、大数据、前端实战项目视频代码免费分享 在哪儿能下载到资料,在线等,挺急的~, 感谢各位大佬~
浏览 245
提问于2019-05-10
2
回答
最佳编程语言
、
、
我精通纯粹的统计学。我不懂任何编程语言。这是我应该学习的最好的编程语言,它将有助于提高我在数据分析方面的职业生涯。 我对概念只有理论知识。请推荐一项技能,我应该发展成为一名数据分析员。
浏览 0
提问于2018-07-06
得票数 1
1
回答
深层神经网络与大数据分析
、
、
、
我是一名准PhD (CS)学生。在我的MS研究期间,我在异常检测领域工作过。现在,我有两个主要的和最近出现的领域可供选择,即深度神经网络和大数据分析。然而,我必须选择一个作为我未来的工作领域。 我想把其中一个领域和我以前的工作联系起来,那就是异常检测。此外,我还要问两个问题: 深层神经网络与大数据分析,哪一种更适合异常检测? 深层神经网络与大数据分析相比,未来还有更大的发展空间吗?
浏览 4
提问于2017-06-06
得票数 0
回答已采纳
1
回答
数据分析中的数据量是否重要?
、
、
、
、
因此,我想知道数据分析是否可以通过使用少量的数据来完成,比如存储在database.If中的100到1000个记录--我这样做了--那么它是数据分析吗? 有人说,如果你分析的是少量的数据,那根本就不是数据分析。 所以我把数据分析和大数据混淆了。有人能回答我这个问题吗? 我要提前感谢你
浏览 0
提问于2019-02-01
得票数 0
回答已采纳
1
回答
大数据分析参考文献
我正在寻找一个好的入门书或课程的大数据分析。在实际应用方面,我对在R中使用大数据工具特别感兴趣。 我想要一本书,但欢迎其他参考资料。 谢谢!
浏览 0
提问于2016-11-21
得票数 1
回答已采纳
5
回答
机器学习概述
、
、
这可能不是要问的问题类型,而只是想知道其他人在大型企业环境中实现机器学习算法时需要考虑哪些因素。 我的目标之一是研究行业机器学习解决方案,可以根据我的公司的具体需要。我是我的团队中唯一有数学背景的人,而且以前读过一些机器学习算法的背景资料,我的任务是解释/比较这个行业的机器学习解决方案。从我在谷歌上收集到的信息来看,似乎: 机器学习和预测分析并不完全一样,所以当一个公司提供预测分析软件和机器学习软件时,有什么本质上的区别呢?(例如IBM预测分析相对于Skytree Server) 很多流行的术语经常被纠缠在一起,特别是关于大数据、Hadoop、机器学习等等。有人能澄清这些术语之间的区别吗?根据
浏览 8
提问于2013-04-18
得票数 2
2
回答
最佳数据科学编程语言
、
我正在学习JS,HTML和CSS,但我怀疑JS很擅长数据分析。那么,你们会推荐我学什么来开始我在数据科学的“事业”呢?处理数据的最佳编程语言是什么?我喜欢统计和编程,所以我觉得这会很有趣。
浏览 0
提问于2017-06-21
得票数 2
回答已采纳
4
回答
我应该使用哪些初始步骤来理解大型数据集,以及应该使用哪些工具?
、
、
、
注意:在机器学习方面,我是一个完全的初学者,但我渴望学习。 我有一个很大的数据集,我试图在其中找到模式。数据之间可能没有关联,无论是与已知变量,还是包含在数据中但我还没有意识到的变量实际上都是相关的变量。 我猜这将是数据分析领域中一个常见的问题,所以我有几个问题: “灵丹妙药”是将所有这些数据扔到一个统计/数据分析程序中,然后对数据进行处理,寻找已知/未知的模式,试图找出它们之间的关系。是否适合SPSS,或者是否有其他更适合的应用程序。 我应该学习像R这样的语言,并弄清楚如何手动处理数据。这难道不是像我必须手动指定什么以及如何分析数据那样去寻找关系吗? 专业的数据采掘者将如何处理这一问题,S/
浏览 0
提问于2014-08-19
得票数 10
回答已采纳
7
回答
职业转换为大数据分析
我是一个35岁的IT专业人士,纯粹是技术人员。我擅长编程,学习新技术,了解它们和实现。我在学校里不喜欢数学,所以我的数学成绩不好。我对追求大数据分析的职业非常感兴趣。我更感兴趣的是分析,而不是大数据技术(Hadoop等),尽管我并不不喜欢它。然而,当我在互联网上环顾四周时,我发现,擅长分析的人(数据科学家)主要是数学毕业生,他们完成了PHds课程,听起来像聪明的生物,远远领先于我。有时候,我会害怕自己的决定是否正确,因为你自己学习预先的统计数据是非常困难的,需要艰苦的工作和时间的投入。 我想知道我的决定是否正确,还是应该把这份工作留给那些一生在名校学习并获得学位和博士学位的知识分子。
浏览 0
提问于2014-10-06
得票数 9
回答已采纳
1
回答
我在哪里可以学习ipython语言?
在韩国,我认为很少有人使用ipython (不是python)。 因此,没有有用的信息和社区。 现在,我正在学习一本关于数据分析的书(用于数据分析的python)。 但是独自学习ipython是很困难的。 在哪里可以获得有关ipython的有用信息?
浏览 1
提问于2014-04-10
得票数 0
回答已采纳
4
回答
机器学习/数据分析的类型
我正在寻找一个框架或图表,分类所有不同类型的数据分析/机器学习。我想用这个分类来组织我的知识/领域学习。 我所指的数据分析/ML类型的例子包括:-地理地图-图像识别(CV,OCR.)-信号处理-文本/语音理解 是否有对所有这些领域进行分类的图表/框架?
浏览 0
提问于2019-11-21
得票数 1
1
回答
将数据科学包安装到vanilla python
、
、
如何在不使用github或anaconda的情况下下载必要的python包进行数据分析(例如pandas、scipy、numpy等)和机器学习包(sci-kit learn用于初学者,tensorflow用于深度学习等)? 我们的客户允许我们在终端中安装python 3.6及更高版本(32位),用于数据分析和机器学习项目,但由于安全限制,我们无法访问github,也无法下载anaconda包。 请提供合适的网页链接和说明。
浏览 1
提问于2017-07-06
得票数 0
1
回答
关于数据挖掘和机器学习的参考文献/教程
、
我正在学习数据分析,我想知道是否有一些关于机器学习、数据分析和数据挖掘的好的参考资料和教程。 我正在寻找的是一个可以理解的参考/教程,它不是很技术性的,也不是很基本的,换句话说,材料是从迈向高级步骤的基本步骤开始的。 谢谢。
浏览 0
提问于2021-01-25
得票数 3
回答已采纳
2
回答
NoSQL数据库在数据科学中的应用
、
、
如何使用NoSQL数据库(如MongoDB )进行数据分析?它们中有哪些特性可以使数据分析更快、更强大?
浏览 0
提问于2014-07-21
得票数 21
回答已采纳
3
回答
大数据案例研究或用例示例
、
、
我读过很多关于不同行业如何使用大数据分析的博客文章。但这些文章大多没有提到 这些公司使用了什么样的数据。数据有多大? 他们用来处理数据的工具是什么? 他们面临的问题是什么,他们得到的数据是如何帮助他们解决问题的。 他们如何选择工具\技术来满足他们的需要。 他们从数据中识别出了什么样的模式&他们从数据中看到了什么样的模式。 我想知道是否有人能为我提供所有这些问题的答案或一个链接,至少回答一些问题。我正在寻找现实世界的例子。 如果有人能分享金融业是如何利用大数据分析的,那就太好了。
浏览 0
提问于2014-06-11
得票数 14
2
回答
处理大数据和数据可视化的最佳工具
、
、
我目前正在做(开始)我的大数据和数据可视化项目。所以请让我知道有没有最好的软件来处理大数据和数据可视化,即数据分析。
浏览 3
提问于2013-01-17
得票数 0
回答已采纳
1
回答
分组/聚类相似单词python
、
我有一个关于类似词分组的问题,例如,我有下面的单词清单: 人工情报 人工智能 AI 机器学习 毫升 数据分析 数据与分析 我想把这些词归类到人工智能,机器学习,数据分析中 我使用了difflib.get_close_matches(),但这并没有给我想要的结果,例如,这就是difflib组: Information‘:“信息技术”、“移动技术”、“新技术” 我也使用了fuzz.token_set_ratio(),但这也没有提供我想要的结果。两个人都没有。 如果有机器学习算法或python库,请告诉我。 谢谢
浏览 0
提问于2018-08-01
得票数 1
1
回答
我 想好好学精通一门技术,大家用的走过的路,帮我指点指点呗 让我少走了弯路和坑的苦 ?
自学,自己摸索 白白浪费大把时光 一是,自我学习的总结。 二是,降低他人的学习成本。 三是,别人对自己学习结果的审核。
浏览 289
提问于2020-09-25
1
回答
非大学数据分析职业生涯的准备
我从大学退学,但对数据分析的职业很感兴趣。现在我每天大约学习10个小时。通过浏览Linkedin上的招聘信息,我可以编写一个粗略的课程。如果你能加上一个我省略过的题目,或者删除一个在市场上成功所不需要的科目,对我会有很大的帮助。 课程(三科分组): 组1 单变量微积分 蟒蛇简介 SQL 第二组 多元微积分/线性代数 离散数学 数据结构和算法 第三组 基于微积分的统计与概率 Hadoop堆栈 微分方程组 第4组 统计学习/预测建模 Python数据分析技术/R中的统计编程 机器学习基础 一直以来,我计划使用任何我可以在网上找到的数据集来练习。这是否足以获得一份数据分析的工作?当然,我计划学习的远
浏览 0
提问于2015-05-13
得票数 4
回答已采纳
2
回答
DataOps是什么?
、
这个网站已经有了很好的答案,比如什么是DevOps和什么是SecOps。 随着时间的推移,我逐渐认识到,当敏捷方法的哲学应用于运营时,意见就诞生了DevOps。SecOps也是如此。 那么,将敏捷方法应用于大数据和数据分析的DataOps会是什么样子呢?这与敏捷软件开发和DevOps有何相似之处?
浏览 0
提问于2019-11-13
得票数 3
6
回答
facebook数据泄漏:大数据分析竟能操控美国大选?
、
、
、
近日,facebook的数据泄露事件引起广泛讨论,罪魁祸首剑桥分析公司通过数据分析来帮助企业和政党改变受众行为。他甚至声称“只要了解用户的十个赞,就能比用户的同事更准确地评价用户”。那么大数据分析真的有他们所说的那么强吗?这是怎么样做到的?公众的个人隐私又该如何保护?
浏览 850
提问于2018-03-26
1
回答
python中相似但准确的词组及其缩写
、
、
我有一个问题,关于将类似的单词及其缩写组合成一个组,例如,我有下面列出的单词列表: 人工情报 人工智能 AI 机器学习 毫升 数据分析 数据与分析 我想把这些词归类为人工智能,机器学习,数据分析 我使用了difflib.get_close_matches(),但这并没有给我想要的结果--例如,下面这个词是这样的:信息技术:‘信息技术’,‘移动技术’,‘新技术’ 我也使用了fuzz.token_set_ratio(),但这也没有提供我想要的结果。两个人都没有。 如果有机器学习算法或python库,请告诉我。 谢谢
浏览 1
提问于2018-08-02
得票数 3
2
回答
如何在windows 10上安装python 3.5熊猫
、
、
我对python很陌生,我想通过python3.5学习数据分析,同时通过cmd安装,它显示了警告。
浏览 2
提问于2016-07-27
得票数 0
10
回答
大数据对人工智能深度学习有何影响?
、
我们都知道当下人工智能已经走向了风口,而大数据是人工智能技术进行深度学习的基石,究竟大数据对人工智能的深度学习有什么影响呢?
浏览 1433
提问于2018-03-30
2
回答
将关键字转换为python dataframe列中的列表
、
、
我从另一列中提取关键字,创建一个新的列(硬技能),如下所示:() 但我想让每个关键字成为一个列表格式,在“硬着陆技能”栏。例如,对于“硬技能”列的第一行,我希望得到的结果是: “'Python编程”,“机器学习”,“数据分析”。 而不是 Python编程,机器学习,数据分析。 这就是我如何将关键词过滤到新的“硬技能”专栏中。 #筛选并创建新专栏,介绍硬技能hard_skills =“Python编程”、“统计”、“统计假设测试”、“数据清理”、“Tensorflow”、“机器学习”、“数据分析”、“数据可视化”、“云计算”、“R编程”、“数据科学”、“计算机编程”、“深度学习”、“数据
浏览 9
提问于2022-11-25
得票数 0
2
回答
为什么基于树和集成的算法不需要特征缩放?
、
、
、
、
最近,我对数据分析很感兴趣。 所以我研究了如何做机器学习项目,并自己做。 我学到了在处理特性时缩放是很重要的。 因此,我在使用决策树或LightGBM等树模型时对每个功能进行了缩放。 然后,当我缩放时,结果会更差。 我在互联网上搜索,但我得到的结果是树和集成算法对数据的方差不敏感。 我还买了一本O‘’Relly的书“Hands on Machine-learning”,但是我没有得到足够的解释。 我能得到更详细的解释吗?
浏览 2
提问于2021-09-25
得票数 0
1
回答
大数据和小数据的优缺点?
我在寻找更深入的答案。我知道基础知识--小数据分析起来更快,使用大数据你会有更多的能力,等等。但我想知道更多(也许是关于因果推断?)关于每种方法的优点和缺点。谢谢!
浏览 3
提问于2017-10-11
得票数 1
1
回答
长时间运行的进程和托管提供商?
、
、
、
我有一个运行了好几个小时的python数据分析脚本,当它在我的桌面上运行时,随着粉丝们的狂热,我意识到我可以在bkgnd中的一个托管账户上远程运行它,然后让它破解。 但我想知道--托管提供商通常不赞成这样的做法吗?他们是否假设我所有的CPU/内存使用都是突发性的--来自我的Apache2实例的使用率,一个运行了12小时的进程会被他们的sysop杀死? 或者他们会认为我是在为使用付费,所以你自己动手吧?我的脚本及其数据是自包含的,没有使用任何网络或数据库资源。 有这方面的经验吗?
浏览 8
提问于2015-11-12
得票数 0
1
回答
星火堆中的火花调度器与独立调度器
、
火花核心中的调度程序和下面的Stack中的独立调度程序之间有什么区别(来自学习火花:闪电-快速大数据分析书)?
浏览 0
提问于2018-04-10
得票数 4
回答已采纳
3
回答
Python的大熊猫/matplotlib/海运带来了Tableau没有的东西?
、
、
、
我花了一年时间学习Python。作为一个认为编码不可能为CS/IT领域之外的人学习的人,我显然被几行Python代码的强大功能所吸引! 总的来说,我已经达到了一个中等水平,我为自己感到骄傲,因为与Excel相比,它极大地扩展了我在数据分析和可视化方面的可能性(除了Python的其他数百万用途之外)。 纯粹在数据分析和可视化方面: 使用pandas/matplotlib/seaborn/numpy处理相同的数据集会给表带来什么,而不是使用Tableau? (sidenote:我非常失望地看到我所有辛苦挣来的Python数据争论技能都可以在这样一个用户友好的GUI.:'( )
浏览 0
提问于2020-03-29
得票数 13
回答已采纳
2
回答
使用PYTHON进行分析
、
我想学习数据分析。 从哪里开始?在哪里我能找到关于分析的概念? PYTHON中用于分析的所有框架是什么?这可能对我的事业有好处(PYTHON或R)
浏览 5
提问于2015-11-18
得票数 0
回答已采纳
1
回答
级联和级联有什么区别?
、
、
、
、
当我正在学习数据分析时,我的一些课程中出现了连接和连接这两个词。我知道如何使用它们,但我不知道是什么使两者不同。
浏览 4
提问于2022-07-24
得票数 0
1
回答
强化学习教材或在线资源
尊敬的各位议员: 我想在我的数据分析课程中介绍RL,我正在为学生寻找最好的资源。你对教科书或在线资源有什么建议,可以帮助学生学习RL吗?非常感谢。
浏览 4
提问于2022-11-23
得票数 0
回答已采纳
9
回答
近日开放的腾讯云“米大师”平台在支付计费领域有什么优势?
腾讯云“米大师”最近对社会进行开放,其产品定位提到的聚合支付、对账结算、数据分析和立体监控都是什么意思?仅仅理解为腾讯对接其旗下的多款游戏和应用的氪金官方平台吗?长远角度看是否拥有更广的应用市场?
浏览 2183
提问于2018-04-25
3
回答
扩充拓扑(整形)神经网络的神经进化可以在TensorFlow中构建吗?
、
、
、
我正在制作一个用于时间序列数据分析的机器学习程序,使用NEAT可以帮助我完成这项工作。我不久前才开始学习TensorFlow,但似乎TensorFlow中的计算图通常是固定的。TensorFlow中是否有工具可以帮助构建动态进化的神经网络?或者像Pytorch这样的东西会是更好的选择?谢谢。
浏览 10
提问于2018-09-12
得票数 7
2
回答
hadoop与mongodb和hadoop对mongodb
、
、
我试图理解mongoDB和Hadoop之间的关键区别。我理解mongoDB是一个数据库,而Hadoop是一个包含HDFS的生态系统。使用这两种技术处理数据的方式有一些相似之处,但也有很大的不同。 我不明白为什么有人会在Hadoop集群上使用mongoDB,主要是mongoDB比Hadoop具有什么优势。两者都执行并行处理,两者都可以与Spark一起用于进一步的数据分析,那么什么是一个比另一个的增值。 现在,如果要将两者结合起来,为什么要在mongoDB和HDFS中存储数据呢?MongoDB有map/reduce,所以为什么要将数据发送到hadoop进行处理,而且两者都与Spark兼容。
浏览 1
提问于2019-05-07
得票数 0
回答已采纳
1
回答
导出用scikit创建的"RandomForestRegressor“模型--学习库
、
、
、
我正在开发C#应用程序,我需要使用机器学习算法(随机森林)。C#不太适合进行数据分析,所以我将数据保存到.csv文件中,然后使用伟大的科学学习库在Python中进行分析。我训练了RandomForestRegressor (像那里的),它给出了相当好的结果。但是现在我需要在我的C#应用程序中使用这个模型。是否有方法从C#导出模型-学习库并使用它?
浏览 4
提问于2013-07-29
得票数 1
回答已采纳
1
回答
如果我的数据不能存储在内存中,执行EDA并将其可视化?我的数据集大小是200 G
、
、
、
、
执行探索性数据分析是任何机器学习项目的第一步,我主要是用熊猫来使用内存中的数据集进行数据探索。但是我想知道如何进行数据清理,如何处理丢失的数据和数据离群点,单变量图,特征如何影响标签的密度图,相关性等等。 熊猫很容易用Python进行数据分析。但是,由于系统内存有限,我发现在Pandas中处理多个更大的数据文件很困难。 对于大于RAM大小的数据集.千兆字节 我看过一些教程,其中他们使用星星之火过滤出基于规则的数据,并生成一个适合于内存的数据格式.最终,总有完全驻留在内存中的数据,但我想知道如何使用大数据集并执行探索性数据分析。 另一个挑战是可视化大数据进行探索性数据分析.如果它适合内存,那么就
浏览 0
提问于2018-08-03
得票数 0
回答已采纳
1
回答
在什么情况下,我可以使用Dask而不是Apache?
、
、
、
我目前正在使用Pandas和星火进行数据分析。我发现Dask提供并行化的NumPy数组和Pandas DataFrame。 熊猫很容易用Python进行数据分析。但是,由于系统内存有限,我发现在Pandas中处理多个更大的数据文件很困难。 简单回答: Apache是一个集分布式计算、SQL查询、机器学习等多种功能于一体的框架,它运行在JVM上,通常与Hadoop等其他大数据框架协同部署。..。通常,达斯克比火花更小,重量更轻。 我从了解了下面的细节 达斯克重量轻 Dask通常在一台机器上使用,但在分布式集群上也运行良好。 Dask提供并行数组、数据帧、机器学习和自定义算法。
浏览 4
提问于2016-08-10
得票数 101
2
回答
R用户的Numpy?
、
、
、
这里有长期的R和Python用户。我使用R进行日常数据分析,使用Python处理文本处理和shell脚本方面的更重任务。我正在处理越来越大的数据集,当我得到这些数据集时,这些文件通常是二进制文件或文本文件。我通常做的事情是应用统计/机器学习算法,并在大多数情况下创建统计图形。我有时在SQLite中使用R,并为迭代密集型任务编写C;在研究Hadoop之前,我正在考虑在NumPy/Scipy上投入一些时间,因为我听说它有更好的内存管理,而对于有我背景的人来说,向Numpy/Scipy的过渡似乎没那么大--我想知道是否有人有使用这两种方法的经验,并且可以评论在这方面的改进,以及Numpy中是否有关于
浏览 4
提问于2010-08-23
得票数 10
回答已采纳
2
回答
大数据到哪里去了,它是如何存储的?
、
、
、
我试图掌握大数据,主要是如何管理大数据。 我熟悉数据管理和数据生命周期的传统形式;例如: 收集的结构化数据(如网页表格) 存储在数据库服务器RDBMS中的表中的数据 数据清理后,ETL进入数据仓库 数据使用OLAP多维数据集和其他各种BI工具/技术进行分析。 但是,在大数据的情况下,我对第2点和第3点的等效版本感到困惑,主要是因为我不确定每个大数据“解决方案”是否总是涉及使用NoSQL数据库来处理和存储非结构化数据,以及数据仓库的大数据等效是什么。 据我所见,在某些情况下,NoSQL并不总是被使用,而且可以完全省略--这是真的吗? 对我来说,大数据生命周期就是这样的:
浏览 7
提问于2017-04-20
得票数 7
回答已采纳
1
回答
是否有一种方法可以快速确定CSV文件的排序方式?
、
、
、
、
我在记事本中打开了一个CSV文件,其中包含在一个有20列和超过33,000行的城市区域中发放的建筑许可证的数据。目前还不清楚文件是如何排序的。这可能只是一个数据转储,但我不确定。因此,我想知道是否有最好的方法来快速判断数据是如何排序的。有什么方法可以解决这个问题吗?我目前是一名数据分析专业的学生,学习使用python、pandas、Jupyter Notebook等进行数据分析
浏览 25
提问于2020-08-12
得票数 1
1
回答
如何在大数据和网络分析中起步
、
、
、
、
我目前对大数据分析和网络分析感兴趣,但我不知道如何开始和从哪里开始。我试着上网看看,但有些对我来说是先进的。走这条路之前,我首先需要的是统计学和数学方面的技能和知识吗? 我目前的计划是每个周末参加在线课程,因为我目前在工作日做软件助理工程师,练习大数据所需的编程语言,比如R。我已经获得了计算机科学学位,所以熟悉一些统计和数学方法并不是个问题。任何建议和意见都是非常感谢的! 对于那些已经有经验的人来说,你的经验是怎样的,你最擅长的是什么?
浏览 3
提问于2016-04-01
得票数 0
回答已采纳
2
回答
如何将Python代码与C#.Net核心语言集成?
、
、
、
、
我正在尝试将python代码集成到我的.net核心应用程序中,用于数据分析和一些机器学习分类。我该怎么做才是最好的方法呢? 注意:我不想用IronPython执行脚本。我以前已经试过了。
浏览 1
提问于2018-08-24
得票数 12
回答已采纳
1
回答
如果我了解了这个图像中的所有内容,我是否能够获得一份数据分析工作?
、
、
、
印度 问这样一个问题是因为我有兴趣自己学习所有的东西,我也不知道该读些什么。我对读书很感兴趣,这就够了吗?还是我应该强制参加一个课程并取得证书(因为有人说我可能会强制要求证书)?如果你是印度的数据分析师或数据科学家,请有人对此发表一些看法。(如果你是印度的数据分析师或数据科学家)谢谢。 **我是商科毕业生,对数据科学感兴趣 📷
浏览 0
提问于2018-12-26
得票数 0
1
回答
SQLite的尺寸限制和性能
、
、
我已经研究过一些数据库,比如MySQL,但我从来没有专门处理过数据库。我正在进行一个项目,我们打算使用SQLite (出于一些原因:小型、轻量级、快速等),然后我对它有一些疑问: SQLite支持多少千兆字节的数据?有限度吗?(我将为每个用户提供一些大型数据表(例如,18列X 80.000行)) 读取大量数据快吗?(例如,18列X 80.000行) 关于SQLite,还有其他相关的信息我需要知道吗?(注:我将在Windows和OS上使用它) 附加信息 我正在开发的软件是一个数据分析软件,我只需要使用DB来保存使用一些传感器从用户那里收集到的数据。 我在项目中使用QT5.3.2 (C++)。
浏览 0
提问于2016-12-02
得票数 0
4
回答
用于数据分析的R
、
、
我已经编程一年了,我对数据分析和机器学习非常感兴趣。我参加了几个在线课程,正在读几本书。 我所做的每一件事都使用R或Python,我正在寻找关于我是否应该专注于一种语言(如果是的话)还是同时使用这两种语言的建议;它们是相辅相成的吗? --我应该提到,我在学校使用C#,但通过自学熟悉Python .
浏览 0
提问于2013-01-03
得票数 60
回答已采纳
5
回答
用Spyder / Python打开.npy文件
、
、
抱歉的。我现在正在学习Python和所有与数据分析有关的东西。 我到底怎么用Spyder打开一个.npy文件?或者我必须使用另一个程序?我使用的是Mac,如果这与此相关的话。
浏览 0
提问于2015-11-24
得票数 23
1
回答
自动化客户端自注册的原始导出数据清理-格式始终不同
、
、
、
、
所以这是一个比较普遍的问题。我是一家初创公司的数据分析师。我的主要流程包括获取客户拥有的现有客户数据,并将其清理/标准化以适应我们的平台,这是我们自注册过程的一部分。我们团队的一名成员从他们正在转换的系统中导出他们的数据,或者,如果他们在内部跟踪数据,我们会收到他们用来跟踪数据的Excel日志。它总是采用不同的格式,并且需要广泛的清理(平均1分钟/条)。我们通常是一个大表(.xlxs格式),在清理之后,将它拆分为四个.csv文件;我们在我们的平台上以四个表的形式加载它们。 我觉得我已经很好地优化了流程,包括流程步骤和excel函数(if、concat、text-to-column等)的清理。我
浏览 0
提问于2017-09-29
得票数 0
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何学习大数据分析课程?
大数据分析机器学习AI入门指南
大数据分析R为什么要学习SQL知识
大数据分析+机器学习,人人都是分析师
大数据学习入门必须掌握最常用的四种大数据分析方法
热门
标签
更多标签
云服务器
ICP备案
对象存储
实时音视频
云直播
活动推荐
运营活动
广告
关闭
领券