腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Apache Spark:多
机器
学习
ALgorithm的并行化
、
、
我的用例是这样的: A)运行多
机器
学习
算法(Naive Bayes,ANN,Random Forest等)并行的。1)使用10次交叉验证验证每个算法B)将步骤A)的输出馈送到第二层
机器
学习
算法中。我的问题是:我们可以并行运行步骤A中的多个
机器
学习
算法吗?我们可以并行进行交叉验证吗?比如,并行运行10个迭代的朴素贝叶斯训练? 我找不到任何方法来并行运行不同的算法。而且似乎交叉验证也不能并行进行。
浏览 2
提问于2017-09-04
得票数 0
1
回答
H20
机器
学习
库中火花水的优点
、
、
、
我知道H20是在星火环境下执行的,所以它可以使用火花引擎(和所有的星火
分布式
结构)来分配
计算
,但是就性能而言,H2O已经是一个
分布式
和可伸缩的
机器
学习
库了。而且,独立版本的H2O真的能够管理
计算
机集群上的
分布式
处理吗?
浏览 1
提问于2017-12-19
得票数 1
回答已采纳
1
回答
大数据集的
机器
学习
开发工作流
、
、
当您有一个300 of的大型数据集,而您的
计算
机只有250 of内存时,您会使用什么工作流程?一定要在本地使用dev集,但您是否将300 do的容量放在S3存储桶上用于生产,以便在不使用时很容易关闭AWS,并且在
计算
完成时很容易提取模型? 我做了几个基本的测量,从s3加载一个文件平均需要5秒。
浏览 0
提问于2018-04-20
得票数 0
1
回答
异步算法使用什么框架?
在这个
分布式
的数据科学环境中有没有类似的框架?
浏览 0
提问于2015-07-09
得票数 2
3
回答
统计+
计算
机科学=数据科学?
、
、
我
学习
了应用统计学(精算科学),所以我有一个很好的统计背景(回归、随机过程、时间序列等等)。但现在,我要攻读智能系统的
计算
机科学硕士学位。这是我的
学习
计划:高级
机器
学习
模糊逻辑
分布式
数据系统知识发现信息检索最后,凭借我所有的统计和
计算
机科学知识,我能称自己为数据科学家吗
浏览 0
提问于2014-07-22
得票数 11
回答已采纳
1
回答
如何在一台
机器
上设置全功能(包括集群)星火
学习
发展?
、
我想开始
学习
Spark 2.0,所以我尝试设置我的dev (Scalav2.11)环境。我不是追求性能,我需要一些东西来模拟一个工作集群,以便我可以
学习
火花。如何设置一个开发环境来
学习
和开发星火应用程序,而不必访问多台
机器
,但仍然能够
学习
和编写
浏览 3
提问于2016-08-13
得票数 0
回答已采纳
1
回答
在具有多个GPU的多台
计算
机上运行TensorFlow?
、
我是
机器
学习
和Tensorflow的新手。我有一个关于TensorFlow
分布式
训练的问题。但是,如果多台
计算
机具有多个GPU,情况会怎样呢?是否可以在几台
机器
之间分配
机器
训练任务?是否有特定的算法/任务,需要这样的分布或多个GPU就足以进行
机器
学习
?这会有需求吗? 谢谢
浏览 8
提问于2019-06-15
得票数 1
回答已采纳
2
回答
要开发像Facebook这样的社交网络,我应该
学习
哪些语言?
、
、
、
、
我说的是服务器端和客户端。我知道一点关于Go,JavaScript,Node.js,PHP,Ruby和Java的知识。我不会试图在几天内达到目标,我知道这是毫无意义的。我计划从为Twitter,Google+,特别是Facebook这样的平台开发小应用程序开始,最后开发一个像Facebook这样的完整平台。谢谢。
浏览 0
提问于2012-06-14
得票数 0
回答已采纳
1
回答
实现用于
分布式
计算
的客户端服务器应用程序
、
、
、
、
我有一堆带有GPU的
机器
(我和我的朋友拥有它们),主要用于游戏和
机器
学习
。与其独立使用每台
机器
,我认为最好将它们作为一个
分布式
系统使用(例如,对
机器
学习
模型进行
分布式
培训),以减少培训时间。我没有开发应用程序的经验(仅限于云应用程序),但我认为在这样的地方创建客户机服务器应用程序会很有趣: 在前端端,客户端(例如我和我的朋友)可以访问系统并查看哪些
机器
可供工作。如果一台
机器
有一个空闲的GPU,那么它应该可以用于工
浏览 1
提问于2019-02-25
得票数 0
回答已采纳
4
回答
在实践中,你需要多少台
机器
才能让Hadoop / MapReduce / Mahout加速非常并行的
计算
?
、
、
、
我需要做一些繁重的
机器
学习
计算
。我在LAN上有少量空闲的
机器
。我需要多少台
机器
才能使用hadoop / mapreduce / mahout分发我的
计算
,从而比没有这些
分布式
框架的单台
机器
上运行的速度快得多?这是一个
计算
开销与收益的实际问题,因为我假设只在两台
机器
之间分配总时间将比不分配并简单地在一台
计算
机上运行更糟糕(因为分配
计算
涉及到所有开销)。 技术说明:
浏览 0
提问于2011-07-14
得票数 6
回答已采纳
1
回答
Apache Storm有没有像Apache Spark那样的
机器
学习
库?
、
、
我正在比较Apache Storm和Apache Spark streaming,以选择
分布式
实时
计算
系统。但是,我找不到Apache Storm是否有像Apache Spark那样的
机器
学习
库。事实上,我想做在线
机器
学习
,这是一个重要的要求。亚西尔
浏览 0
提问于2016-07-08
得票数 2
2
回答
除mahout外,Hadoop平台中的任何其他
机器
学习
库
、
我正在从事一个利用
机器
学习
算法的项目,我选择hadoop/mahout,因为它能够更好地处理大数据。但是mahout只集成了少数算法(不包括一些算法,比如支持向量机),所以我想知道除了mahout之外,Hadoop平台中还有其他
机器
学习
库吗? 非常感谢~
浏览 4
提问于2013-01-23
得票数 0
1
回答
SageMaker
分布式
训练能用于非深度
学习
模式的训练吗?
、
、
、
、
我正在跟踪这个页面,以了解SageMaker的
分布式
培训功能。上面写着:- SageMaker
分布式
培训库只能通过TensorFlow、PyTorch和HuggingFace框架的AWS深度
学习
容器在SageMaker培训平台中使用。这是否意味着我们不能使用SageMaker
分布式
训练来使用传统的
机器
学习
算法(如线性回归、随机森林或XGBoost )来训练
机器
学习
模型?我有一个用例,其中数据集非常大,和
分布式
培训可以帮助模型并行和数
浏览 12
提问于2022-09-17
得票数 -1
1
回答
包含代码的MapReduce实时项目
我想看看代码的大mapreduce作业。请给我一些关于真正的mapreduce项目和实时使用案例的想法
浏览 0
提问于2014-06-25
得票数 0
1
回答
在什么情况下,我可以使用Dask而不是Apache?
、
、
、
简单回答: Dask提供并行数组、数据帧、
机器
学习
和自定义算法。星火通常用于中小型集群,但在一台
机器
上运行也很好。我从下面的链接中了解了更多关于Dask
浏览 4
提问于2016-08-10
得票数 101
2
回答
Python
分布式
机器
学习
、
、
、
我正在寻找一种在任何
计算
机上建立模型的方法,并将其发送到服务器上进行培训,并让它返回图表/精度/权重等。我知道有付费的解决方案,但我正在寻找一个可以自己运行的
分布式
解决方案。
浏览 0
提问于2015-11-15
得票数 7
2
回答
Azure数据库中Python代码的并行化
、
、
、
、
AUC score: {np.max(ROC)}")在我的个人膝上型
计算
机上运行这个程序可以输出以下内容现在,在寻找替代方案时,我被告知了“弹性
分布式
数据集”或"rdd“,经过一番努力,我成功地完成了以下工作: from sklearn.model_selection import train_test_split我猜测no2问题的部分答案与我对集群的选择有关,相对于我个人
计算</e
浏览 0
提问于2021-08-19
得票数 1
回答已采纳
1
回答
在Hadoop和Spark等大数据平台上部署模型
、
、
、
、
大数据平台究竟在哪里适合于数据科学/
机器
学习
项目?现在我需要创建一个实时分类模型。2一旦模型准备就绪,就不需要这些
分布式
平台了,对吗?或者需要它们来进行特征提取?
浏览 0
提问于2017-03-09
得票数 3
1
回答
什么是MapReduce框架?
、
、
、
我有一个项目要做,我必须解释MapReduce是如何工作的。非常感谢。
浏览 8
提问于2016-04-07
得票数 0
回答已采纳
3
回答
机器
学习
与大数据
、
我是一位研究
机器
学习
的研究员。到目前为止,已经走过了几门涉及
机器
学习
算法和社会网络分析的理论课程,从而为
机器
学习
算法的实现和真实数据的输入提供了一些有用的理论概念。的最终目标是能够建立一个分析大数据的工作平台,重点是实现我自己的
机器
学习
算法,并将所有这些集合起来,准备通过处理大数据来解决有用的问题。由于主要的重点是实现
机器
学习
算法,我想问一问是否有任何现有的运行平台,提供足够的CPU资源来输入大量数据,上传自己的算法
浏览 0
提问于2012-12-07
得票数 38
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
深度学习、GPU计算及分布式机器学习原理简介
Ray:为机器学习和大模型而生的分布式计算框架
Petuum:分布式深度学习、机器学习与GPU
《机器学习》笔记-计算学习理论
Uber正式开源分布式机器学习平台Fiber
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券