前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >机器学习服务器文档

机器学习服务器文档

作者头像
冬夜先生
发布2022-02-27 18:55:00
1.3K0
发布2022-02-27 18:55:00
举报
文章被收录于专栏:csico

支持工作负载分布的架构

在具有多个内核的单个服务器上,作业并行运行,假设工作负载可以分成更小的部分并在多个线程上执行。

在像 Hadoop 这样的分布式平台上,您可能会编写在一个节点上本地运行的脚本,例如集群中的边缘节点,但将执行转移到工作节点以完成更大的作业。当在 Spark over Hadoop 分布式文件系统 (HDFS) 等分布式平台上执行时,revoscalepy 和 RevoScaleR 都会自动使用集群中所有节点上的所有可用内核。

分布式和并行处理是 revo 管理的,其中引擎将作业分配给可用的计算资源(集群中的节点,或多核机器上的线程),从而成为该作业的逻辑主节点。主节点负责以下操作:

  1. 将计算分配给自身和其他计算资源
  2. 收集独立并行计算的结果
  3. 完成并返回结果

要将执行转移到集群中的工作节点,您必须将计算上下文设置为平台。例如,您可以使用边缘节点上的本地计算上下文来准备数据或设置变量,然后将上下文转移到 RxSpark 或 RxHadoopMR 以在工作节点上运行数据分析。

转移到 Spark 或 HadoopMR 计算上下文会附带该平台支持的数据源列表。假设 Spark 或 Hadoop 计算上下文支持您要分析的数据输入,您的分布式分析脚本可以包含本文中提到的任何函数。有关按计算上下文列出的受支持数据源的列表,请参阅机器学习服务器中脚本执行的计算上下文

备注

分布式计算在概念上类似于并行计算,但在机器学习服务器中,它特指跨多个物理服务器的工作负载分布。分布式平台提供了以下用于管理整个操作的基础设施:用于分配作业的作业调度程序、用于运行作业的数据节点以及用于跟踪工作和协调结果的主节点。实际上,您可以将分布式计算视为机器学习服务器为 Hadoop 和 Spark提供的一种能力。

多线程数据操作的函数

导入、合并和步进转换在并行架构上是多线程的。

RevoScaleR (R)

revoscalepy (Python)

接收导入

rx-导入

RxDataStep

接收数据步骤

接收合并

无法使用

分布式分析函数

以下分析函数并行执行,结果统一为返回对象中的单个响应:

RevoScaleR (R)

revoscalepy (Python)

rx总结

rx-摘要

rxLinMod

rx-lin-mod

rxLogit

rx-logit

rxGlm

无法使用

rxCovCor

无法使用

rxCube

无法使用

rxCrossTabs

无法使用

rxKmeans

无法使用

rxDTree

rx-dtree

rxD森林

rx-dforest

rxB树

rx-btrees

rxNaiveBayes

无法使用

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 支持工作负载分布的架构
  • 多线程数据操作的函数
  • 分布式分析函数
相关产品与服务
腾讯云 TI 平台
腾讯云 TI 平台(TencentCloud TI Platform)是基于腾讯先进 AI 能力和多年技术经验,面向开发者、政企提供的全栈式人工智能开发服务平台,致力于打通包含从数据获取、数据处理、算法构建、模型训练、模型评估、模型部署、到 AI 应用开发的产业 + AI 落地全流程链路,帮助用户快速创建和部署 AI 应用,管理全周期 AI 解决方案,从而助力政企单位加速数字化转型并促进 AI 行业生态共建。腾讯云 TI 平台系列产品支持公有云访问、私有化部署以及专属云部署。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档