Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >专栏 >Rust 研学 | 从 OpenAI 招聘透视 Rust 在大模型中的应用潜力

Rust 研学 | 从 OpenAI 招聘透视 Rust 在大模型中的应用潜力

作者头像
张汉东
发布于 2024-01-15 09:25:41
发布于 2024-01-15 09:25:41
6700
举报
文章被收录于专栏:Rust 编程Rust 编程

“OpenAI 虽然名称里有 Open ,但实际非常神秘。我们只能通过一些外围信息来透视这家顶尖 AI 公司的技术栈信息。

本文大纲

  • OpenAI Rust 招聘简介
  • Rust 在 OpenAI 中解决什么问题
    • 延伸阅读:分布式训练框架 Ray
    • 扩展学习:分布式训练概要
    • 两点简单思考
    • 使用 Rust 开源向量数据库
    • 分布式训练机器学习框架
  • 小结

OpenAI Rust 招聘简介

最近看到了 OpenAI 分布式软件工程师岗位招聘[1] ,发现它们采用的是 Rust + Python 语言技术栈。

以下是该招聘岗位的关键摘要:

“作为一名分布式系统/数据工程师,您将致力于提供强大的API,用于协调数千台计算机移动/持久化大量数据。这需要提供易于使用、可自省的系统,以促进快速的调试/开发周期,同时还要确保该体验能够在我们最新的超级计算机上扩展,并保持稳定性和性能。 我们正在寻找热衷于优化端到端系统、理解高性能I/O以最大化本地性能和分布在我们的超级计算机上的人。我们希望找到对快速响应我们训练系统架构的动态和不断发展的需求感到兴奋的人。 这个职位位于加利福尼亚州旧金山。我们采用每周3天在办公室工作的混合工作模式,并为新员工提供搬迁补助。 这个职位角色中,你将:

  1. 在我们的 Python 和 Rust 语言技术栈上工作
  2. 优化和帮助设计以扩展我们的计算和数据能力的配置文件
  3. 快速将我们的训练框架部署到最新的超级计算机上,以迅速响应机器学习系统的不断变化的形态和需求。

如果你具备以下特点,你可能会在这个职位有更广阔的上升空间:

  1. 曾在大型分布式系统上工作过
  2. 喜欢弄清楚系统的工作原理,并不断提出加快系统速度、减少复杂性和维护负担的想法
  3. 具有强大的软件工程技能,熟练掌握 Python 和 Rust

其他薪酬福利就不在这里重复了,毕竟不是中国公司,也不招远程。我只能说,福利是真的好,这个职位也提供股份。

本文的重点是,尝试通过这个工作岗位信息透视 OpenAI 中 Rust 的应用场景,以及进一步窥探 Rust 在大模型中的发展趋势。毕竟 OpenAI 是大模型中的顶流,他们的技术栈采用肯定是深思熟虑的。

Rust 在 OpenAI 中解决什么问题

使用 Rust 开源向量数据库

在两个月前,也有人从 OpenAI 平台的错误信息中发现,OpenAI 正在使用开源 Rust 向量数据库 Qdrant[2]

“在马斯克的 XAI 公司也使用了这个 Rust 实现的向量数据库 Qdrant 。 XAI 的工程师选择 Rust 理由和大多数人一样:“Rust 已被证明是构建可扩展、可靠和易于维护的基础设施的理想选择。它具有高性能、丰富的生态系统,并且可以防止在分布式系统中通常会遇到的大多数错误。考虑到我们团队规模较小,基础设施的可靠性至关重要,否则维护工作将抑制创新。Rust 让我们有信心,任何代码修改或重构都有可能产生能够在数月内以最少的监督运行的工作程序”。

分布式训练机器学习框架

实践证明,Rust 是构建现代分布式系统的首选。

从 OpenAI 这个职位信息看得出来,该职位在 OpenAI 中扮演着重要的角色,专注于利用 Rust 构建高性能的分布式系统以支持其机器学习训练系统。候选人需要具备强大的技术能力,特别是在 Rust 和 Python 编程、分布式系统设计和性能优化方面。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2024-01-10,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 觉学社 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
AI日报 - 2025年4月15日
▎🤖 AGI突破 | Grok-3 Mini创纪录通过高难度推理测试,Sakana AI生成论文通过同行评审引关注。
訾博ZiBo
2025/04/14
980
AI日报 - 2025年4月15日
NEC新技术带来比Apach Spark快50倍的机器学习能力
陈桦 编译自 SiliconAngle 量子位 报道 | 公众号 QbitAI 日本计算机巨头NEC宣布,已经开发出一种新的数据处理技术,能加快向量计算机的机器学习速度。这种技术比当前主流的Apach
量子位
2018/03/29
7480
NEC新技术带来比Apach Spark快50倍的机器学习能力
《Python分布式计算》 0 序言 (Distributed Computing with Python)作者简介审稿人简介序言本书的内容
Python分布式计算 ---- 作者简介 Francesco Pierfederici是一名喜爱Python的软件工程师。过去20年间,他的工作领域涉及天文学、生物学和气象预报。 他搭建过上万CPU核心的大型分布式系统,并在世界上最快的超级计算机上运行过。他还写过用处不大,但极为有趣的应用。他总是喜欢创造新事物。 “我要感谢我的妻子Alicia,感谢她在成书过程中的耐心。我还要感谢Packt出版社的Parshva Sheth和Aaron Lazar,以及技术审稿人James King,他们让这本书变得
SeanCheney
2018/04/24
1.1K0
《Python分布式计算》 0 序言 (Distributed Computing with Python)作者简介审稿人简介序言本书的内容
「奇点」AI计算平台细节曝光!竟是微软4年前老项目重生
---- 新智元报道   编辑:David 【新智元导读】微软 Azure 团队公布了全新的AI基础设施服务「奇点」平台的技术细节。微软表示,该平台将成为微软内部和外部AI的主要驱动力。 AI服务平台的成本和效率问题,是各大服务提供商一直着力解决和改进的难题。 具体而言,就是如何在满足客户需求的同时,尽量降低整个系统资源的消耗,以及如何通过提高深度学习工作负载的利用率来降低成本。 近日,微软 Azure 研究团队合作构建了一个新的 AI 基础设施服务,代号为「Singularity」。用研究人员的话
新智元
2022/03/04
3920
CUHK计算机系James Cheng老师课题组招收MLOps、图系统方向工程师和实习生
本期将为大家介绍香港中文大学计算机科学与工程系 James Cheng 老师招收工程师和实习生相关信息。 Husky Data Lab 是由香港中文大学计算机科学与工程系 Prof. James Cheng 领导下的大数据实验室,专注于高性能数据分析系统和数据库的开发,研究成果已被应用于工业界多个大规模 / 高性能系统。 个人主页:https://www.cse.cuhk.edu.hk/~jcheng/ 目前,James Cheng 教授团队在开发 Ofnil 和 Graxy 两个平台: Ofnil gr
机器之心
2023/03/29
6640
CUHK计算机系James Cheng老师课题组招收MLOps、图系统方向工程师和实习生
大模型时代的系统语言:Rust vs Mojo
这十七年我虽然没有什么光彩履历,但却很幸运,我还能在这个行业坚守,并能不断成长。同样很幸运,我经历了桌面软件没落, Web 2.0 崛起,以及移动互联网的兴盛,当下基础设施系统软件开始复兴的诸多历程。
张汉东
2023/09/13
2.4K0
大模型时代的系统语言:Rust vs Mojo
Java工程师必须学习分布式架构技术吗?
在回答这个问题之前,首先我们要明白,为什么会出现分布式架构技术?要了解这个问题的话我们需要往前回溯,从主流互联网系统发展的历程来看,我们可以看到在不同阶段,流行的系统架构其实是不一样的。比如一开始的单体应用把所有东西都部署在一起就可以满足业务需求,然后随着业务规模的发展,用户量和访问量逐步增加,这时系统会不断面临性能压力和存储压力,具体体现就是:
用户7353950
2022/06/23
2850
Java工程师必须学习分布式架构技术吗?
马斯克放弃自动驾驶?特斯拉CV负责人被曝离职,马斯克急澄清
对此,马斯克在推上表示,OpenAI一直在试图通过极高的薪酬挖角特斯拉的工程师,并且确实成功了几次……
新智元
2024/04/12
1290
马斯克放弃自动驾驶?特斯拉CV负责人被曝离职,马斯克急澄清
谷歌第四代TPU芯片细节曝光:性能达英伟达A100的1.7倍,能效也提高了1.9倍
4月6日消息,据外媒报道,当地时间周二,Alphabet旗下谷歌披露其用于训练人工智能(AI)模型使用的超级计算机的最新细节。该公司表示,这些系统基于第四代TPU芯片,速度和能耗效率均高于英伟达A100系统。
芯智讯
2023/04/11
9390
谷歌第四代TPU芯片细节曝光:性能达英伟达A100的1.7倍,能效也提高了1.9倍
英特尔等推动深度学习与超级计算相融合
【概要】英特尔和美国国家能源研究科学计算中心、斯坦福大学联合开发出一套深度学习系统,可在15 Petaflops的超级计算机上运行。
人工智能快报
2018/10/24
3900
《数字双生子:大模型与大数据的共生进化革命》
在深圳南山的一家科技公司,AI 工程师团队正在进行着前所未有的实验:将城市交通大数据输入自动驾驶模型,模型不仅预测了早高峰拥堵节点,更反向优化了道路规划算法。这种数据与模型的深度耦合,标志着智能时代的核心范式 —— 大模型与大数据的共生进化,正在重塑人类认知世界的方式。
睡前大数据
2025/03/25
550
《数字双生子:大模型与大数据的共生进化革命》
研究人员报告“分布式深度学习”取得突破
网上购物时我们通常会用几个关键词来搜索我们想要的产品,但是在拥有数以百万计的产品和购物者的世界中,将这些不明确的词与合适的产品进行匹配是信息检索中的最大挑战之一。
AiTechYun
2019/12/17
4320
研究人员报告“分布式深度学习”取得突破
职位情报局 | 1.65亿天使轮融资背后,林元庆需要怎样的AI人才?
林元庆离开百度三个多月后(戳这里看大数据文摘此前报道),他的新公司Aibee拿到了1.65亿元的天使轮融资。 作为曾经的百度研究院院长、深度学习实验室(IDL)主任,林元庆这番创业选择了传统行业,与他的前同事、百度前首席科学家吴恩达(Andrew Ng)的选择不约而同(戳这里了解吴恩达新公司landing.ai)。 Aibee(爱笔)寓意AI2B,意即用AI技术对传统行业赋能升级。 对于一家AI创业公司来说,最重要的工作可能是“抢人”——精干的AI团队将成为公司最大的资产。目前,Aibee有近20名员工,其
大数据文摘
2018/05/24
7060
英伟达赢麻了!马斯克xAI超级算力工厂曝光,10万块H100、数十亿美元
最近几年,随着大语言模型的飞速发展与迭代,科技巨头们都竞相投入巨额财力打造超级计算机(或大规模 GPU 集群)。他们认为,更强大的计算能力是实现更强大 AI 的关键。
机器之心
2024/06/03
2050
英伟达赢麻了!马斯克xAI超级算力工厂曝光,10万块H100、数十亿美元
图灵奖得主Jack Dongarra:超级计算顶部还有很大空间
超级计算机可以说是科学计算界的奥运冠军。通过数值模拟,超级计算机丰富了我们对世界的理解:无论是宇宙中数光年之外的恒星、地球的天气和气候,还是人体的运作机理。
机器之心
2022/12/15
3470
图灵奖得主Jack Dongarra:超级计算顶部还有很大空间
【招贤纳士】我们邀您加入腾讯WeTest的大家庭
金三银四求贤季,不断创新并快速迭代的腾讯WeTest一直渴求更多优秀的人才可以加入其中。
WeTest质量开放平台团队
2019/03/20
7330
将分布式系统转换为可嵌入的库有多难?
最近,我在开发一个本地 RAG/LLM 应用,需要支持语义搜索。实际上,作为一款本地应用,它可能产生的嵌入(embeddings)数量相对有限,很难超过百万级别。因此,在项目初期,一个简单幼稚的遍历匹配方法就足以应对需求。然而,我还是希望能够一步到位,找到一个支持 HNSW 索引的嵌入式向量数据库(关于 HNSW 索引的详细信息,请参考我之前的文章)。
tyrchen
2023/12/20
3330
将分布式系统转换为可嵌入的库有多难?
Cerebras推出全球最强AI超算:5400万个AI内核,算力高达4 exaFLOPS!
7月21日消息,人工智能(AI)芯片初创公司Cerebras Systems于当地时间7月20日宣布,其将携手总部位于阿联酋的技术控股集团G42打造一个由9台互联的超级计算机组成的网络,为AI计算提供一种新的方案,有望大幅减少AI大模型训练时间。目前,该网络上的第一台AI超级计算机——“Condor Galaxy 1(CG-1)”开始部署,AI算力高达4 exaFLOPS(每秒4百亿亿次),这也是目前性能最强的AI超级计算机。
芯智讯
2023/08/09
3360
Cerebras推出全球最强AI超算:5400万个AI内核,算力高达4 exaFLOPS!
不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程
ChatGPT 出现后,人们预测「所有行业都要通过 AI 进行重塑」,有些工作会被代替,也有工作会改变形式。作为把 AI 造出来的程序员,他们的职业会变成什么样?
机器之心
2023/08/07
2420
不要叫我程序员,我是「AI工程师」,马斯克:开始卷自然语言编程
ChatGPT软件技术栈解密
ChatGPT 点燃了通用AI浪潮,继农业革命、工业革命、计算机技术革命后,也将可能掀起 AI 技术革命。
NineData
2023/03/28
8.7K0
ChatGPT软件技术栈解密
推荐阅读
相关推荐
AI日报 - 2025年4月15日
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档