
AI 浪潮席卷之下,如何才能抓住机遇,成为一名炙手可热的 AI 工程师?从传统的软件工程背景,又该如何成功转型,并在 OpenAI 这样的顶尖 AI 公司站稳脚跟?
最近,OpenAI 的 AI 工程师 Janvi Kalra 在 Gergely Orosz 主持的 Pragmatic Engineer 播客节目中,分享了她从一名 Coda 的软件工程师,通过自学、参与黑客马拉松、构建个人项目,最终成功转型并在 AI 前沿领域大放异彩的完整历程。她的故事不仅揭示了 AI 工程师的真实工作状态,更为有志于此的工程师们提供了极具价值的行动指南。

Janvi 在大学期间就交付了 4 款面向付费用户的移动应用,随后在 Google 和 Microsoft 完成实习,毕业后加入文档协作工具独角兽 Coda 担任软件工程师,并成为公司首批 AI 工程师之一。之后,她更是经历了 46 家 AI 创业公司的面试,最终成功入职 OpenAI。
这场对话覆盖了 Janvi 如何斩获大厂实习、评估 AI 创业公司的实用框架、AI 工程师的日常工作、一套行之有效的 AI 自学迷你课程、以及她在 OpenAI 的工作体验等。
Janvi 的故事始于她在大学期间的积极探索。就读于名校 Dartmouth,通过校园招聘门户申请,凭借课外项目经验和对公司的向往,她成功获得了 Google 和 Microsoft 的实习机会。
为了准备面试,Janvi 坦言自己当时对 LeetCode 并不熟悉,但凭借着一本经典的「绿皮书」——《Cracking the Coding Interview》,她刻苦刷题,最终通过了面试。Gergely Orosz 也补充道,该书作者 Gayle Laakmann McDowell 曾是 Google 的面试官,并为 Uber 等公司提供过面试培训,其内容相当与时俱进。

在 Google Search 团队的实习经历让 Janvi 第一次接触到大规模代码库和工业级软件开发流程,如单元测试等。她利用 Google 内部工具 Moma 学习搜索算法文档,并积极与资深同事交流,获取职业建议。在 Microsoft,她则如愿加入了 Azure OS 团队,参与开发了一个类似 Dropbox for Azure Blobs 的项目,深入了解了操作系统层面的知识。
实习的经历让 Janvi 意识到大厂和创业公司的巨大差异。她总结道:
大厂的优势:
创业公司的优势:
正是对创业公司「成长与广度」的向往,让 Janvi 在手握 Google 和 Microsoft return offer 的情况下,毅然选择了 Coda。
2022 年底,ChatGPT 横空出世,Coda 迅速组建了一个仅有两名工程师的 AI 团队,旨在打造一个辅助构建 Coda 文档的 AI 助手。Janvi 主动请缨加入,却遭到了婉拒,领导认为她并不具备 AI 相关技能。
但她没有放弃。Janvi 利用业余时间开始了 AI 的自学之旅。她从最基础的 Token、权重、嵌入学起,逐步理解了 LLM 的下一 token 预测原理,回顾了从 RNNs 到 LSTMs 再到 Transformer 的架构演进,重点攻克了位置编码和注意力机制等核心概念。她将学习心得记录在博客上,让团队看到了她的热情和投入。
随后,Janvi 积极参与各类黑客松。她提到一个在线语言学习工具项目,该项目在 Build Space 举办的为期六周的线上黑客松中,以用户数和营收为评判标准,让她不仅锻炼了技术,更体验了产品推广。
五个月后,当 Coda 的 AI 团队再次扩张时,Janvi 凭借其积累的 LLM 知识和实践经验,成功加入,成为团队的一员。她强调:「不要等待别人给你机会才开始行动。」
在 Coda,她最引以为傲的项目是 Workspace Q&A。针对用户难以在大量内部文档中找到所需信息的痛点,团队利用当时新兴的 RAG 技术,结合公司已有的搜索索引和 LLM 调用基础架构,在几天内就构建出了一个能回答工作区内容的聊天机器人原型。
这个原型引起了 CEO Shishir Mehrotra 的高度关注。Shishir 看到了一个更宏大的愿景:打造一个企业级搜索工具,不仅能搜索 Coda 文档,还能整合 Salesforce 等第三方应用数据。于是,一个由 Janvi、她的经理、CTO、一名设计师和一名 PM 组成的小分队,在四周内高强度协作,成功验证了这个想法。这个项目最终演变成了 Coda 的第二款产品——Coda Brain,并在 Snowflake Dev Day 的主题演讲中亮相。Janvi 从最初的原型构建者,成长为这个 20 人大型项目的早期核心成员。

当被问及什么是 AI 工程师时,Janvi 认为 AI 产品工程师 (AI Product Engineer) 的核心是基于模型构建产品。这包括大量的实验、原型设计,并最终将产品投入生产。其基础仍是软件工程,但需要掌握一些领域特定技能,如微调 (fine-tuning)、编写优质提示 (prompts)、托管开源模型以及构建可靠的评估体系 (evals)。
在面试方面,Janvi 经历了 46 家公司,她发现 AI 工程师的面试形式五花八门,尚无统一标准,通常混合了:
因此,准备 AI 工程师面试的最佳方式,仍然是打好软件工程基础,同时积极构建 LLM 应用项目,并熟悉常见的 AI 工程概念。
在求职过程中,Janvi 将 AI 公司分为三类,并针对性地评估其潜力:
为了寻求更广阔的成长空间,Janvi 将求职重点放在了模型和基础设施公司。她会特别关注:
对于希望加入创业公司的工程师,Janvi 强烈建议进行充分的尽职调查,并形成自己关于公司增长潜力的判断。她的评估框架包括:
Janvi 强调,工程师在创业公司是以股权作为重要薪酬组成,本质上也是投资者,有权了解这些信息。如果公司不愿分享,这本身就是一个危险信号。她建议可以阅读 The Information 等深度信息,甚至与投资过这些公司的投资人交流。
Janvi 目前在 OpenAI 的 Safety 团队担任工程师,致力于确保 AGI 「惠及全人类 (benefiting all of humanity)」。她的工作包括:

谈及 OpenAI 的独特性,Janvi 认为:
OpenAI 之所以能保持如此快的交付速度,Janvi 观察到,公司系统设计鼓励快速交付,并给予工程师高度信任。例如,她刚入职时,进行状态更改无需审批;即使现在需要一名审查者,服务部署依然迅速。
Janvi 认为,AI 正在模糊数据科学家、前端/后端工程师、PM 之间的界限。每个人都被期望能做更多,工程师正变得更加全栈。AI 工程的一个显著特点是,工程师必须适应「推倒重来」——当新模型的能力使现有工作不再那么有用时,要乐于废弃并重新开始。
对于 AI 将如何影响应届毕业生,Janvi 并不认为会对初级工程师造成不成比例的负面影响。相反,AI 使得每个人都能向价值链上游移动,更具创造力。她认为,关键在于区分「用 AI 学习」和「用 AI 避免学习」。在探索新项目、验证想法时,可以利用 AI 快速迭代;但在构建需要自己负责的稳健系统时,则应利用 AI 深入学习,理解边缘案例。
AI 工具对软件工程的影响:
Janvi 的 AI 工具栈包括:编程用 Cursor,黑客松用 DeepSearch 了解现有库,ChatGPT 作为默认搜索引擎和导师,以及内部 RAG 工具用于快速检索公司文档。
她推荐的书籍是《The Almanack of Naval Ravikant》,认为其关于构建人生和追求幸福的理念非常务实。
对她职业生涯影响最大的一条建议是:“不要等待别人给你机会才开始行动。 (Don't wait for someone to give you the opportunity to go work on something. Go work.)”
Janvi Kalra 的经历为我们描绘了一位现代 AI 工程师的成长蓝图:保持好奇、主动学习、勇于实践,并始终关注商业价值与技术本身的结合。在 AI 这个日新月异的领域,她的故事也许能给更多传统工程师带来思考和实践经验。
参考来源:
https://www.youtube.com/watch?v=3E_jDJST69s