Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >ChatGPT软件技术栈解密

ChatGPT软件技术栈解密

原创
作者头像
NineData
发布于 2023-03-28 03:03:00
发布于 2023-03-28 03:03:00
8.7K0
举报
文章被收录于专栏:云数据库技术云数据库技术

ChatGPT 点燃了通用AI浪潮,继农业革命、工业革命、计算机技术革命后,也将可能掀起 AI 技术革命。

业界对 ChatGPT 的 AI 算法关注得比较多,但是 OpenAI 已经演变为服务数亿用户的平台服务。近3个月 ChatGPT 的 SLA 大约99%,也就是说平均每天大约有15分钟不可用,整体技术架构和可靠性也备受关注。

OpenAI 网站近90天状态图
OpenAI 网站近90天状态图

OpenAI 网站近90天状态图(绿色表示可用,其它表示异常)

ChatGPT 没有对外正式分享他们的技术架构,所以很难100%准确知道架构大图,本文尝试从以下几个方面:

  • 互联网公开信息(twitter、linkedIn等)
  • OpenAI 最新招聘岗位要求
  • OpenAI 几次故障报告
  • Github 代码

绘制了 ChatGPT 的主要软件技术栈大图。

ChatGPT软件技术栈大图
ChatGPT软件技术栈大图

1、云服务

OpenAI 是云时代的 AI 创业公司,所有业务都是架设在公有云上,在创业初期得到 AWS 的支持,下面这个对话是 OpenAI 截止2021年公开信息的回答:

OpenAI 使用了AWS云服务
OpenAI 使用了AWS云服务
OpenAI 截止2021年公开信息显示使用了AWS云服务
OpenAI 截止2021年公开信息显示使用了AWS云服务

上面这段话来自 OpenAI 的官网早期文章介绍,可以看到曾使用了大量 AWS 服务。

近两年又得到微软巨额投资,并且明确了要由 Azure 提供服务。可以肯定 ChatGPT 是在转向以 Azure 为主的多云方案,AWS 服务会逐渐减少。

另外使用了 Terraform 多云管理服务来做云资源的管理。

2、数据库

ChatGPT 的核心业务数据保存在关系型数据库 PostgreSQL 中
ChatGPT 的核心业务数据保存在关系型数据库 PostgreSQL 中

首先问 ChatGPT 自己,基本上都没有明确的答案。不过从官网职位和故障报告可以得到比较准确的信息:

ChatGPT 的核心业务数据保存在关系型数据库 PostgreSQL 中,这个在官方网站有介绍,数亿用户的账号、AK和对话等信息都保存在这里。

2023.2.20号的故障报告也说明了主数据库 PostgreSQL 发生问题。并且提到使用了PgBouncer的连接池服务。

同时使用了 Redis 集群作为缓存服务,在2023.3.20 ChatGPT 爆出了安全漏洞,部分用户可以看到其他人的聊天记录,就是因为踩了 Redis-py 在连接取消状态下会话错乱的 bug,CEO Sam Altman 也在 twitter 出来道歉。

Redis-py 在连接取消状态下会话错乱的 bug,CEO Sam Altman 也在 twitter 出来道歉。
Redis-py 在连接取消状态下会话错乱的 bug,CEO Sam Altman 也在 twitter 出来道歉。

另外还在招聘中希望懂 CosmosDB,这个目前还不确认用在什么场景,CosmosDB 是 Azure 推出的多模数据库,支持 MongoDB、Cassandra、PostgreSQL、Gremlin 等兼容性接口,是微软在 NoSQL 领域的旗舰产品。

之前 Patrick-McFadin (Cassandra Committer)在 LinkedIn 上提到 OpenAI 使用了 Cassandra,但最终讨论下来是 ChatGPT 自己胡说的,还不能确认是否真的使用了 Cassandra 或者是在 CosmosDB 中使用了 Cassandra 的 API。

另外CosmosDB也通过收购过来的Citus提供的分布式PostgreSQL的接口。不确认是否使用了Citus来完成分布式数据库架构。

ChatGPT 使用了 Snowflake 这个新一代的云原生数据仓库,并且使用了 Tableau 来做数据分析。支持多云部署的 Snowflake 对于业务从 AWS 到 Azure的跨云迁移是非常有利的。

3、前端

在Web前端方面,比较明确的是使用了 TypeScript 语言和 React 框架。

移动端目前 ChatGPT 还没有正式的 APP 发布,不过已经在招聘 iOS 和 Android 工程师,应该快了。

4、应用与服务编程语言

作为以 AI 为基础的科技公司,OpenAI 选择 Python 为核心语言,不管是 AI 岗位还是平台软件工程师岗位,都是需要精通 Python 语言。

平台服务选择 Python,使用了 Python 里比较流行的 Flask 框架,并使用了 OpenAPI 等组件。

5、AI 技术框架

AI 技术框架核心是 Pytorch,可能也使用了 Tensorflow。

OpenAI 自己研发了面向 GPU 的算法框架 Triton,并且在 github 上开源了(

https://github.com/openai/triton),用于代替 NVIDIA 的 CUDA,目标是能更高效的开发机器学习算法。Triton 的编程语言使用了 c++和 python。

关于更细节的 AI 训练和部署服务架构还待挖掘。下图是来自网上陈巍博士分享的一张大模型典型架构图,供参考:

关于更细节的 AI 训练和部署服务架构还待挖掘。下图是来自网上陈巍博士分享的一张大模型典型架构图
关于更细节的 AI 训练和部署服务架构还待挖掘。下图是来自网上陈巍博士分享的一张大模型典型架构图

来源:https://zhuanlan.zhihu.com/p/611464068

6、应用部署与监控运维

容器服务Kubernetes

监控与运维:Prometheues(招聘运维开发工程师提到需要懂PromQL)

日志服务 Splunk

编程语言: Golang、Python

7、参考文档

  1. ChatGPT软件工程师岗位描述:

https://openai.com/careers/software-engineer-chatgpt

  1. OpenAI 2023.2.20 故障分析报告:

https://status.openai.com/incidents/mq5jgswy45fr

  1. OpenAI开源Triton的Github地址:

https://github.com/openai/triton

  1. Patrick McFadin在Linkin上讨论ChatGPT是否使用了Cassandra:

https://www.linkedin.com/posts/patrick-mcfadin-53a8046_this-isnt-your-regular-chatgpt-post-so-activity-7031372446536515584-P8fg/?utm_source=share&utm_medium=member_desktop

8、最后

本文作者:叶正盛,NineData 程序员,玖章算术CEO,原阿里云资深技术专家。

NineData 官网:www.ninedata.cloud,提供企业级数据库 SQL 开发工具,数据复制、对比、备份等产品,并提供了类似ChatGPT的SQL服务(SQL AI Copilot),免费使用,无需下载。

欢迎大家留言或者转载!

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
云原生及其技术栈介绍
1. 容器化: - Docker:Docker是一种开源的应用容器引擎,它将应用程序及其依赖(如库、配置文件等)打包成标准化的容器镜像。容器镜像可以在任何支持Docker的环境中运行,确保应用在开发、测试和生产环境之间的一致性。Docker通过容器隔离技术(如Linux命名空间和控制组)实现轻量级的资源隔离和管理。
用户7353950
2024/04/24
1.3K0
云原生及其技术栈介绍
LangChain4j炸裂!Java开发者打造AI应用从未如此简单
LangChain4j目标是简化将大语言模型(LLM)集成到 Java 应用程序的过程。
JavaEdge
2024/09/19
1.5K0
LangChain4j炸裂!Java开发者打造AI应用从未如此简单
从初创到顶级技术公司,都在用哪些数据科学技术栈?
组织在构建自己专属的技术栈时,会使用到各种不同的相似技术。但也存在一些趋势,如果你正在组建一个新的团队、组织或公司的时候,一开始你可能需要效仿某个现成的技术栈,再依据需求来构建自己的技术栈,还需要对一些过时的技术进行升级。
大数据文摘
2020/04/26
1.3K0
从初创到顶级技术公司,都在用哪些数据科学技术栈?
云计算与AI的完美邂逅:技术融合的未来蓝图
大家好,我是Echo_Wish,今天我们来聊一个近年来大火的技术话题——云计算与AI的融合趋势。这两项技术就像两个超级英雄,云计算擅长提供灵活的算力与存储,而AI则是利用算法解锁数据潜力。那么,当这两者“牵手”,会产生怎样的火花呢?让我们通过技术解读和实例探讨这场科技领域的“世纪联姻”。
Echo_Wish
2025/03/17
1830
云计算与AI的完美邂逅:技术融合的未来蓝图
靠ChatGPT年入百万,合法还不限学历专业,一般人我不告诉他(doge)
丰色 明敏 发自 凹非寺 量子位 | 公众号 QbitAI 普通人靠ChatGPT年薪百万的机会也来了? 这两天,一个叫做“提示工程师”的新岗位悄悄出现在了招聘市场上: 不用写代码、不用计算机专业、也不要求学历,就研究怎么跟ChatGPT“聊天”,年薪居然开到了25万美元-33万美元,折合人民币下来足足170万+。 不信?有图有真相: OpenAI CEO山姆大哥都说,如果会给聊天机器人写prompt,那可是个强技能点啊。 但我,还真有点不敢信…… 虽说ChatGPT它现在是火得发紫,围绕它创业的创业
量子位
2023/03/04
5900
靠ChatGPT年入百万,合法还不限学历专业,一般人我不告诉他(doge)
AI Agents 技术栈
随着生成式人工智能(如 ChatGPT)的快速发展,AI Agents(人工智能体)正从概念走向大规模应用。2025 年被广泛视为“AI Agent 元年”,其技术栈的成熟标志着智能系统从“被动响应”向“自主决策”的跃迁。那么什么是 AI Agents 呢?构成 AI Agents 的技术栈有哪些关键组成部分?本文参考了一些资料,尝试解释这一概念,主要参考了以下内容:
云水木石
2025/02/12
4130
AI Agents 技术栈
ChatGPT的战争不会浓缩于一个晚上
大数据文摘授权转载自品玩 作者:玄宁 进入2023年,ChatGPT着实让人类感受了一把被AI支配的恐惧。 它超强的上下文理解,泛化,学习和推理能力,以逼近人类互动体验的方式呈现出来,让所有人耳目一新。哪怕它和它的同类竞品纷纷暴露出诸多的问题,依然难阻人们每天惊呼一次“奇点”来临,日日担心自己的工作被取代,纷纷转述比尔盖茨,纳德拉和黄仁勋们对ChatGPT的赞赏。各路人马也纷纷行动起来,最新的是马斯克,在批评了自己参与创办但早已没有股份的OpenAI旗下ChatGPT的安全问题后,随即传出他自己正在计划组
大数据文摘
2023/04/10
1660
ChatGPT的战争不会浓缩于一个晚上
微软 “爱” 上PostgreSQL, PG “嫁给” 微软!
题目:题目还是朋克爆炸风,我不喜欢这样的题目,但没辙,我喜欢不喜欢不重要,这该死的阅读快餐文化 !
AustinDatabases
2024/11/25
960
微软 “爱” 上PostgreSQL, PG  “嫁给” 微软!
智商狂飙,问了ChatGPT几个数据库问题后,我的眼镜掉了
最近,ChatGPT火爆全网,介绍其产品、公司、作者、技术和应用等方面信息,占据着整个互联网,似乎不谈GPT好像就落伍了。NineData 是多云数据管理平台(NineData-让每个人用好数据和云-玖章算术),致力于让每个人用好数据和云。作为数据库领域的技术创新团队,面对这么火ChatGPT,我们 NineData 是的工程师也针对ChatGPT,做了一些关于数据库领域的相关测试,测试结果,真的是智商狂飙。不管是从SQL编写、SQL优化、数据库选型、表设计、理论认识、行业认识都有比较高质量的回答。
NineData
2023/02/09
1.3K0
智商狂飙,问了ChatGPT几个数据库问题后,我的眼镜掉了
【云端风云:云计算全局解密】一篇文章读懂云计算技术及其未来发展趋势
在当今数字化浪潮中,云计算如一颗闪烁的科技明珠,为企业和个人带来了前所未有的灵活性、效率和创新力。本文将带领读者深入探索云计算的核心概念、关键服务模型以及未来发展趋势。云计算不仅是数字化时代的基石,更是推动创新和变革的引擎。站在云端风云之巅,我们将解析云计算的奥秘,揭晓数字化未来的蓬勃蔓延。通过这场科技奇迹的探索,我们将共同领略云计算为全球带来的变革,见证科技与未来的奇妙融合。
奥耶可乐冰
2023/11/24
1.5K0
【云端风云:云计算全局解密】一篇文章读懂云计算技术及其未来发展趋势
生成式 AI 能否取代 DBA 结尾有彩蛋
是的会,在生成式AI的发展下,很多职业都会衰弱或消失,回答比较直接,这里包含DBA这个职业,肯定,确定以及一定。梳理一个职业是否会消失并不难,我们需要准备所属的职业的属性,并根据当下的拥有的技术和经济情况,推断出一个职业是否会被取代或消失。
AustinDatabases
2024/06/18
2260
生成式 AI 能否取代 DBA  结尾有彩蛋
软件工程的兴衰轮回:2 年巨变,裁员风暴下小团队逆袭,老技术反迎第二春?
过去 18 个月来,整个科技行业迎来一系列重大变化:从招聘火热到大规模裁员,从密集上市到个位数 IPO,就业市场、风险投资、IPO 和大型科技公司都受到变革之风的严重影响。
深度学习与Python
2024/07/24
1860
软件工程的兴衰轮回:2 年巨变,裁员风暴下小团队逆袭,老技术反迎第二春?
NineData:要做程序员必备的数据库产品
大家好,我是一名中国程序员,在 IT 领域(云计算+数据库)工作 20 年,17 年程序员和 3 年产品经理。早已经过了 35 岁,数据库爱好者,为了能一直写代码,我创建了一家公司(玖章算术),发布了首款数据服务 www.ninedata.cloud (对,在云时代我们率先使用了.cloud的域名),以下是我个人介绍。
NineData
2022/11/09
5270
NineData:要做程序员必备的数据库产品
大厂裁员不断,这个高薪岗位却找不到人?
当下,裁员潮席卷全球:微软裁撤万人级游戏部门,谷歌AI伦理团队被优化,亚马逊用机器人取代数万仓储岗位。然而,DevOps工程师的招聘却逆势而上。
陈哥聊测试
2025/03/20
320
大厂裁员不断,这个高薪岗位却找不到人?
分布式PostgreSQL基准测试:Azure Cosmos DB、CockroachDB和YugabyteDB
最近,微软详细介绍了分布式 PostgreSQL 基准测试的结果,比较了 Azure Cosmos DB for PostgreSQL、CockroachDB 与 Yugabyte 的事务处理性能和价格。这几种数据库在实现时做了不同的权衡,测试结果显示,Azure Cosmos DB 的吞吐量更高。同时,他还着重指出了针对分布式数据库进行基准测试所面临的挑战。
深度学习与Python
2023/08/09
3580
分布式PostgreSQL基准测试:Azure Cosmos DB、CockroachDB和YugabyteDB
2019全球PostgreSQL生态报告出炉,PG为何从RDBMS中脱颖而出?
原文:http://www.enmotech.com/web/detail/1/758/1.html
数据和云01
2019/07/31
8240
2019全球PostgreSQL生态报告出炉,PG为何从RDBMS中脱颖而出?
ChatGPT4高分通过数据库系统工程师(DBA)认证
ChatGPT 已经通过了美国MBA、法律和医学考试,ChatGPT 又通过了数据库系统工程师考试。 这次考试使用了2021年的真实试卷,上午的笔试题全部为选择题,总分75分(45分通过)。
NineData
2023/03/20
6351
ChatGPT4高分通过数据库系统工程师(DBA)认证
NineData核心技术揭秘
大家好,之前的文章《NineData,领先的多云数据管理平台》介绍了我们的产品,大家在了解我们产品的同时,可能也比较关注我们是怎么做的,用了哪些技术,今天和大家一起来探讨一下NineData 的技术实现。
NineData
2022/12/08
5540
NineData核心技术揭秘
数百程序员专门教AI写代码、40个bug能修复31个,“取代程序员”这次要成真了?
编译 | 核子可乐、Tina AI 在回答问题和编写代码方面已经变得相当出色。在一项新的研究课题中,ChatGPT 尝试查找示例代码中的 bug 并给出修复建议。其表现远超现有程序,成功修复了 40 个 bug 中的 31 个。AI 开始显现出强大的能力,一些人又开始担心程序员会失业了,在软件开发和编程的历史中,这又是一次“狼来了”的故事吗? 1 ChatGPT 现可查找并修复代码中的 bug 最近几周,AI 新贵 ChatGPT 迎来了一系列评测挑战。一项最新研究来自约翰内斯古腾堡大学和伦敦大学学院
深度学习与Python
2023/03/29
4250
数百程序员专门教AI写代码、40个bug能修复31个,“取代程序员”这次要成真了?
Thoughtworks 第 29 期技术雷达——平台象限概览
Colima 现在是我们在 macOS 上替代 Docker Desktop 的首选方案。我们持续在几个项目中使用它来提供 Docker 容器运行时的 Lima VM,在 macOS 上配置 Docker CLI,并处理端口转发和挂载卷。Colima 可以配置为使用 containerd 作为其运行时,这也是大多数托管的 Kubernetes 服务上的运行时,可以提高重要的开发到生产环境的一致性。
ThoughtWorks
2023/10/19
3190
Thoughtworks 第 29 期技术雷达——平台象限概览
推荐阅读
相关推荐
云原生及其技术栈介绍
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档