从2022年11月ChatGPT的问世,到现在已经两年有余,AI大模型相关技术在不断的发展,相关的AI智能产品也在不断走向成熟。
现如今AI大模型的应用普及,让手机里的语音助手能听懂你的玩笑,让电商平台的推荐系统比闺蜜更懂你的喜好,这些看似“聪明”的功能背后,都是AI技术在发挥作用。就像当年电脑普及催生了程序员这个职业,AI时代正在创造全新的技术需求。
不论你是想开发更智能的App,还是希望不被技术浪潮淘汰,学习AI都像学用电脑一样正在变成必备技能。别被“人工智能”四个字吓到,其实它就像学做菜:掌握几样核心原料(数据),了解常用厨具(算法),再练几道招牌菜(应用场景),你也能用AI做出让人惊叹的“数字料理”。
这篇文章我们就一起来梳理一下AI大模型技术发展至今都出现了哪些相关的技术?这些技术都可以分为哪几类?它们的关系如何?我们如何定位自己想要开发的产品?
在我明确了相关问题后,与DeepSeek的对话中简要梳理出来了一些AI领域相关技术栈的分类,并把它梳理成了一张图:
然后我来由下向上解释一下这张图:
1)基础设施层(硬件支撑)
这是AI世界的“钢筋水泥”,提供最底层的算力和存储支持。如果把AI比作一辆跑车,基础设施层就是发动机和油箱——没有它们,再好的算法也跑不起来。
核心组件:GPU(如NVIDIA的A100显卡)、AI专用芯片、高速存储设备(如NVMe SSD)。
作用:就像发电厂为城市供电,这些硬件为模型训练和推理提供“动力”。例如,训练GPT-4需要上万块GPU协同工作,而手机人脸识别则依赖芯片的实时计算能力。
2)框架层(开发工具集)
这是开发者的“工具箱”,把复杂的数学计算包装成简单易用的接口。
代表工具:PyTorch(科研首选,灵活调试模型)、TensorFlow(适合产品部署)。
核心功能:自动微分(自动计算梯度)、分布式训练(拆分大模型到多卡运行)、模型导出(将训练好的模型变成可部署的文件)。 开发者用PyTorch写几行代码就能构建神经网络,就像用乐高积木搭房子,无需从零制造每个零件。
3)模型层(算法核心)
AI的“大脑”所在,决定了系统能做什么、做多好。
典型模型:
核心价值:这些预训练好的模型就像“预制菜”——开发者不需要从零训练,下载调整即可使用。例如用Qwen模型快速搭建一个中文客服机器人。
4)接口层(连接桥梁)
让AI能力“接地气”的关键转换层,把复杂的模型变成人人可用的服务。
典型形态:
实际作用:就像手机充电器的转换头——把模型层的“高压电”转换成应用层需要的“安全电压”。例如通过Hugging Face接口,5行代码就能给图片添加AI滤镜。
5)应用层(用户触点)
普通人直接感知的AI形态,把技术转化为实际价值。
典型应用:
创新趋势:
这种分层设计让每个环节专注核心能力——就像餐厅后厨分工,有人专攻火候(硬件层),有人负责调味(模型层),最后服务员(应用层)把美味菜肴呈现给食客。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。