大家好,我是工藤学编程 🦉 | 一个正在努力学习的小博主,期待你的关注 |
|---|---|
实战代码系列最新文章😉 | C++实现图书管理系统(Qt C++ GUI界面版) |
SpringBoot实战系列🐷 | 【SpringBoot实战系列】SpringBoot3.X 整合 MinIO 存储原生方案 |
分库分表 | 分库分表之实战-sharding-JDBC分库分表执行流程原理剖析 |
消息队列 | 深入浅出 RabbitMQ-RabbitMQ消息确认机制(ACK) |
AI大模型 | 零基础学AI大模型之SpringAI |
前情摘要: 1、零基础学AI大模型之读懂AI大模型 2、零基础学AI大模型之从0到1调用大模型API 3、零基础学AI大模型之SpringAI
AI大模型(AI Models)本质是具备大规模参数、能模拟人类认知功能的信息处理算法——它不仅能“读懂”输入(比如文本、语音、图像),还能“生成”符合需求的输出(比如对话、图片、代码),核心优势是“泛化能力强”:不用针对单个场景单独训练,就能应对多种任务(比如既会写邮件,也能做数据分析)。
而SpringAI作为开发者常用的框架,直接为大模型提供了“落地工具”,支持多种核心模型类型,覆盖大部分业务场景:
如果把AI大模型比作“智能大脑”,下面这些概念就是它的“神经中枢”——决定了它“怎么思考”“怎么干活”“怎么不犯错”。
提示词不是简单的“一句话提问”,而是引导模型输出符合预期的“语言输入基础”。在SpringAI里,它被拆成了3个关键部分,分工明确:
开发者还能用StringTemplate等模板引擎优化提示词,比如做一个“生成笑话”的模板:“讲一个{type}类型的笑话,主角是{role}”,后续只需填充“冷笑话”“程序员”这样的占位符,就能快速适配不同用户输入。
你可能听过“ChatGPT3只能处理4K内容”,这里的“4K”指的就是令牌(Tokens)——大模型处理语言的基本单位,相当于人类说话的“词语片段”。
DeepSeek示例

嵌入是大模型“理解语义”的关键技术——把文本、图像等信息转换成浮点数组(向量),就像给每个内容分配一个“数字坐标”:语义越相似的内容,坐标越近(比如“猫”和“狗”的向量距离,比“猫”和“汽车”近)。
传统AI输出是字符串(比如即使返回JSON,也得手动转成Java对象),而结构化输出能让模型直接生成开发者需要的数据格式,省去解析步骤。 比如在SpringAI里,想获取5个“Order”对象,只需这样写:
List<Order> Order = chatClient.prompt()
.user("CCC给我5个订单信息")
.call()
.entity(new ParameterizedTypeReference<List<Order>>() {});大模型有个短板:训练数据有“截止日期”(比如2023年的模型不知道2024年的新政策),而RAG(Retrieval Augmented Generation)就是通过“实时检索外部数据”,让模型输出更精准、更实时。
大模型本身不能查天气、查股票,但工具调用能让它“调用外部API”,获取实时数据或执行操作,相当于给模型装了“外接大脑”。

觉得有用请点赞收藏! 如果有相关问题,欢迎评论区留言讨论~