大模型的技术中可能经常听到"Skill",它是做什么用的?能帮助我们做什么?我们怎么才能用到这个技能?
其实,大模型中的"Skill"≈一个"能完成特定任务的小程序"。
想象一下:大模型本身就像一个巨大的操作系统(例如Windows)。操作系统本身很强大,但你要让它帮你“将今天的气温超过30度的城市列出来并且排序”,直接问它,它可能说胡话。
这怎么整?给这个大操作系统装上一个个"小插件"或者"专用工具"。这些"小插件"就叫做Skill(技能)。
因为大模型本质上是一个文本预测器(猜下一个词),它没有手,不能直接操作外部系统——不能真发邮件、不能查数据库、不能打开计算器、不能控制机器人。
所以研究人员给它造了很多Skill,让它可以做这些,

大模型的工作流程变成: 用户提问 → 大模型判断要用哪个Skill → 调用那个Skill得到结果 → 整理答案返回。
所以当你下次看到大模型论文说"我们给模型增加了20个Skill",你可以理解为:"我们给模型装了20个小插件,让它能真正操控现实世界的一些东西了。"