随着自然语言处理领域的进步和新思想的发展,我们看到越来越多高效利用计算资源的方法,从而生产出运行成本更低、更易于控制的人工智能系统。大型语言模型(LLMs)潜力巨大,但也对工业界需要模块化、透明度和数据隐私的现有工作流程提出了挑战。在本次演讲中,我将展示一些实用解决方案,用于在实际应用中使用最新的最先进模型,并将其知识提炼成更小、更快的组件,以便在内部运行和维护。
我将分享一些真实世界的案例研究和方法,探讨如何在开发阶段(而非运行阶段)使用大型生成模型,通过高效的人机协同工作流程来整理其结构化预测,并蒸馏出小至 6MB 的特定任务组件。这些组件运行成本低、注重隐私、可靠,并且可以组合成更大的自然语言处理系统。
如果你正试图构建一个执行特定任务的系统,你不需要将你的请求转换为任意语言,然后调用最能理解任意语言的大型模型。开发这些模型的人在讲述这样的故事,但我们其他人没有义务相信他们。
案例研究 #1
案例研究 #2 (某机构)
案例研究 #3 (某机构)
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。