首页
学习
活动
专区
圈层
工具
发布
首页标签大模型部署

#大模型部署

Transformer 详解:为什么它能统治整个 AI 领域?

ETL 小当家

在 Transformer 出现之前,处理文本的主流方法是 RNN 及其改进版 LSTM。它们有几个比较头疼的问题。

1500

你知道什么是LLM 蒸馏技术吗?

ETL 小当家

LLM 蒸馏 (Distillation) 是一种技术,用于将大型语言模型 (LLM) 的知识转移到较小的模型中。其主要目的是在保持模型性能的同时,减少模型的大...

3200

推开AI的门

白玉光

当第一次体验到大模型带给你的惊喜时,你有没有想过,它到底是怎么思考的?你或许忙碌、疲惫,连思考“它是怎么思考的”都来不及去思考。可是在过去的很长时间里,模型参数...

3100

训推平台助力AI落地:大模型企业级场景化能力的构建与部署

星图云

随着大模型技术向各行业渗透,企业在应用过程中面临两大现实挑战:一方面,通用大模型难以保证特定业务场景能力调用效果的可靠性;另一方面,对于AI使用经验不足的企业,...

2300

VLM视觉模型处理过程

aaronwjzhao

以Qwen2.5 VL 3B为例,patch_size=14,输入图像按照14 * 14划分成多个patch块。对于尺寸为(H * W)的图像,视觉token数...

11411

架构演进:从确定性工作流 (Workflow) 到自主智能体 (LLM Agent)

咕泡科技

湖南咕泡网络科技有限公司 | 副总裁 (已认证)

虽然两者都以大模型(LLM)为核心引擎,但在控制流逻辑、状态管理及非确定性处理上存在本质区别。本文将通过“智慧旅游规划”这一典型场景,深度拆解两者的技术范式差异...

11710

从 Gemini 的变化,看 AI 系统设计正在发生的一个转向

用户12007056

在 AI 应用的早期阶段,系统设计往往围绕一个核心问题展开: 这个模型,够不够强?

8910

云上 AI API 接入实践:企业如何治理多模型与密钥复杂度

用户12007056

随着 Claude 等大模型逐步进入企业生产系统,越来越多业务开始依赖 AI API 能力,例如智能客服、内容生成、知识问答与自动化流程等。

9110

万字长文详解向量数据库与RAG

闫同学

在我们<u>上一篇文章</u>中,我们探讨了如何通过构建知识库,使得大模型能够从“无状态”变成“有状态”,从而增强其记忆和上下文感知的能力。知识库作为一种让大模...

29550

当AI API 进入制造与医疗核心系统:工程侧需要提前考虑的几个关键问题

用户12007056

模型效果不错,接口也能调通,测试阶段一切正常。但当系统进入 真实运行环境,尤其是制造业和医疗行业的核心系统后,问题才真正开始暴露。

10910

Gemini 3 Pro 国内怎么购买 API Key 及大模型 LLM API 试用指南

用户11991468

摘要:Google 再次刷新了 多模态大模型 的上限。本文将为您权威解读 Gemini 3 Pro 的核心特性(超长上下文、原生多模态),并为国内开发者提供一份...

1.3K20

2026 大模型(LLM)三巨头:Gemini 3 Pro, GPT-5.2, Claude Opus 4.5 API 谁更值得购买?

用户11991468

摘要:2026 年的 AI 战场硝烟四起,Google、OpenAI 与 Anthropic 纷纷亮出核武器。面对 Gemini 3 Pro 的多模态、GPT-...

36710
领券