首页
学习
活动
专区
圈层
工具
发布
首页标签大模型部署

#大模型部署

Llama 2技术突破与生态应用全景解析

用户11764306

某机构近日发布了其开源语言模型Llama的第二代版本。这一新版模型基于更多训练数据(2万亿标记),支持更长的上下文长度(4096标记),且采用比第一代更宽松的许...

500

如何在不可信的云环境中,构建兼具极致性能与卓越安全的大语言模型(LLM)推理服务?

隐语社区小迷弟

打开链接点亮社区Star,照亮技术的前进之路。每一个点赞,都是社区技术大佬前进的动力

900

大模型如何革新搜索相关性?智能升级让搜索更“懂你”|得物技术

得物技术

你是否曾在社区搜索时遇到这样的困扰:想找一双“平价学生党球鞋”,结果出现的多是限量联名款?或者输入“初冬轻薄通勤羽绒服”,却看到厚重登山款?这类“搜不准”的情况...

2600

调用大模型时,发送与响应请求中的参数都是什么意思?

Qiuner

腾讯云TDP | 宣传大使 (已认证)

Token是AI模型处理文本的基本单位,用户输入内容需要转换成token才能方便大模型处理同时用于计费和性能监控:

3310

AI也会“脑腐蚀”?关于数据形态、认知衰退与大模型智力水平的深度研究

走向未来

在人工智能领域,大语言模型(LLM)的发展正处在一个关键的十字路口。一方面,模型的规模和能力持续突破极限,其背后依赖的是不断增长的、海量互联网数据的持续灌输。另...

2010

大模型备案干货,一看就懂版!

专业AI大模型算法备案指导

大模型备案,全称为“生成式人工智能(大语言模型)上线备案”,是国家网信部门为了规范生成式人工智能服务发展而出台的管理要求。根据《生成式人工智能服务管理暂行办法》...

9410

大模型备案,内行人才知的坑

专业AI大模型算法备案指导

算法备案已成为大模型合规上线的必经之路,然而​​超过60%的AI企业​​首次提交的备案材料会因各种问题被驳回。内行人都知道,备案过程中的“坑”远比表面上看起来的...

8310

RAG—Chunking策略实战|得物技术

得物技术

在 RAG 系统中,即便采用性能卓越的 LLM 并反复打磨 Prompt,问答仍可能出现上下文缺失、事实性错误或拼接不连贯等问题。多数团队会频繁更换检索算法与 ...

16610

Qwen3-Omni多模态微调实战:从通用模型到AI智能博物官

架构师李哲

在人工智能技术迅猛发展的今天,大语言模型(LLM)的通用能力已非常强大。以GPT-5、Qwen为代表的前沿模型在文本理解、对话生成等基础任务上已取得令人瞩目的进...

19510

大模型备案材料清单,一篇搞定,建议收藏!

专业AI大模型算法备案指导

大模型备案材料主要围绕​​模型安全性和合规性​​展开。以下是必须准备的六项核心材料:

9710

2小时打造专业医疗助手:基于CareGPT与Qwen3-8B的微调实战

架构师李哲

凌晨一点,突发剧烈头痛,视力也开始模糊。在这种紧急情况下,使用通用AI助手寻求建议,往往只能得到“请及时就医”这样正确但无用的回答。用户真正需要的,是具备初步症...

11510

算法备案不是选择题,是生死题!

专业AI大模型算法备案指导

算法备案,在2025年已不再是企业可选项,而是决定生死存亡的​​强制性要求​​。随着国家网信办算法备案系统的运行和完善,未备案的算法服务将面临严厉处罚,甚至直接...

10910

​​算法备案:让数字时代的“隐形推手”现形​

全国算法备案指导

在互联网平台上,我们每天看到的新闻、商品推荐、短视频内容,甚至搜索结果,大多不是随机呈现的,而是由复杂的算法决定的。这些算法就像看不见的“推手”,悄悄影响着我们...

10310

vLLM 部署 Qwen3-VL-32B-Thinking 模型 reasoning_content 为空问题解决记录

高老师

腾讯云TDP | 先锋会员 (已认证)

在部署 Qwen3-VL-32B-Thinking 模型时,遇到了 reasoning_content 字段始终为空的问题。尽管模型能够正常生成推理内容,但无法...

50640

大模型备案干货!收藏这一篇就够啦

专业AI大模型算法备案指导

随着人工智能技术的快速发展,生成式人工智能服务已深入各行各业。为确保技术应用合规、安全、可控,​​大模型备案​​成为所有相关企业必须履行的法律程序。本文将全面解...

13710
领券