首页
学习
活动
专区
圈层
工具
发布

#LLM

会议场景 LLM 落地案例:腾讯会议 AI 小助手会前 / 会中 / 会后能力示例

gavin1024

摘要: 腾讯会议 2024 年 2 月上线的 AI 小助手基于混元大模型,覆盖会前准备、会中提醒与实时问答、会后纪要整理等完整链路。本文以该案例为参考,拆解会议...

2100

RAG系列:#5 RAG中的11种分块策略

AI-Frontiers

原文:https://mp.weixin.qq.com/s/Yax05qsVj1tXi77za8Wm2g欢迎关注公zh: AI-Frontiers

1500

东南大学&D⁴Lab社区最新LLM后训练方案LoPT:无需“全模型反传”,更便宜,更快,也更克制

AI生成未来

作者:Hengyu Shi, Tianyang Han, Peizhe Wang等

2400

“豆包型人格”背后的算法黑箱:AI 为什么学不会说“我不知道”?

干饭第一名

当前绝大多数大语言模型(LLM),本质上依然是“概率性文本生成器”。它们的底层逻辑是通过海量数据预测下一个最可能出现的 Token。

2300

基于本体建模和LLM-Wiki的思路构建AI智能知识库-完成完整方案和长文写作

人月聊IT

在前面我讲到过借鉴Karpathy的LLM-Wiki的思路,借鉴了我前面的本体建模的思路(场景-对象-行为-方法-规则)来构建智能知识库平台。注意这个知识库不是...

3210

Agent 系列(五):从 LLM 的角度聊 Prompt、Context 和 Harness

磊叔的技术博客

Prompt Engineering 在两三年前还是非常热的关键词,现在可能也提,但是热度已经降了下来;后来我们开始谈 Context Engineering,...

7410

LLM分布式推理终极方案——以GPU为中心的云原生架构

皮振伟

Kubernetes架构的成功,核心前提是业务的无状态化运行。可以预见,若LLM推理业务能够实现无状态化运行,K8s带来的资源利用率提升、运维简化等收益可以直接...

7210

意图协议在规模化 AI 交付中的工程实践与成本优化

Akir.weiwen

承接《设计意图治理:当界面从确定性走向概率性》与《设计意图的形式化:从自然语言到机器可读》:我们论证了设计意图的三次断裂,也展示了意图协议的 YAML 形态。本...

8010

和AI一起搞事情#6. 如何实现Lovart元素编辑?

风雨中的小七

哎哟,然后就让我看到拆分图层后的文字,其实和原始图片中的文字字体和颜色并不一致……

20912

多智能体系统自动化故障归因技术

用户11764306

“自动化故障归因”是多智能体系统开发生命周期中的一个关键组成部分。它有可能将识别“哪里出了问题以及该由谁负责”这一挑战,从一个令人困惑的谜题转变为一个可量化、可...

14510

反对LLM最大化主义:模块化NLP设计

用户11764306

许多人正在用大语言模型构建真正新颖的东西,比如以前不可能实现的交互式虚构体验。但如果你处理的是企业长期以来一直试图解决的相同类型的自然语言处理问题,那么使用它们...

11010

设计意图的形式化:从自然语言到机器可读

Akir.weiwen

承接上一篇:既然设计意图需要从"文档"走进"系统",那这份"意图协议"长什么样? 本文展示意图协议的具体形态——不是抽象概念,是可以直接复制粘贴的 YAML/J...

8110

大语言模型与监控技术的结合

用户11764306

上周,一艘悬挂荷兰国旗的邮轮上有八名乘客感染了一种由老鼠传播的汉坦病毒。其中三人已因此死亡。但卫生专家强调,这种情况与2020年的冠状病毒爆发完全不同。

6610

llama4j:Java 工程师的 LLM 核弹

javpower

llama4j 不是「能跑就行」的玩具,而是一套生产级分层架构,每一层都经过工业场景的千锤百炼:

11210

理解 KV Cache:LLM 推理为什么能越写越快

七牛开发者

只要你和现在的 AI 工具交流,无论是 Codex、Claude,还是 ChatGPT、DeepSeek、豆包,你应该都注意过一件事:它并不是一次性把完整答案吐...

11100
领券