首页
学习
活动
专区
圈层
工具
发布

#LLM

东南大学&D⁴Lab社区最新LLM后训练方案LoPT:无需“全模型反传”,更便宜,更快,也更克制

AI生成未来

作者:Hengyu Shi, Tianyang Han, Peizhe Wang等

200

“豆包型人格”背后的算法黑箱:AI 为什么学不会说“我不知道”?

干饭第一名

最近技术圈和大众用户中流行起一个新词——“豆包型人格”。网友对其的精准刻画是:遇事瞎糊弄,被发现就秒速认错,态度极好,但下次还敢,且未必改正。

1000

基于本体建模和LLM-Wiki的思路构建AI智能知识库-完成完整方案和长文写作

人月聊IT

在前面我讲到过借鉴Karpathy的LLM-Wiki的思路,借鉴了我前面的本体建模的思路(场景-对象-行为-方法-规则)来构建智能知识库平台。注意这个知识库不是...

2000

Agent 系列(五):从 LLM 的角度聊 Prompt、Context 和 Harness

磊叔的技术博客

Prompt Engineering 在两三年前还是非常热的关键词,现在可能也提,但是热度已经降了下来;后来我们开始谈 Context Engineering,...

5100

LLM分布式推理终极方案——以GPU为中心的云原生架构

皮振伟

这三级缓存架构依然遵循“速度越快,单位成本越高,容量越小”的金字塔型结构。例如,NVMe的性能远低于DDR,但1TB内存的成本约为NVMe的30~100倍,因此...

2600

意图协议在规模化 AI 交付中的工程实践与成本优化

Akir.weiwen

承接《设计意图治理:当界面从确定性走向概率性》与《设计意图的形式化:从自然语言到机器可读》:我们论证了设计意图的三次断裂,也展示了意图协议的 YAML 形态。本...

6510

和AI一起搞事情#6. 如何实现Lovart元素编辑?

风雨中的小七

哎哟,然后就让我看到拆分图层后的文字,其实和原始图片中的文字字体和颜色并不一致……

14012

多智能体系统自动化故障归因技术

用户11764306

“自动化故障归因”是多智能体系统开发生命周期中的一个关键组成部分。它有可能将识别“哪里出了问题以及该由谁负责”这一挑战,从一个令人困惑的谜题转变为一个可量化、可...

14510

反对LLM最大化主义:模块化NLP设计

用户11764306

许多人正在用大语言模型构建真正新颖的东西,比如以前不可能实现的交互式虚构体验。但如果你处理的是企业长期以来一直试图解决的相同类型的自然语言处理问题,那么使用它们...

10910

设计意图的形式化:从自然语言到机器可读

Akir.weiwen

承接上一篇:既然设计意图需要从"文档"走进"系统",那这份"意图协议"长什么样? 本文展示意图协议的具体形态——不是抽象概念,是可以直接复制粘贴的 YAML/J...

8010

大语言模型与监控技术的结合

用户11764306

上周,一艘悬挂荷兰国旗的邮轮上有八名乘客感染了一种由老鼠传播的汉坦病毒。其中三人已因此死亡。但卫生专家强调,这种情况与2020年的冠状病毒爆发完全不同。

6510

llama4j:Java 工程师的 LLM 核弹

javpower

llama4j 不是「能跑就行」的玩具,而是一套生产级分层架构,每一层都经过工业场景的千锤百炼:

11110

理解 KV Cache:LLM 推理为什么能越写越快

七牛开发者

只要你和现在的 AI 工具交流,无论是 Codex、Claude,还是 ChatGPT、DeepSeek、豆包,你应该都注意过一件事:它并不是一次性把完整答案吐...

11000

设计意图治理:当界面从确定性走向概率性

Akir.weiwen

你定义了「告警卡片 = 红色脉冲 + 必须人工确认」。三个月后,另一个产品的设计师复用了你的组件,但把红色改成了橙色——因为那个产品的主题色是橙色系。再三个月后...

6810
领券