deephub

文章/答案/技术大牛

发布

LV1

全部文章

贝叶斯公式推导：从联合概率的对称性看条件反转
本文从简单概率的概念出发，逐步过渡到条件概率，最后介绍贝叶斯定理。整个过程会尽量保持直观，不涉及复杂的数学形式。
deephub 10天前2026-03-09 15:28:00
公众号、数学、count、formula、this
从路由串台到模型造假：2026年3月的一篇最新论文，实锤大模型第三方API的造假黑幕
访问诸如 GPT-5、Gemini-2.5 等前沿大语言模型往往面临高昂的定价、支付壁垒或地域限制。这种现状催生了大量第三方中转服务——即“影子 API” (S...
deephub 10天前2026-03-09 15:27:10
路由、论文、模型、api、测试
AutoGen 架构演进全梳理：从 v0.4 到 Microsoft Agent Framework
Microsoft AutoGen 曾是构建 LLM 多智能体系统的标杆性开源框架。2023 年末由 Microsoft Research 发布后迅速成为研究人...
deephub 10天前2026-03-09 14:27:12
工具、架构、开发者、agent、microsoft
Energy Distance：度量两个多元分布差异的统计方法
类似的问题不是没遇到过只是语境不同，比如说模型上次构建以来是否发生了数据漂移？销售分析中产品 A 和产品 B 的分布是否存在差异？归结下来问的都是同一件事，如何...
deephub 10天前2026-03-09 13:38:23
测试、数据、统计、distance、变量
MIT论文解读：LLM 会被自身历史回复拖累，上下文污染会导致多轮对话质量衰减
和 AI 对话超过 20 轮之后，看着它慢慢开始胡说八道，如果有过这种经历，那么你就应该看看这篇论文
 deephub 10天前2026-03-09 12:59:06
存储、论文、模型、系统、LLM
大模型训练的硬件基础：GPU内存层级、分块与并行策略
AI 和 LLM 的进步通常归因于三个方面的持续改进：模型、数据、计算。三者互相关联。要跑起那些参数量庞大的模型，就需要足够的计算资源来支撑。Llama 3 最...
deephub 10天前2026-03-09 12:13:39
模型、内存、硬件、gpu、基础
KV Cache管理架构演进：从连续分配到统一混合内存架构
在生产环境部署过LLM的人都知道模型权重只是问题的一半，另一半是KV cache：存储注意力状态的运行时内存，让模型在生成token时不必从头开始重算。能不能管...
deephub 15天前2026-03-04 18:10:56
缓存、管理、架构、模型、内存
PhysioDSP：一个面向可穿戴设备的 Python 信号处理库
可穿戴设备的生理信号处理是健康科技与研究领域反复出现的工程难题。ECG 记录、心率变异性指标、加速度计数据，不管处理哪一类信号，从原始传感器输出到有意义的生物标...
deephub 15天前2026-03-04 18:09:54
数据、算法、python、测试、架构
VAE 原理拆解：从概率编码到潜在空间正则化
这篇文章从基本原理出发完整拆解变分自编码器（VAE）的构建过程。重点不在数学推导而在于把概念落到足够具体的层面：完成实现、训练、调试和部署。每个组件做了什么、为...
deephub 15天前2026-03-04 18:08:59
异常、原理、编码、模型、数据
时间序列异常检测的5种方法：从统计阈值到深度学习
时间序列数据随处可见：网站每分钟的访问量、传感器读数、股票价格、人流计数、服务器 CPU 使用率，都是典型场景。
deephub 15天前2026-03-04 18:05:35
深度学习、网站、数据、统计、异常
从提示工程转向上下文工程，6种让LLM在生产环境中稳定输出的技术
RAG系统返回了完美的文本块，提示词写得很漂亮，但LLM还是在产生幻觉；文档加得越多，回复质量反而越差。这些问题问题不出在提示词上，而是出在上下文上。
deephub 20天前2026-02-27 12:46:18
LLM、工具、模型、数据、压缩
向量搜索系统的三个核心优化维度：速度、精度与规模
当数据集膨胀到数百万甚至数十亿量级的向量时，怎么让搜索在这种规模下依然又快又准就成了一个实实在在的工程难题。这篇文章要聊的就是向量搜索系统的三个核心优化方向——...
deephub 20天前2026-02-27 12:44:12
缓存、搜索、索引、系统、优化
深入RAG架构：分块策略、混合检索与重排序的工程实现
最初的版本就是标准版：全量文档 embedding，向量检索，LLM生成。演示没出过问题，但是翻车发生在数据留存政策的时候，因为系统召回了两段2废弃条款和一段聊...
deephub 20天前2026-02-27 12:44:05
数据、搜索、系统、架构、排序
AI Agent技术栈：10个构建生产级Agent的核心概念
Agentic AI的核心不在LLM选型也不在提示词技巧。真正决定一个Agent能否在无人值守的情况下稳定工作的是它背后的系统设计。
deephub 20天前2026-02-27 12:43:57
agent、服务器、工具、管理、系统
长上下文"记忆"的舒适陷阱：为什么更多记忆不等于更可靠
人们喜欢长上下文，智能体记得你的项目、你的偏好、你说话的方式，连你那些反复冒出来的琐碎任务都帮你记着，所以用起来当然顺手。但顺手归顺手，顺手不等于靠谱，把这两件...
deephub 20天前2026-02-27 12:43:50
系统、线程、工作流、模型、权限
超越上下文窗口：CodeAct与RLM，两种代码驱动的LLM扩展方案
用语言模型写代码、查数据库、跑自动化流程这些事情大家早就习以为常了。Vibe Coding 到今年二月刚好满一年，绝大多数人或多或少都在用它搞定代码库、写文档、...
deephub 20天前2026-02-27 12:42:11
LLM、递归、工具、模型、系统
15 分钟用 FastMCP 搭建你的第一个 MCP Server（附完整代码）
Model Context Protocol 是一个开放标准，它的目标是给 LLM 一种干净、统一的方式去发现和调用外部工具。不用再写自定义解析、不用再维护脆弱...
deephub 20天前2026-02-27 12:41:48
客户端、MCP、server、工具、函数
Prompt 缓存的四种策略：从精确匹配到语义检索
自然语言理解、摘要生成、代码编写、逻辑推理，OpenAI 等厂商的模型把这些事情做得相当好。但是只有一个问题，那就是 “贵".尤其是在应用上了规模之后，API ...
deephub 20天前2026-02-27 12:41:41
规范化、内存、系统、缓存、prompt
RAG 文本分块：七种主流策略的原理与适用场景
检索是 RAG 系统的搜索引擎，分块则是这个搜索引擎的基础。分块太长、太短、有噪声、切错了位置——随便犯哪个错LLM 都会有问题。行业里有句话流传很广："分块决...
deephub 20天前2026-02-27 12:41:33
系统、原理、递归、模型、实践
LLM创造力可以被度量吗？一个基于提示词变更的探索性实验
大语言模型在demo阶段总是看起来很惊艳。但一旦进入到生产环境很多问题就暴露了：不稳定、不可预测，甚至直接不可用。
deephub 20天前2026-02-27 12:40:08
模型、LLM、测试、工作、基础

12 3 4 5 6 7 8...88 下一页

个人简介

暂未填写公司和职称
暂未填写个人简介
暂未填写技能专长
暂未填写学校和专业
暂未填写个人网址
暂未填写所在城市
加入社区时间：2020-04-20

个人成就

获得 3.6K 次赞同
文章被阅读 2.7M 次
文章获得 1 次首页推荐

关注了：1关注者：246

deephub

全部文章

贝叶斯公式推导：从联合概率的对称性看条件反转

从路由串台到模型造假：2026年3月的一篇最新论文，实锤大模型第三方API的造假黑幕

AutoGen 架构演进全梳理：从 v0.4 到 Microsoft Agent Framework

Energy Distance：度量两个多元分布差异的统计方法

MIT论文解读：LLM 会被自身历史回复拖累，上下文污染会导致多轮对话质量衰减

大模型训练的硬件基础：GPU内存层级、分块与并行策略

KV Cache管理架构演进：从连续分配到统一混合内存架构

PhysioDSP：一个面向可穿戴设备的 Python 信号处理库

VAE 原理拆解：从概率编码到潜在空间正则化

时间序列异常检测的5种方法：从统计阈值到深度学习

从提示工程转向上下文工程，6种让LLM在生产环境中稳定输出的技术

向量搜索系统的三个核心优化维度：速度、精度与规模

深入RAG架构：分块策略、混合检索与重排序的工程实现

AI Agent技术栈：10个构建生产级Agent的核心概念

长上下文"记忆"的舒适陷阱：为什么更多记忆不等于更可靠

超越上下文窗口：CodeAct与RLM，两种代码驱动的LLM扩展方案

15 分钟用 FastMCP 搭建你的第一个 MCP Server（附完整代码）

Prompt 缓存的四种策略：从精确匹配到语义检索

RAG 文本分块：七种主流策略的原理与适用场景

LLM创造力可以被度量吗？一个基于提示词变更的探索性实验

个人简介

个人成就

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

deephub

贝叶斯公式推导：从联合概率的对称性看条件反转

从路由串台到模型造假：2026年3月的一篇最新论文，实锤大模型第三方API的造假黑幕

AutoGen 架构演进全梳理：从 v0.4 到 Microsoft Agent Framework

Energy Distance：度量两个多元分布差异的统计方法

MIT论文解读：LLM 会被自身历史回复拖累 ，上下文污染会导致多轮对话质量衰减

大模型训练的硬件基础：GPU内存层级、分块与并行策略

KV Cache管理架构演进：从连续分配到统一混合内存架构

PhysioDSP：一个面向可穿戴设备的 Python 信号处理库

VAE 原理拆解：从概率编码到潜在空间正则化

时间序列异常检测的5种方法：从统计阈值到深度学习

从提示工程转向 上下文工程，6种让LLM在生产环境中稳定输出的技术

向量搜索系统的三个核心优化维度：速度、精度与规模

深入RAG架构：分块策略、混合检索与重排序的工程实现

AI Agent技术栈：10个构建生产级Agent的核心概念

长上下文"记忆"的舒适陷阱：为什么更多记忆不等于更可靠

超越上下文窗口：CodeAct与RLM，两种代码驱动的LLM扩展方案

15 分钟用 FastMCP 搭建你的第一个 MCP Server（附完整代码）

Prompt 缓存的四种策略：从精确匹配到语义检索

RAG 文本分块：七种主流策略的原理与适用场景

LLM创造力可以被度量吗？一个基于提示词变更的探索性实验

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

MIT论文解读：LLM 会被自身历史回复拖累，上下文污染会导致多轮对话质量衰减

从提示工程转向上下文工程，6种让LLM在生产环境中稳定输出的技术