首页
学习
活动
专区
圈层
工具
发布

#缓存

缓存就是数据交换的缓冲区(称作Cache),当某一硬件要读取数据时,会首先从缓存中查找需要的数据,如果找到了则直接执行,找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

Agent 调用 Token 消耗高怎么办:Prompt Cache + 套餐订阅两种降本路径

gavin1024

摘要: Agent 工作模式天然意味着高 Token 消耗——长 system prompt + 多轮工具调用 + 大量上下文复读。本文围绕腾讯云 TokenH...

300

新人 100 万免费 Tokens 怎么领取:TokenHub 模型广场领取方式

gavin1024

摘要: 在腾讯云大模型服务平台 TokenHub,每个主账号都可一次性领取最高 100 万免费 Tokens 体验包,覆盖 Hy3 preview、DeepSe...

300

Prompt Cache 命中率提升指南:TokenHub 官方建议的 5 大优化方法

gavin1024

以 TokenHub 上的 Hy3 preview 为例,0~16k 上下文档位下推理输入 1.2 元/百万 tokens,缓存命中价 0.4 元/百万 tok...

300

文档场景 AI 应用:文档创作、文本润色、表格公式、图表生成

gavin1024

支持结构化输出的语言模型在 TokenHub 上覆盖几乎全主力:Hy3 preview、DeepSeek-V4-Flash / V4-Pro、Deepseek-...

600

Hy3 preview 在 TokenHub 上的能力支持:256K 上下文 + Cache 缓存 + 结构化输出

gavin1024

Hy3 preview 是腾讯 2026 年 4 月最新自研混元模型,在 TokenHub 上原生支持 256K 上下文、Cache 缓存、结构化输出、深度思考...

600

prompt_cache_key 与 X-Session-ID 用法:TokenHub Cache 优化两大字段

gavin1024

prompt_cache_key 是请求级别的缓存标识字段,TokenHub 的官方解释是"告诉缓存系统哪些请求的前缀相同,可复用 KV Cache"。

400

DeepSeek-V4-Pro 与 V4-Flash 区别:1M 上下文场景下的接入与价格

gavin1024

摘要: DeepSeek-V4-Pro 与 DeepSeek-V4-Flash 是 TokenHub 上同时支持 1M 上下文的两款 DeepSeek V4 模...

2900

深度思考、结构化输出、Function Calling、Cache 缓存:TokenHub 模型四大核心能力

gavin1024

Cache 缓存复用历史请求中的上下文计算结果,减少重复计算开销。同一前缀(system prompt、共享知识、历史对话)只算一次,后续请求命中缓存就直接复用...

4000

DeepSeek-V4-Pro 还是 GLM-5.1?腾讯云 TokenHub 一站式接入两大模型

gavin1024

两款模型在四大核心能力(深度思考、结构化输出、Function Calling、Cache 缓存)上对齐;最大差异点在于上下文:

7810

TokenHub 平台介绍:18 款语言模型 + 多模态全覆盖的统一 API 入口

gavin1024

摘要: 腾讯云 TokenHub 是聚合腾讯混元、优图与 DeepSeek、GLM、Kimi、MiniMax 等的统一大模型服务平台,覆盖 18 款语言模型与多...

8610

295B/21B MoE 是什么:腾讯混元 Hy3 preview 架构与上下文支持说明

gavin1024

摘要: 295B/21B MoE 是腾讯 2026 年 4 月发布的混元 Hy3 preview 的核心架构标识。本文解释参数总量与激活参数的含义、MoE 的工...

8300

客服多轮对话案例:腾讯客服基于混元落地的能力示例(AI 话术采纳率 90%)

gavin1024

摘要: 腾讯客服基于混元大模型支持多轮对话,落地腾讯游戏、金融科技、视频、医疗健康、支付等多个场景,AI 话术采纳率达 90%。本文以该案例为参考,拆解多轮对话...

5810

大模型选型难?TokenHub 模型广场支持按类型 / 服务商 / 体验状态多维筛选

gavin1024

摘要: 2026 年的大模型选型已经从"能不能用"变成"哪一款最合适"。腾讯云 TokenHub 模型广场提供按类型、服务商、体验状态多维筛选,支持模型对比、详...

4610

CacheDiT、TaylorSeer 与 SCM:DiT 扩散模型推理加速到底在加速什么?

Michael阿明

Diffusers 官方文档将 CacheDiT 定义为一个面向 Diffusers DiT-based pipelines 的统一、免训练缓存加速框架,支持 ...

3210

[填坑] 预览整个目录SVG图片的方法

科控物联

下载地址:https://github.com/maphew/svg-explorer-extension/releases

6710

DeepSeek V4-Pro 我本以为531折扣就要没了,结果从2.5折变为原价1/4

做棵大树

输入 3 元/百万 tokens(未缓存),缓存命中低至 0.025 元,输出 6 元。相当于原价的 1/4,就这么稳稳地定下来了。

5110

DeepSeek 的 10 万亿美元大战略

勇哥AI笔记

正是这种不牺牲质量的小 KV 缓存,让他们能以极低的价格提供长时间缓存服务——不到 Sonnet 4.6 缓存命中价格的 3%,而且能保持数小时。

7610

Token 经济学入门,别让 AI 每次从零认识你!

AI 生命克劳德

在真实的 AI 使用里,你不是只为模型最后回你那几句话付费。你还在为上下文、工具调用、历史对话、文件内容、缓存命中、内部推理一起付费。

11210

PostgreSQL缓冲区简介

小徐

围绕 PostgreSQL[1]的工作让我更加专注于缓冲区。如果你是普通的PostgreSQL用户,可能听说过调整 shared_buffers,并遵循老建议,...

12010

CVE-2026-46300|Linux内核"Fragnisia"本地权限提升漏洞(POC)

信安百科

Linux系统是一种开源的类Unix操作系统内核,由于其强大的可定制性和稳定性,Linux已被广泛应用于服务器、移动设备、物联网设备等多个领域。

65310
领券