token - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签token

#token

每月给AI交"月租"的人醒醒：这笔账我算完了，一年白扔1800

了了同学 16小时前2026-07-27 22:45:58

上篇我说，把AI装进自己电脑，每月能省下200块。有人私信我："200块？你不会是吹的吧？"今天这篇，我就把这笔账，一笔一笔摊开给你看。算完你会发现，200块还...

200

搭建OpenAI-Claude API中转站

用户6989487 17小时前2026-07-27 21:11:46

开发 AI 应用时，经常需要调用 OpenAI、Claude 等大语言模型的 API。但由于网络限制或管理需求，直接调用官方 API 可能不够方便。本文将介绍一...

2000

OPC必备！在 Cloudflare Worker 上免费部署自托管 AI 网关：集中管理与供应 Token

程序猿DD 1天前2026-07-27 13:23:59

如果你跟我一样，平时折腾独立产品、或者是 AI 方向的 OPC，相信你一定买了很多 Coding Plan、Token Plan 等各种 AI 资源。不论你是在...

3510

TokenHub 正式开源：企业 AI 落地，需要先把 Token 管起来

astaxie 1天前2026-07-27 11:27:19

过去一段时间，我们接触了大量正在推进 AI 落地的企业。大家的共识越来越清晰：AI 真的开始用起来了。

3410

DecentMem 双池记忆：借鉴强化学习的利用与探索设计，Token 消耗降了近一半

deephub 3天前2026-07-24 20:47:28

基于大语言模型的多智能体系统有一个问题就是所有智能体共享一个存储库。这样会限制着性能、可扩展性和多样性。

7610

DGX Spark 极限压榨！深度优化 DeepSeek-V4：35token/s、单机承载 766K 上下文多智能体服务

GPUS Lady 3天前2026-07-24 19:55:30

极长上下文会小幅拉高单 token 延迟：248K 上下文约 146ms/token，519K 上下文约 177ms/token；超长上下文优势是并发承载量与缓...

15310

Token降本50%：Harness工作流的成本优化实践

腾讯云开发者 4天前2026-07-24 10:08:30

代码图谱的 token 节省不只体现在单次查询上，更重要的是减少了 Agent 的探索轮次。少一轮工具调用，就少一次 API 请求，就少一整个 context ...

22510

Google DeepMind 发了三款新模型，token 更少，质量更高，成本没涨

用户11563501 4天前2026-07-23 21:31:47

根据 Google 的数据，3.6 Flash 在 Artificial Analysis Index 上平均少用 17% 的输出 token。在某些 Deep...

12100

23-长上下文训练为什么需要SequenceParallel

anzhsoft 4天前2026-07-23 20:52:47

第 22 篇把 mini-batch、micro-batch 和 dynamic batch size 拆开了：算法窗口、GPU 执行切片、token 重新装箱...

5700

我上线了Token共享与交换平台AITokenBus，让你免费无限用AI

www.tangshuang.net

腾讯｜前端开发工程师 (已认证)

4天前2026-07-23 20:26:45

故事的开始是这样的：有一次，我正在使用AI完成某个任务，突然提示，你的套餐用量已经消耗完了，此时，看着做到一半的任务，我却束手无策。

14010

怒省99%Token！代码能力提升10倍，又一开源办公神器来了

OpenNiuma 4天前2026-07-23 20:04:48

常规AI编码工具处理大型仓库时，会反复读取文件消耗大量上下文资源，这款MCP服务工具通过预构建代码知识图谱，把代码结构转为可快速查询的结构化数据，降低资源消耗，...

14610

开源了！花了10亿token, 我把这个整支设计团队力量的神级技能开源了! Codex史诗级必备技能！

OpenNiuma 4天前2026-07-23 20:04:08

于是，这个项目诞生了。累计消耗了超过10亿token的算力，终于把一支完整设计团队的能力，浓缩进了一个Skill里。今天，它正式开源了。

22310

你的 AI 员工可能在「摸鱼」：今天 50% 的 Token 正在被浪费

AI约翰 4天前2026-07-23 19:58:51

会动手的智能体，正从「回答问题」走向「自主执行任务」；可控，才是它上岗的第一前提。

10710

从 Token 价格战到成功任务单位经济学：AI 成本战的真正主线（上）

张善友 5天前2026-07-23 09:05:23

模型刚开始从实验室走向现实世界时，行业最先关心的就是 token 单价、API 费用、上下文长度、模型大小，以及谁能在相同预算下跑得更远。这个逻辑在 AI 早期...

9810

深入理解 Token：大模型的"基本单位"

翰墨飘香 6天前2026-07-22 10:15:08

计算机不认识文字，只认识数字。所以在模型处理任何文本之前，都要先经过一道分词（Tokenization）工序：把连续的文字切成一个个最小处理单元，这个单元就叫 ...

18900

Context压缩与Token优化：让长文档对话不爆上下文

陆业聪 7天前2026-07-21 13:42:55

• 月之暗面发布Kimi K3，同期智谱AI年化收入（ARR）突破10亿美元，国产大模型商业化节奏明显加快。

14610

防范时序攻击：为什么在 Go 中比较 Token/签名必须使用 crypto/subtle？

技术圈 7天前2026-07-21 12:08:16

用 == 比较两个 API Token，居然会让黑客在网络另一端逐位猜出你的正确凭证？这可不是危言耸听，而是安全领域里非常经典的侧信道时序攻击（Timing A...

8910

WAIC 2026观察：当Token成为算力新标尺，AI一体机迎来价值重估

Alter聊科技 7天前2026-07-21 11:54:33

Token需求爆发，推动AI一体机从交付设备转向交付产能。超聚变打通建设、提效、运营与应用闭环，让Token价值在业务一线兑现。

15510

大部分token根本不该重复计算，不止于KVCache

用户11563501 7天前2026-07-21 09:34:39

核心观察很简单：Transformer 里大部分 token 只关注自己附近的上下文，只有很少一部分 token 需要跨文档计算注意力。CacheBlend 只...

13310

#token

每月给AI交"月租"的人醒醒：这笔账我算完了，一年白扔1800

搭建OpenAI-Claude API中转站

OPC必备！在 Cloudflare Worker 上免费部署自托管 AI 网关：集中管理与供应 Token

TokenHub 正式开源：企业 AI 落地，需要先把 Token 管起来

DecentMem 双池记忆：借鉴强化学习的利用与探索设计，Token 消耗降了近一半

DGX Spark 极限压榨！深度优化 DeepSeek-V4：35token/s、单机承载 766K 上下文多智能体服务

Token降本50%：Harness工作流的成本优化实践

Google DeepMind 发了三款新模型，token 更少，质量更高，成本没涨

23-长上下文训练为什么需要SequenceParallel

我上线了Token共享与交换平台AITokenBus，让你免费无限用AI

怒省99%Token！代码能力提升10倍，又一开源办公神器来了

开源了！花了10亿token, 我把这个整支设计团队力量的神级技能开源了! Codex史诗级必备技能！

你的 AI 员工可能在「摸鱼」：今天 50% 的 Token 正在被浪费

从 Token 价格战到成功任务单位经济学：AI 成本战的真正主线（上）

深入理解 Token：大模型的"基本单位"

Context压缩与Token优化：让长文档对话不爆上下文

防范时序攻击：为什么在 Go 中比较 Token/签名必须使用 crypto/subtle？

WAIC 2026观察：当Token成为算力新标尺，AI一体机迎来价值重估

大部分token根本不该重复计算，不止于KVCache

热门专栏

腾讯云中间件的专栏

杨焱的专栏

张善友的专栏

AI科技大本营的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

#token

每月给AI交"月租"的人醒醒：这笔账我算完了，一年白扔1800

搭建OpenAI-Claude API中转站

OPC必备！在 Cloudflare Worker 上免费部署自托管 AI 网关：集中管理与供应 Token

TokenHub 正式开源：企业 AI 落地，需要先把 Token 管起来

DecentMem 双池记忆：借鉴强化学习的利用与探索设计，Token 消耗降了近一半

DGX Spark 极限压榨！深度优化 DeepSeek-V4：35token/s、单机承载 766K 上下文多智能体服务

Token降本50%：Harness工作流的成本优化实践

Google DeepMind 发了三款新模型，token 更少，质量更高，成本没涨

23-长上下文训 练为什么需要SequenceParallel

我上线了Token共享与交换平台AITokenBus，让你免费无限用AI

怒省99%Token！代码能力提升10倍，又一开源办公神器来了

开源了！花了10亿token, 我把这个整支设计团队力量的神级技能开源了! Codex史诗级必备技能！

你的 AI 员工可能在「摸鱼」：今天 50% 的 Token 正在被浪费

从 Token 价格战到成功任务单位经济学：AI 成本战的真正主线（上）

深入理解 Token：大模型的"基本单位"

Context压缩与Token优化：让长文档对话不爆上下文

防范时序攻击：为什么在 Go 中比较 Token/签名必须使用 crypto/subtle？

WAIC 2026观察：当Token成为算力新标尺，AI一体机迎来价值重估

大部分token根本不该重复计算，不止于KVCache

腾讯云中间件的专栏

杨焱的专栏

张善友的专栏

AI科技大本营的专栏

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

23-长上下文训练为什么需要SequenceParallel