缓存 - 标签 - 腾讯云开发者社区-腾讯云

文章/答案/技术大牛

发布

首页标签缓存

#缓存

缓存就是数据交换的缓冲区（称作Cache），当某一硬件要读取数据时，会首先从缓存中查找需要的数据，如果找到了则直接执行，找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

大模型测试性能优化：测试专家必看

顾翔 11小时前2026-03-04 21:51:57

引言随着ChatGLM、Qwen、DeepSeek、Llama系列等大语言模型（LLM）在金融、政务、医疗等关键场景加速落地，软件测试正面临前所未有的范式变革...

1400

KV Cache管理架构演进：从连续分配到统一混合内存架构

deephub 14小时前2026-03-04 18:10:56

在生产环境部署过LLM的人都知道模型权重只是问题的一半，另一半是KV cache：存储注意力状态的运行时内存，让模型在生成token时不必从头开始重算。能不能管...

2300

提示词测试性能优化：测试专家必看

顾翔 15小时前2026-03-04 17:06:30

在大模型驱动的智能测试时代，提示词（Prompt）已不再是NLP工程师的专属工具——它正演变为软件测试的新‘测试用例’。在「啄木鸟软件测试」近期对237家企业的...

3000

聊一聊关于人机协作方式的思考

磊叔的技术博客 1天前2026-03-03 18:22:04

可以越来越确定的是：人机协作的关键，不在 “让 AI 更像人”，而在 “让人更像一个可管理的系统”。大模型之所以强，不是因为它懂你，而是它的机制清楚：有窗口、有...

3210

缓存的那些事儿：从原理到实践，让你的系统飞起来！

悠悠12138 2天前2026-03-02 21:41:47

所以CPU里面设计了三级缓存：L1、L2、L3。L1缓存最小但最快，通常只有几十KB，分为指令缓存和数据缓存。L2缓存稍大一些，一般几百KB到几MB。L3缓存最...

10710

别再无脑上CDN了！我用AxisNow自己搓了个“小Cloudflare”，这延迟绝了...

悠悠12138 2天前2026-03-02 21:39:32

用 Nginx 做缓存，那叫一个痛苦。proxy_cache_path 设在哪里？proxy_cache_key 怎么定？怎么清理缓存？清理还得装个 ngx_c...

7310

PDF 全文翻译，保留样式，大模型加持的全新方案，附核心代码

Ai学习的老章 2天前2026-03-02 20:19:37

K2.5 其实中间找到了一个开源项目PDF2Zh，计划按要求实行翻译，但是部署时遇到了 bug，我有点不太喜欢成熟方案，太重了。K2.5 发现部署有麻烦后，也转...

5610

Go语言新宠：sync.OnceValue，让懒加载更简单

技术圈 2天前2026-03-02 19:53:31

在日常开发中，我们经常会遇到这样的场景：某个函数只需要执行一次，其结果可以被多次重复使用。比如配置文件的读取、数据库连接初始化、复杂计算结果的缓存等。在Go语言...

4710

Linux学习之dd命令使用

ICT系统集成阿祥 4天前2026-02-28 17:19:16

dd 命令的核心是数据读写与转换，所有操作都围绕「输入源」和「输出目标」展开，基础格式：

9110

如何设计一个扛住千万级流量的系统？

苏三说技术 4天前2026-02-28 14:30:22

1. 高性能：不是简单追求快，而是要在保证正确性的前提下，用有限的资源处理尽可能多的请求。我们的目标是核心接口P99响应时间低于100毫秒，单机QPS不低于50...

9010

Guava Cache和Caffeine，哪个更好？

苏三说技术 4天前2026-02-28 14:23:34

要理解Guava Cache和Caffeine的关系，我们需要先了解它们的历史渊源。

7810

向量搜索系统的三个核心优化维度：速度、精度与规模

deephub 5天前2026-02-27 12:44:12

有了缓存就不一样了。热门查询再来的时候系统先查缓存：Have we seen this query before? 命中的话直接返回存好的结果，Embeddin...

9210

Prompt 缓存的四种策略：从精确匹配到语义检索

deephub 5天前2026-02-27 12:41:41

自然语言理解、摘要生成、代码编写、逻辑推理，OpenAI 等厂商的模型把这些事情做得相当好。但是只有一个问题，那就是 “贵".尤其是在应用上了规模之后，API ...

12310

RAG 中分块重叠的 8 个隐性开销与权衡策略

deephub 5天前2026-02-27 11:33:32

RAG 分块重叠提升了召回率但增加了隐藏成本，比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。

8710

NAS搭建游戏缓存服务器，Steam下载速度直接起飞

IT狂人日志 5天前2026-02-27 11:24:47

Lancache monolithic本质上是一个基于Nginx的HTTP缓存代理服务器。它的工作方式很简单：当局域网内任何设备下载游戏时，Lancache会拦...

19610

25：【HuggingFace】model下载超级慢 / ConnectionError → 国内镜像 & hf.co缓存

安全风信子 9天前2026-02-23 09:44:11

摘要：本文详细分析2026年HuggingFace模型下载慢和ConnectionError的常见原因，提供了基于国内镜像和hf.co缓存的完整解决方案。文章...

50510

Java全栈工程师面试实战：从基础到项目落地的深度对话

用魔法才能打败魔法 15天前2026-02-17 18:52:07

一位Java全栈工程师的面试实录，涵盖技术栈、项目经验与代码实践。

8910

从基础到实战：Java全栈工程师的面试之旅

用魔法才能打败魔法 18天前2026-02-15 06:46:21

一位Java全栈工程师在面试中的真实对话与技术解答，涵盖Spring Boot、Vue3、Redis、Kafka等技术点。

9610

从Java到Vue：一位全栈工程师的面试实录

用魔法才能打败魔法 18天前2026-02-14 20:45:07

一位拥有5年经验的Java全栈工程师在面试中展示了自己的技术能力，涵盖了Java、Spring Boot、Vue等多个技术栈。

8510

58: vLLM 核心模块逐文件：kv_cache.py

安全风信子 23天前2026-02-10 08:37:06

作者：HOS(安全风信子) 日期：2026-01-21 来源平台：GitHub 摘要：本文深入剖析 vLLM 核心缓存模块 kv_cache.py，揭示...