首页
学习
活动
专区
圈层
工具
发布

#缓存

缓存就是数据交换的缓冲区(称作Cache),当某一硬件要读取数据时,会首先从缓存中查找需要的数据,如果找到了则直接执行,找不到的话则从内存中找。缓存的作用是帮助硬件更快地运行。

大模型测试性能优化:测试专家必看

顾翔

引言 随着ChatGLM、Qwen、DeepSeek、Llama系列等大语言模型(LLM)在金融、政务、医疗等关键场景加速落地,软件测试正面临前所未有的范式变革...

1400

KV Cache管理架构演进:从连续分配到统一混合内存架构

deephub

在生产环境部署过LLM的人都知道模型权重只是问题的一半,另一半是KV cache:存储注意力状态的运行时内存,让模型在生成token时不必从头开始重算。能不能管...

2300

提示词测试性能优化:测试专家必看

顾翔

在大模型驱动的智能测试时代,提示词(Prompt)已不再是NLP工程师的专属工具——它正演变为软件测试的新‘测试用例’。在「啄木鸟软件测试」近期对237家企业的...

3000

聊一聊关于人机协作方式的思考

磊叔的技术博客

可以越来越确定的是:人机协作的关键,不在 “让 AI 更像人”,而在 “让人更像一个可管理的系统”。大模型之所以强,不是因为它懂你,而是它的机制清楚:有窗口、有...

3210

缓存的那些事儿:从原理到实践,让你的系统飞起来!

悠悠12138

所以CPU里面设计了三级缓存:L1、L2、L3。L1缓存最小但最快,通常只有几十KB,分为指令缓存和数据缓存。L2缓存稍大一些,一般几百KB到几MB。L3缓存最...

10710

别再无脑上CDN了!我用AxisNow自己搓了个“小Cloudflare”,这延迟绝了...

悠悠12138

用 Nginx 做缓存,那叫一个痛苦。proxy_cache_path 设在哪里?proxy_cache_key 怎么定?怎么清理缓存?清理还得装个 ngx_c...

7310

PDF 全文翻译,保留样式,大模型加持的全新方案,附核心代码

Ai学习的老章

K2.5 其实中间找到了一个开源项目PDF2Zh,计划按要求实行翻译,但是部署时遇到了 bug,我有点不太喜欢成熟方案,太重了。K2.5 发现部署有麻烦后,也转...

5610

Go语言新宠:sync.OnceValue,让懒加载更简单

技术圈

在日常开发中,我们经常会遇到这样的场景:某个函数只需要执行一次,其结果可以被多次重复使用。比如配置文件的读取、数据库连接初始化、复杂计算结果的缓存等。在Go语言...

4710

Linux学习之dd命令使用

ICT系统集成阿祥

dd 命令的核心是数据读写与转换,所有操作都围绕「输入源」和「输出目标」展开,基础格式:

9110

如何设计一个扛住千万级流量的系统?

苏三说技术

1. 高性能:不是简单追求快,而是要在保证正确性的前提下,用有限的资源处理尽可能多的请求。我们的目标是核心接口P99响应时间低于100毫秒,单机QPS不低于50...

9010

Guava Cache和Caffeine,哪个更好?

苏三说技术

要理解Guava Cache和Caffeine的关系,我们需要先了解它们的历史渊源。

7810

向量搜索系统的三个核心优化维度:速度、精度与规模

deephub

有了缓存就不一样了。热门查询再来的时候系统先查缓存:Have we seen this query before? 命中的话直接返回存好的结果,Embeddin...

9210

Prompt 缓存的四种策略:从精确匹配到语义检索

deephub

自然语言理解、摘要生成、代码编写、逻辑推理,OpenAI 等厂商的模型把这些事情做得相当好。但是只有一个问题,那就是 “贵".尤其是在应用上了规模之后,API ...

12310

RAG 中分块重叠的 8 个隐性开销与权衡策略

deephub

RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。

8710

NAS搭建游戏缓存服务器,Steam下载速度直接起飞

IT狂人日志

Lancache monolithic本质上是一个基于Nginx的HTTP缓存代理服务器。它的工作方式很简单:当局域网内任何设备下载游戏时,Lancache会拦...

19610

25:【HuggingFace】model下载超级慢 / ConnectionError → 国内镜像 & hf.co缓存

安全风信子

摘要: 本文详细分析2026年HuggingFace模型下载慢和ConnectionError的常见原因,提供了基于国内镜像和hf.co缓存的完整解决方案。文章...

50510

Java全栈工程师面试实战:从基础到项目落地的深度对话

用魔法才能打败魔法

一位Java全栈工程师的面试实录,涵盖技术栈、项目经验与代码实践。

8910

从基础到实战:Java全栈工程师的面试之旅

用魔法才能打败魔法

一位Java全栈工程师在面试中的真实对话与技术解答,涵盖Spring Boot、Vue3、Redis、Kafka等技术点。

9610

从Java到Vue:一位全栈工程师的面试实录

用魔法才能打败魔法

一位拥有5年经验的Java全栈工程师在面试中展示了自己的技术能力,涵盖了Java、Spring Boot、Vue等多个技术栈。

8510

58: vLLM 核心模块逐文件:kv_cache.py

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入剖析 vLLM 核心缓存模块 kv_cache.py,揭示...

12310
领券