首页
学习
活动
专区
圈层
工具
发布

#内存

Go语言中空struct{}占多少空间?

技术圈

在Go语言的世界中,有一种特殊的数据类型,它不占用任何内存空间,却有着强大的功能。这就是我们今天要深入探讨的主角——空结构体。

100

了解服务器的基础知识,就看这些表格

ICT系统集成阿祥

在互联网架构中,服务器是支撑所有服务运行的核心基础设施。不同于普通计算机,它需要满足 7×24 小时不间断运行、高并发处理、数据安全保障等严苛要求。本文将通过清...

7610

Guava Cache和Caffeine,哪个更好?

苏三说技术

Caffeine通过精心设计的数据结构和内存布局,在提供高性能的同时,也减少了内存占用和GC压力。在实际测试中,缓存相同数量的对象时,Caffeine通常比Gu...

6410

VS Code重磅更新:不再免费了!

GoLang学习记

曾经那个本地跑、不联网、秒响应的 IntelliCode,服务了 6000 万 开发者,如今说没就没 像极了你初恋发来的最后一条消息:

14310

Zed IDE 官宣:全新「彩虹括号」,又一次吊打了 VS Code?

GoLang学习记

→ 最外层 { } 是 蓝色, → foo(…) 是 橙色, → bar(…) 是 绿色, → baz(…) 是 紫色…… 颜色轮换,层级分明,再也不用靠数括号...

7310

Redis官方发布:高颜值可视化工具,功能还强的离谱!

GoLang学习记

Redis是一款开源的内存数据结构存储系统,可作为数据库、缓存层或消息中间件使用。其核心优势在于:

21410

Prompt 缓存的四种策略:从精确匹配到语义检索

deephub

内存缓存的优点是极快,单实例或小规模系统用起来非常合适。但是这样做也进程重启缓存就没了,多实例之间也无法共享。

11410

从零开始用自定义 Triton 内核编写 FlashAttention-2

deephub

这些基准验证了三件事:标准注意力从根本上内存受限;FlashAttention 把瓶颈从内存转到计算;Triton 提供了足够的数据移动和 GPU 内存底层控制...

11210

大模型如何训练百万 Token 上下文:上下文并行与 Ring Attention

deephub

但这些都有共同的局限。模型大、上下文又长到几百万 Token,张量并行也顶不住。因为注意力的二次方内存增长太凶,激活值直接占满显存。128k 上下文的激活值内存...

13410

计算机知识科普

知孤云出岫

CPU 不会主动等用户,它需要有人“管理资源”。 OS 就像工厂的总管,指挥所有工人(硬件)。

19210

torch.compile 加速原理:kernel 融合与缓冲区复用

deephub

延迟飙升的根本原因是什么?内存才是即时执行成为瓶颈。Nvidia H100 能跑到 300+ TFLOPs但内存带宽只有约 3 TB/s。所以内存搬运的代价太高...

9910

深入理解三种PEFT方法:LoRA的低秩更新、QLoRA的4位量化与DoRA的幅度-方向分解

deephub

第二项是双重量化,量化常数(把 4 位值转换回浮点时用的常数)本身也占内存,QLoRA 干脆把量化常数也给量化了,65B 模型上约省 3GB 内存。

17710

11:堆风水与高级内存布局技术

安全风信子

堆是程序运行时动态分配内存的区域,也是漏洞利用的重要目标。堆风水(Heap Feng Shui)是一种通过精心构造内存分配和释放操作,来控制堆内存布局的技术,其...

8310

流计算平台按需扩缩容能力全面解析:腾讯云Oceanus成企业优选

gavin1024

Oceanus采用独特的CU(Compute Unit)计费模式,1个计算CU包含1核CPU与4GB内存。这种设计使得资源扩缩容更加精细化,用户可以根据业务需求...

12310

58: vLLM 核心模块逐文件:kv_cache.py

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入剖析 vLLM 核心缓存模块 kv_cache.py,揭示...

11310

53. vLLM 核心模块逐文件:block_manager.py

安全风信子

代码分析:MemoryPool类管理不同类型的内存池,包括GPU内存池、CPU内存池和NVMe内存池,它提供了:

14410

52. vLLM 核心模块逐文件:scheduler.py

安全风信子

作者:HOS(安全风信子) 日期:2026-01-21 来源平台:GitHub 摘要: 本文深入解析vLLM调度器核心模块scheduler.py,揭示其...

17310

CANN 运行时系统深度解析:从 .om 加载到 NPU 执行的全链路剖析

晚霞的不甘

这一过程必须低延迟、高可靠、可并发。本文将揭开 CANN Runtime 的内部工作机制。

9810

守护智能边界:CANN 的 AI 安全机制深度解析

晚霞的不甘

在金融风控、身份认证、军事安防等场景中,这类风险不可接受。 CANN(Compute Architecture for Neural Networks) 不...

14410

CANN 实战:构建高并发智能视频分析系统

晚霞的不甘

整个 pipeline 运行在单台搭载 CANN 支持芯片的边缘服务器上(如 32GB 内存,64 TOPS INT8 算力)。

7910
领券