首页
学习
活动
专区
圈层
工具
发布

#内存

Go 切片截取后,为什么大数组迟迟无法释放?

技术圈

这不是传统意义上的内存泄漏,而是“仍然可达但业务上不再需要”的内存保留问题。GC 行为是正确的,代码的引用关系才是关键。

2100

显存大就一定跑得快?一文看懂AI芯片容量与带宽的核心误区

GPUS Lady

同时英伟达还有独家兜底方案:在HBM4高速显存之外,搭配大容量低速CPU内存组成分级显存架构。部分场景下可以借用系统内存扩容,模糊纯HBM显存的容量短板。

200

存储芯片价格Q3将飙升50%,Q4将再涨40%!

芯智讯

根据杰富瑞与一位内存行业顾问举行的专家电话会议后,发布研报指出,2026年第三季度,DRAM芯片价格预计将环比暴涨40%至50%,而接下来的第四季度,价格将再度...

2100

高通公布数据中心Roadmap,目标2029年拿下150亿美元!

芯智讯

高通还发布了一种创新的专用近内存计算架构——HBC(高带宽计算),它将计算能力与高速内存结合在 3D 堆叠硅解决方案中,以解决AI计算所面临的数据传输瓶颈,实现...

2200

DRAM价格暴涨,苹果也扛不住了!

芯智讯

目前苹果产品线中,iPhone 17 Pro系列及iPhone Air已配备12GB LPDDR5X内存,这意味着这些机型将首当其冲受到成本冲击。若苹果持续将1...

1100

业绩炸裂!美光Q3净利暴增12倍,毛利率碾压英伟达!

芯智讯

美东时间6月24日盘后,存储芯片大厂美光科技(Micron Technology)公布了其2026财年第三季度(截至2026年5月28日)的财务报告。财报数据显...

900

RDPPlus v12 更新 -- 运维工具箱

科控物联

作用:RAMMap 是 深度内存分析工具,能以可视化的方式展示 Windows 物理内存的 每一项分配——哪些进程在使用、用于什么用途(进程私有、映射文件、共享...

1500

RDPPlus v12 更新 -- 设备与系统设置

科控物联

为什么需要:程序关了不代表内存释放了。Windows 的内存管理偏保守,经常留着不用的数据在内存里"以备不时之需"。一键内存优化能强制回收这些空间,让当前运行的...

600

一道LLM推理部署面试题:KV缓存淘汰90% token,显存为什么没降?

用户11563501

目前vLLM和绝大多数生产级推理服务用的内存管理机制是Paged Attention,它会把GPU显存拆成固定大小的物理块,每个块大概能存16个token的KV...

2100

电脑价格 “一天一个价”,涨价太猛了:去年不到7000元,今年12000元

程序员小猿

自去年第四季度起,受全球AI算力需求爆发影响,内存、硬盘以及CPU、显卡等核心配件价格普遍走高。面对厂家的调价通知,今年以来,不少经销商不得不频繁调整终端零售价...

1900

Hermes Agent:揭秘四层内存系统与学习循环

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

大多数智能体顶多能记住发生过什么,Hermes 则直接更进一步:它会把管用的方法抽出来,写成可复用的技能,下次碰到类似问题直接开抄作业。这套学习循环是全自动跑的...

9410

面试官追问:Java 中 1==1 为 true,1000==1000 为啥是 false?答案就在这

HELLO程序员

GSK(中国) | 全栈架构师 (已认证)

说白了,a == b问的不是 “a 和 b 的值是不是一样”,而是 “这两个变量是不是指着内存里同一个对象”。

7300

英伟达在五年内能到10万亿美元,抓住英伟达就抓住了未来

PikeTalk

英伟达的市值目前已经超过所有大型制药公司的总和,无论是有机还是无机,只要是物质合成,就会越来越依赖加速计算。

5010

本地零成本:养🦞龙虾-OpenClaw 只需三步

jeffery_jcm

当Google DeepMind推出Gemma4小模型之后,本地推理实现了质的飞跃;

10000

想让LLM多想几轮,又不想显存爆炸?MELT 把循环 Transformer 的 KV 缓存解耦了

唐国梁Tommy

过去两年,让大模型"会思考"的主流路径是 Chain-of-Thought:模型在给答案前先把推理过程一段段地"说出来"。它有效,但也有清晰的代价——输出越长,...

10710

一文读懂 NVIDIA 与 Sakana AI 联手打造的稀疏 LLM 黑科技

唐国梁Tommy

在 AI 圈,Scaling Law 几乎被奉为真理:模型越大,性能越强。但这个“强”是有代价的。动辄数千亿参数的模型,不仅让推理成本(VRAM、延迟)变成天文...

9910

Transformer之后,谁主沉浮?一文梳理大模型高效架构的演进脉络

唐国梁Tommy

理解FlashAttention的关键在于理解现代GPU的存储层次结构:速度极快但容量很小的SRAM(片上内存)和速度较慢但容量巨大的HBM(高带宽内存)。标准...

9300

Kinetics 伸缩法则:重估LLM测试时推理中的计算与内存访问成本

唐国梁Tommy

最近大语言模型(LLM)的浪潮一波接一波,模型参数越来越大,能力也越来越强。但随之而来的,是推理成本的急剧攀升。我们常常追求大力出奇迹,希望用更大的模型、更多的...

12410

通过hs_err_pid日志文件分析Java进程崩溃原因

码农戏码

之前出现过内存泄漏,但这次通过grafana查看,各项指标看着也正常,内存没有大幅上升

12310

半个月搞定一次堆外内存泄漏排查

码农戏码

服务通过 - Xmx=6G 指定最大堆分配为 6G,但实际 RSS 已达到 11G,开始怀疑堆外内存是否有内存泄露。

9500
领券