Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >一文探讨堆外内存的监控与回收

一文探讨堆外内存的监控与回收

作者头像
kirito-moe
发布于 2019-04-30 10:22:02
发布于 2019-04-30 10:22:02
1.3K00
代码可运行
举报
运行总次数:0
代码可运行

来源:《舰队 Collection》


引子

记得那是一个风和日丽的周末,太阳红彤彤,花儿五颜六色,96 年的普哥微信找到我,描述了一个诡异的线上问题:线上程序使用了 NIO FileChannel 的 堆内内存作为缓冲区,读写文件,逻辑可以说相当简单,但根据监控却发现堆外内存飙升,导致了 OutOfMemeory 的异常。

由这个线上问题,引出了这篇文章的主题,主要包括:FileChannel 源码分析,堆外内存监控,堆外内存回收。

问题分析&源码分析

根据异常日志的定位,发现的确使用的是 HeapByteBuffer 来进行读写,但却导致堆外内存飙升,随即翻了 FileChannel 的源码,来一探究竟:

FileChannel 使用的是 IOUtil 来进行读写(只分析读的逻辑,写的逻辑行为和读其实一致,不进行重复分析)

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
//sun.nio.ch.IOUtil#readstatic int read(FileDescriptor var0, ByteBuffer var1, long var2, NativeDispatcher var4) throws IOException {    if (var1.isReadOnly()) {        throw new IllegalArgumentException("Read-only buffer");    } else if (var1 instanceof DirectBuffer) {        return readIntoNativeBuffer(var0, var1, var2, var4);    } else {        ByteBuffer var5 = Util.getTemporaryDirectBuffer(var1.remaining());        int var7;        try {            int var6 = readIntoNativeBuffer(var0, var5, var2, var4);            var5.flip();            if (var6 > 0) {                var1.put(var5);            }            var7 = var6;        } finally {            Util.offerFirstTemporaryDirectBuffer(var5);        }        return var7;    }}

可以发现当使用 HeapByteBuffer 时,会走到下面这行比较奇怪的代码分支:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
Util.getTemporaryDirectBuffer(var1.remaining());

这个 Util 封装了更为底层的一些 IO 逻辑

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
package sun.nio.ch;public class Util {    private static ThreadLocal<Util.BufferCache> bufferCache;
    public static ByteBuffer getTemporaryDirectBuffer(int var0) {        if (isBufferTooLarge(var0)) {            return ByteBuffer.allocateDirect(var0);        } else {            // FOUCS ON THIS LINE            Util.BufferCache var1 = (Util.BufferCache)bufferCache.get();            ByteBuffer var2 = var1.get(var0);            if (var2 != null) {                return var2;            } else {                if (!var1.isEmpty()) {                    var2 = var1.removeFirst();                    free(var2);                }
                return ByteBuffer.allocateDirect(var0);            }        }    }}

isBufferTooLarge 这个方法会根据传入 Buffer 的大小决定如何分配堆外内存,如果过大,直接分布大缓冲区;如果不是太大,会使用 bufferCache 这个 ThreadLocal 变量来进行缓存,从而复用(实际上这个数值非常大,几乎不会走进直接分配堆外内存这个分支)。这么看来似乎发现了两个不得了的结论:

  1. 使用 HeapByteBuffer 读写都会经过 DirectByteBuffer,写入数据的流转方式其实是:HeapByteBuffer -> DirectByteBuffer -> PageCache -> Disk,读取数据的流转方式正好相反。
  2. 大多数情况下,会申请一块跟线程绑定的堆外缓存,这意味着,线程越多,这块临时的堆外缓存就越大。

看到这儿,似乎线上的问题有了一点眉目:很有可能是多线程使用堆内内存写入文件,而额外分配这块堆外缓存导致了内存溢出。在验证这个猜测之前,我们最好能直观地监控到堆外内存的使用量,这才能增加我们定位问题的信心。

实现堆外内存的监控

JDK 提供了一个非常好用的监控工具 —— Java VisualVM。我们只需要为他安装 2 个插件,即可很方便地实现堆外内存的监控。

进入本地 JDK 的可执行目录(在我本地是:/Library/Java/JavaVirtualMachines/jdk1.8.0_181.jdk/Contents/Home/bin),找到 jvisualvm 命令,双击即可打开一个可视化的界面

左侧树状目录可以选择需要监控的 Java 进程,右侧是监控的维度信息,除了 CPU、线程、堆、类等信息,还可以通过上方的【工具(T)】 安装插件,增加 MBeans、Buffer Pools 等维度的监控。

Buffer Pools 插件可以监控堆外内存(包含 DirectByteBuffer 和 MappedByteBuffer),如下图所示:

左侧对应 DirectByteBuffer,右侧对应 MappedByteBuffer。

复现问题

为了复现线上的问题,我们使用一个程序,不断开启线程使用堆内内存作为缓冲区进行文件的读取操作,并监控该进程的堆外内存使用情况。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
public class ReadByHeapByteBufferTest {    public static void main(String[] args) throws IOException, InterruptedException {        File data = new File("/tmp/data.txt");        FileChannel fileChannel = new RandomAccessFile(data, "rw").getChannel();        ByteBuffer buffer = ByteBuffer.allocate(4 * 1024 * 1024);        for (int i = 0; i < 1000; i++) {            Thread.sleep(1000);            new Thread(new Runnable() {                @Override                public void run() {                    try {                        fileChannel.read(buffer);                        buffer.clear();                    } catch (IOException e) {                        e.printStackTrace();                    }                }            }).start();        }    }}

运行一段时间后,我们观察下堆外内存的使用情况

如上图左所示,堆外内存的确开始疯涨了,符合我们的预期,堆外缓存和线程绑定,当线程非常多时,即使只使用了 4M 的堆内内存,也可能会造成极大的堆外内存膨胀,在中间发生了一次断崖,推测是线程执行完毕 or GC,导致了内存的释放。

知晓了这一点,相信大家今后使用堆内内存时可能就会更加注意了,我总结了两个注意点:

  1. 使用 HeapByteBuffer 还需要经过一次 DirectByteBuffer 的拷贝,在追求极致性能的场景下是可以通过直接复用堆外内存来避免的。
  2. 多线程下使用 HeapByteBuffer 进行文件读写,要注意 ThreadLocal<Util.BufferCache>bufferCache 导致的堆外内存膨胀的问题。

问题深究

那大家有没有想过,为什么 JDK 要如此设计?为什么不直接使用堆内内存写入 PageCache 进而落盘呢?为什么一定要经过 DirectByteBuffer 的拷贝呢?

在知乎的相关问题中,R 大和曾泽堂 两位同学进行了解答,是我比较认同的解释:

作者:RednaxelaFX 链接:https://www.zhihu.com/question/57374068/answer/152691891 来源:知乎 这里其实是在迁就OpenJDK里的HotSpot VM的一点实现细节。 HotSpot VM 里的 GC 除了 CMS 之外都是要移动对象的,是所谓“compacting GC”。 如果要把一个Java里的 byte[] 对象的引用传给native代码,让native代码直接访问数组的内容的话,就必须要保证native代码在访问的时候这个 byte[] 对象不能被移动,也就是要被“pin”(钉)住。 可惜 HotSpot VM 出于一些取舍而决定不实现单个对象层面的 object pinning,要 pin 的话就得暂时禁用 GC——也就等于把整个 Java 堆都给 pin 住。 所以 Oracle/Sun JDK / OpenJDK 的这个地方就用了点绕弯的做法。它假设把 HeapByteBuffer 背后的 byte[] 里的内容拷贝一次是一个时间开销可以接受的操作,同时假设真正的 I/O 可能是一个很慢的操作。 于是它就先把 HeapByteBuffer 背后的 byte[] 的内容拷贝到一个 DirectByteBuffer 背后的 native memory去,这个拷贝会涉及 sun.misc.Unsafe.copyMemory() 的调用,背后是类似 memcpy() 的实现。这个操作本质上是会在整个拷贝过程中暂时不允许发生 GC 的。 然后数据被拷贝到 native memory 之后就好办了,就去做真正的 I/O,把 DirectByteBuffer 背后的 native memory 地址传给真正做 I/O 的函数。这边就不需要再去访问 Java 对象去读写要做 I/O 的数据了。

总结一下就是:

  • 为了方便 GC 的实现,DirectByteBuffer 指向的 native memory 是不受 GC 管辖的
  • HeapByteBuffer 背后使用的是 byte 数组,其占用的内存不一定是连续的,不太方便 JNI 方法的调用
  • 数组实现在不同 JVM 中可能会不同

堆外内存的回收

继续深究一下一个话题,也是我的微信交流群中曾经有人提出过的一个疑问,到底该如何回收 DirectByteBuffer?既然可以监控堆外内存,那验证堆外内存的回收就变得很容易实现了。

CASE 1:分配 1G 的 DirectByteBuffer,等待用户输入后,赋值为 null,之后阻塞持续观察堆外内存变化

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
public class WriteByDirectByteBufferTest {    public static void main(String[] args) throws IOException, InterruptedException {        ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024);        System.in.read();        buffer = null;        new CountDownLatch(1).await();    }}

结论:变量虽然置为了 null,但内存依旧持续占用。

CASE 2:分配 1G DirectByteBuffer,等待用户输入后,赋值为 null,手动触发 GC,之后阻塞持续观察堆外内存变化

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
public class WriteByDirectByteBufferTest {    public static void main(String[] args) throws IOException, InterruptedException {        ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024);        System.in.read();        buffer = null;        System.gc();        new CountDownLatch(1).await();    }}

结论:GC 时会触发堆外空闲内存的回收。

CASE 3:分配 1G DirectByteBuffer,等待用户输入后,手动回收堆外内存,之后阻塞持续观察堆外内存变化

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
public class WriteByDirectByteBufferTest {    public static void main(String[] args) throws IOException, InterruptedException {        ByteBuffer buffer = ByteBuffer.allocateDirect(1024 * 1024 * 1024);        System.in.read();        ((DirectBuffer) buffer).cleaner().clean();        new CountDownLatch(1).await();    }}

结论:手动回收可以立刻释放堆外内存,不需要等待到 GC 的发生。

对于 MappedByteBuffer 这个有点神秘的类,它的回收机制大概和 DirectByteBuffer 类似,体现在右边的 Mapped 之中,我们就不重复 CASE1 和 CASE2 的测试了,直接给出结论,在 GC 发生或者操作系统主动清理时 MappedByteBuffer 会被回收。但也不是不进行测试,我们会对 MappedByteBuffer 进行更有意思的研究。

CASE 4:手动回收 MappedByteBuffer。

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
public class MmapUtil {    public static void clean(MappedByteBuffer mappedByteBuffer) {        ByteBuffer buffer = mappedByteBuffer;        if (buffer == null || !buffer.isDirect() || buffer.capacity() == 0)            return;        invoke(invoke(viewed(buffer), "cleaner"), "clean");    }
    private static Object invoke(final Object target, final String methodName, final Class<?>... args) {        return AccessController.doPrivileged(new PrivilegedAction<Object>() {            public Object run() {                try {                    Method method = method(target, methodName, args);                    method.setAccessible(true);                    return method.invoke(target);                } catch (Exception e) {                    throw new IllegalStateException(e);                }            }        });    }
    private static Method method(Object target, String methodName, Class<?>[] args)            throws NoSuchMethodException {        try {            return target.getClass().getMethod(methodName, args);        } catch (NoSuchMethodException e) {            return target.getClass().getDeclaredMethod(methodName, args);        }    }
    private static ByteBuffer viewed(ByteBuffer buffer) {        String methodName = "viewedBuffer";        Method[] methods = buffer.getClass().getMethods();        for (int i = 0; i < methods.length; i++) {            if (methods[i].getName().equals("attachment")) {                methodName = "attachment";                break;            }        }        ByteBuffer viewedBuffer = (ByteBuffer) invoke(buffer, methodName);        if (viewedBuffer == null)            return buffer;        else            return viewed(viewedBuffer);    }}

这个类曾经在我的《文件 IO 的一些最佳实践》中有所介绍,在这里我们将验证它的作用。编写测试类:

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
public class WriteByMappedByteBufferTest {    public static void main(String[] args) throws IOException, InterruptedException {        File data = new File("/tmp/data.txt");        data.createNewFile();        FileChannel fileChannel = new RandomAccessFile(data, "rw").getChannel();        MappedByteBuffer map = fileChannel.map(FileChannel.MapMode.READ_WRITE, 0, 1024L * 1024 * 1024);        System.in.read();        MmapUtil.clean(map);        new CountDownLatch(1).await();    }}

结论:通过一顿复杂的反射操作,成功地手动回收了 Mmap 的内存映射

CASE 5:测试 Mmap 的内存占用

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
public class WriteByMappedByteBufferTest {    public static void main(String[] args) throws IOException, InterruptedException {        File data = new File("/tmp/data.txt");        data.createNewFile();        FileChannel fileChannel = new RandomAccessFile(data, "rw").getChannel();        for (int i = 0; i < 1000; i++) {            fileChannel.map(FileChannel.MapMode.READ_WRITE, 0, 1024L * 1024 * 1024);        }        System.out.println("map finish");        new CountDownLatch(1).await();    }}

我尝试映射了 1000G 的内存,我的电脑显然没有 1000G 这么大内存,那么监控是如何反馈的呢?

几乎在瞬间,控制台打印出了 map finish 的日志,也意味着 1000G 的内存映射几乎是不耗费时间的,为什么要做这个测试?就是为了解释内存映射并不等于内存占用,很多文章认为内存映射这种方式可以大幅度提升文件的读写速度,并宣称“写 MappedByteBuffer 就等于写内存”,实际是非常错误的认知。通过控制面板可以查看到该 Java 进程(pid 39040)实际占用的内存,仅仅不到 100M。(关于 Mmap 的使用场景和方式可以参考我之前的文章)

结论:MappedByteBuffer 映射出一片文件内容之后,不会全部加载到内存中,而是会进行一部分的预读(体现在占用的那 100M 上),MappedByteBuffer 不是文件读写的银弹,它仍然依赖于 PageCache 异步刷盘的机制。通过 Java VisualVM 可以监控到 mmap 总映射的大小,但并不是实际占用的内存量

总结

本文借助一个线上问题,分析了使用堆内内存仍然会导致堆外内存分析的现象以及背后 JDK 如此设计的原因,并借助安装了插件之后的 Java VisualVM 工具进行了堆外内存的监控,进而讨论了如何正确的回收堆外内存,以及纠正了一个很多人对于 MappedByteBuffer 的错误认知。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2019-03-15,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Kirito的技术分享 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
使用堆内内存HeapByteBuffer的注意事项
国庆假期一眨眼就过去了,本来在家躺平的很舒服,没怎么肝云原生编程挑战赛,传送门:https://tianchi.aliyun.com/s/8bf1fe4ae2aea736e692c31c6952042d ,偏偏对手们假期开始卷起来了,眼看就要被人反超了,吓得我赶紧继续优化了。比赛大概还有一个月才结束,Kirito 的详细方案也会在比赛结束后分享,这期间我会分享一些比赛中的一些通用优化或者细节知识点,例如本文就是这么一个例子。
kirito-moe
2021/10/18
1.5K0
文件操作之 FileChannel 与 mmap
Java 中原生读写方式大概可以被分为三种:普通 IO,FileChannel(文件通道),mmap(内存映射)。
leobhao
2023/03/11
1.5K0
文件操作之 FileChannel 与 mmap
常识四堆外内存
堆外内存除了在像netty开源框架中,在平常项目中使用的比较少,在现前的项目中,QPS要求高的系统中,堆外内存作为其中一级缓存是相当有成效的。所以来学习一下,文中主要涉及到这三分部内容
码农戏码
2021/03/23
2.8K0
深入浅出 Java FileChannel 的堆外内存使用丨社区分享
在一个风和日丽的下午(标准开头),突然收到用户紧急反馈,线上系统 IoTDB 查询卡住。经过众人一番排查,发现 IoTDB 在读取数据文件时使用到了 FileChannel,而 FileChannel 使用的堆外内存引发了系统 OOM。定位到问题之后,也成功帮助用户解决了问题。由这个线上问题,引出了本文的主题:FileChannel 中堆外内存的使用。
Apache IoTDB
2022/03/31
1.4K0
深入浅出 Java FileChannel 的堆外内存使用丨社区分享
jvm 堆外堆内浅析
HeapByteBuffer与DirectByteBuffer,在原理上,前者可以看出分配的buffer是在heap区域的,其实真正flush到远程的时候会先拷贝得到直接内存,再做下一步操作 (考虑细节还会到OS级别的内核区直接内存),其实发送静态文件最快速的方法是通过OS级别的send_file,只会经过OS一个内核拷贝,而不会来回拷贝;在NIO的框架下,很多框架会采用 DirectByteBuffer来操作,这样分配的内存不再是在java heap上,而是在C heap上,经过性能测试,可以得到非常快速的网络交互,在大量的网络交互下,一般速度会比HeapByteBuffer 要快速好几倍。
山行AI
2019/09/25
1.5K0
jvm 堆外堆内浅析
NIO之Buffer缓冲区
Buffer缓冲区,所谓的缓冲区其实就是在内存中开辟的一段连续空间,用来临时存放数据。
云飞扬
2022/04/25
3240
堆外内存 之 DirectByteBuffer 详解
堆外内存 堆外内存是相对于堆内内存的一个概念。堆内内存是由JVM所管控的Java进程内存,我们平时在Java中创建的对象都处于堆内内存中,并且它们遵循JVM的内存管理机制,JVM会采用垃圾回收机制统一管理它们的内存。那么堆外内存就是存在于JVM管控之外的一块内存区域,因此它是不受JVM的管控。 在讲解DirectByteBuffer之前,需要先简单了解两个知识点 java引用类型,因为DirectByteBuffer是通过虚引用(Phantom Reference)来实现堆外内存的释放的。 Phant
tomas家的小拨浪鼓
2018/06/27
2.6K0
NIO效率高的原理之零拷贝与直接内存映射
在笔者上一篇博客,详解了NIO,并总结NIO相比BIO的效率要高的三个原因,点击查看。
全菜工程师小辉
2019/08/16
5K0
内核中PageCache和java文件系统IO/NIO以及内存中缓冲区的作用
执行 ./test.sh 0,观察out.txt文件大小变化(程序不停的向out.txt文件写数据):
行百里er
2020/12/02
1.1K0
内核中PageCache和java文件系统IO/NIO以及内存中缓冲区的作用
【JVM调优实战100例】05——方法区调优实战(下)
直接内存由操作系统来管理。常见于NIO,用于数据缓冲,读写性能很高,分配回收花销较高。
半旧518
2022/10/26
4790
【JVM调优实战100例】05——方法区调优实战(下)
(代码篇)从基础文件IO说起虚拟内存,内存文件映射,零拷贝
JAVA虚拟机内部便会调用OS底层的 read()系统调用完成操作,在调用 in.read()的时候就是从内核缓冲区直接返回数据了。
intsmaze-刘洋
2018/08/29
4930
(代码篇)从基础文件IO说起虚拟内存,内存文件映射,零拷贝
JAVA面试50讲之10:直接(堆外)内存原理及使用
HeapByteBuffer是堆内ByteBuffer,使用byte[]存储数据,是对数组的封装,比较简单。DirectByteBuffer是堆外ByteBuffer,直接使用堆外内存空间存储数据,是NIO高性能的核心设计之一。本文来分析一下DirectByteBuffer的实现。
用户1205080
2019/01/23
3K1
框架篇:ByteBuffer和netty.ByteBuf详解
数据序列化存储,或者数据通过网络传输时,会遇到不可避免将数据转成字节数组的场景。字节数组的读写不会太难,但又有点繁琐,为了避免重复造轮子,jdk推出了ByteBuffer来帮助我们操作字节数组;而netty是一款当前流行的java网络IO框架,它内部定义了一个ByteBuf来管理字节数组,和ByteBuffer大同小异
潜行前行
2021/06/25
8400
框架篇:ByteBuffer和netty.ByteBuf详解
Java NIO实现原理之Buffer
nio是基于事件驱动模型的非阻塞io,这篇文章简要介绍了nio,本篇主要介绍Buffer的实现原理。
Monica2333
2020/06/19
5440
详述 Java NIO 以及 Socket 处理粘包和断包方法
NIO 是 New I/O 的简称,是 JDK 1.4 新增的功能,之所以称其为 New I/O,原因在于它相对于之前的 I/O 类库是新增的。由于之前老的 I/O 类库是阻塞 I/O,New I/O 类库的目标就是要让 Java 支持非阻塞 I/O,所以也有很多人喜欢称其为 Non-block I/O,即非阻塞 I/O。
CG国斌
2020/07/08
2.1K0
从0到1起步-跟我进入堆外内存的奇妙世界
堆外内存一直是Java业务开发人员难以企及的隐藏领域,究竟他是干什么的,以及如何更好的使用呢?那就请跟着我进入这个世界吧。
小程故事多
2018/08/22
4560
从0到1起步-跟我进入堆外内存的奇妙世界
Java 堆外内存回收原理
DirectByteBuffer 这个类是 JDK 提供使用堆外内存的一种途径,当然常见的业务开发一般不会接触到,即使涉及到也可能是框架(如 Netty、RPC 等)使用的,对框架使用者来说也是透明的。
涤生
2019/04/24
1.2K0
Java 堆外内存回收原理
JVM内存与垃圾回收篇第11章直接内存
第 11 章 直接内存 1、直接内存概述 直接内存 不是虚拟机运行时数据区的一部分,也不是《Java虚拟机规范》中定义的内存区域。 直接内存是在Java堆外的、直接向系统申请的内存区间。 来源于NIO,通过存在堆中的DirectByteBuffer操作Native内存 通常,访问直接内存的速度会优于Java堆。即读写性能高。 因此出于性能考虑,读写频繁的场合可能会考虑使用直接内存。 Java的NIO库允许Java程序使用直接内存,用于数据缓冲区 代码示例 代码 /** * IO
yuanshuai
2022/08/17
5060
JVM内存与垃圾回收篇第11章直接内存
作为 Java 开发者,你需要了解的堆外内存知识
本文来自作者 应书澜 在 GitChat 上分享 「深入解读 Java 堆外内存(直接内存)」
CSDN技术头条
2018/07/30
1.2K0
作为 Java 开发者,你需要了解的堆外内存知识
文件IO操作的最佳实践
已经过去的中间件性能挑战赛,和正在进行中的 第一届 PolarDB 数据性能大赛 都涉及到了文件操作,合理地设计架构以及正确地压榨机器的读写性能成了比赛中获取较好成绩的关键。正在参赛的我收到了几位公众号读者朋友的反馈,他们大多表达出了这样的烦恼:“对比赛很感兴趣,但不知道怎么入门”,“能跑出成绩,但相比前排的选手,成绩相差10倍有余”…为了能让更多的读者参与到之后相类似的比赛中来,我简单整理一些文件IO操作的最佳实践,而不涉及整体系统的架构设计,希望通过这篇文章的介绍,让你能够欢快地参与到之后类似的性能挑战赛之中来。
kirito-moe
2018/12/18
1.5K0
相关推荐
使用堆内内存HeapByteBuffer的注意事项
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验