前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >ThreadLocal详解

ThreadLocal详解

作者头像
naget
发布2019-07-03 15:52:51
4200
发布2019-07-03 15:52:51
举报
文章被收录于专栏:Vegout

保证线程安全一是可以同步对共享资源的操作和访问,二是不共享。就像ThreadLocal这样,给每个线程分一个对象,每个线程也只能访问到自己的这个对象,从而保证线程安全。比如SimpleDateFormat这个类,咋也没想到它是线程不安全的,既然线程不安全我们就给每一个线程都实例化一个SimpleDateFormat,自己用自己的就安全了,ThreadLocal就给我们实现了分配线程私有对象这么个功能。

使用

代码语言:javascript
复制
public class ThreadlocalDemo {
    static  ThreadLocal<SimpleDateFormat> local = new ThreadLocal<>();
    public static void main(String[] args) throws Exception {
        local.set(new SimpleDateFormat());
        SimpleDateFormat sdf = local.get();
        Thread thread = new Thread(){
            @Override
            public void run() {
                local.set(new SimpleDateFormat());
                SimpleDateFormat sdf = local.get();
            }
        };
        thread.start();
        thread.join();
    }
}

我们声明了一个全局的ThreadLocal类型变量local,然后在主线程和thread线程中通过local.set设置自己的SimpleDateFormat,然后通过local.get来得到自己的SimpleDateFormat。两个线程各用各的,不争不抢。也许你觉得local.set每个线程都需要做一个遍,有点繁琐,那么可以重写ThreadLocal的initialValue方法,如下

代码语言:javascript
复制
     static ThreadLocal<SimpleDateFormat> local = new ThreadLocal<SimpleDateFormat>(){
        @Override
        protected SimpleDateFormat initialValue() {
            System.out.println("Thread:"+Thread.currentThread().getName());
            return new SimpleDateFormat("yyyy-MM-dd");
        }
    };

那么每个线程通过local.get就可以直接得到属于自己线程的专属SimpleDateFormat对象。

get方法源码解析

以上过程总会给人一个错觉,仿佛是threadlocal维护了线程和线程特有对象之间的关系,每当我们调用local.get的时候,threadlocal就检测当前线程,并取出当前线程对应的对象。其实不是这样的,线程特有对象是存在线程对象中而不是threadlocal中,Thread中有这么个字段threadlocals

代码语言:javascript
复制
ThreadLocal.ThreadLocalMap threadLocals = null;

这个map中就保存了此线程的特有对象。了解了这一点我们来看一下local.get的过程

代码语言:javascript
复制
    public T get() {
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);//得到线程t中的threadlocals
        if (map != null) {
            ThreadLocalMap.Entry e = map.getEntry(this);
            if (e != null) {
                @SuppressWarnings("unchecked")
                T result = (T)e.value;
                return result;
            }
        }
        return setInitialValue();
    }

第三行代码取出了当前线程的threadloacls,这是一个map,也就是说一个线程可以有许多线程特有变量,这些特有变量都被存到了map中,当我们去取特有变量的时候,需要告诉线程要取哪个特有变量,如何分辨这些特有变量呢?第五行代码map.getEntry(this),这个map中,特有对象做为值被存入,键是谁呢?键就是对应的threadlocal对象。于是,我们传入this,也就是此刻调用get的threadlocal对象,就可以取出这个threadlocal所对应的特有对象,就如上面第一段代码中local引用的threadlocal对象是键,对应的值就是SimpleDateFormat对象。 如果此线程还没有线程特有对象,或者线程特有对象中没有我们查找的这个ThreadLocal对象,那么我们就需要执行初始化方法,就是是代码的最后一句

代码语言:javascript
复制
setInitialValue()

我们进入这个方法

代码语言:javascript
复制
private T setInitialValue() {
        T value = initialValue();
        Thread t = Thread.currentThread();
        ThreadLocalMap map = getMap(t);
        if (map != null)
            map.set(this, value);
        else
            createMap(t, value);
        return value;
    }

哎?第一句调用的这个方法InitialValue有没有很熟悉,这就是我们文章开始重写的那个方法(如果不重写,这个方法直接返回null)。还记得当时我们直接返回了一个SimpleDateFormat对象,也就是这里的value,并且把它加入到当前线程的threadlocals引用的map当中,最后返回这个value,get方法圆满结束。

浅析内存泄漏

线程中维护的那个threadlocals就是ThreadLocalMap类型的,这个map内部维护了一个Entry数组,每个Entry就是一个键值对,键就是一个ThreadLocal对象,值就是一个线程特有对象(如文章开头例子中的SimpleDateFormat对象)。当我们调用ThreadLocal的set方法时,最终调用的是ThreadLocalMap的set方法。

ThreadLocalMap的set方法
代码语言:javascript
复制
private void set(ThreadLocal<?> key, Object value) {

            // We don't use a fast path as with get() because it is at
            // least as common to use set() to create new entries as
            // it is to replace existing ones, in which case, a fast
            // path would fail more often than not.

            Entry[] tab = table;
            int len = tab.length;
            int i = key.threadLocalHashCode & (len-1);

            for (Entry e = tab[i];//位置i上已经有元素
                 e != null;
                 e = tab[i = nextIndex(i, len)]) {
                ThreadLocal<?> k = e.get();

                if (k == key) {//元素相等,则覆盖原值
                    e.value = value;
                    return;
                }

                if (k == null) {//位置i的元素已陈旧,替换
                    replaceStaleEntry(key, value, i);
                    return;
                }
            }

            tab[i] = new Entry(key, value);
            int sz = ++size;
            if (!cleanSomeSlots(i, sz) && sz >= threshold)//清理陈旧元素,如果没有元素被清理,考虑是否扩容
                rehash();
        }

set方法很简单,就是在对应的位置i放入元素。如果位置i没有元素的话,直接新建entry,并且检查是否需要扩容。如果位置i已经有元素,则判断这个entry的key与要插入的是否相等,相等则覆盖;如果为Null,则进行替换。也许你会觉得这两种情况结果不是一样嘛,一个覆盖,一个替换,都是更新了这个Entry嘛,其实不然,替换的话,会调用replaceStaleEntry,在这个方法中还会进行陈旧entry的清理。前面的代码注释中也看到了这个词“陈旧”,什么样的entry是陈旧呢?首先这个entry不为null,但他的key为null,那么这个entry就是陈旧的。一个Entrty为什么会陈旧呢?也就是说它的值不为Null,键为什么会为Null呢?这就是一个比较巧妙的设计了,用到了java中的弱引用。entry的key是一个指向Threadlocal对象的弱引用,也就是说当没有其他强引用指向这个ThreadLocal对象时,这个entry的key就可能被GC回收,从而key指向了null。当我们调用get和set方法时都可能触发一个检查机制,来处理这些陈旧的entry,从而避免内存泄漏。但这些机制的触发都不是一定的,还是有内存泄漏的可能,为了避免内存泄漏,我们在使用Threadlocal时一定要记得自己手动调用remove,进行陈旧entry的处理。总之,threadlocal为了解决内存泄漏使用了弱引用,但任然存在内存泄漏的可能,所以用完最好还是remove一下。

ThreadLocal的Hash碰撞解决方案

每个线程中的ThreadLocalMap也是一个map,装入键值对的时候通过threadlocal的hash值来决定对应的位置。在上边的set代码中可以看到

代码语言:javascript
复制
int i = key.threadLocalHashCode & (len-1);

i就是对应的位置,并且之后是一个for循环,如果这个位置有元素就会选择i+1(如果i+1数组越界,就置为0,这也是nextIndex()方法中实现的逻辑)位置进行检测。也就是说这里使用了线性探测的方式来解决hash冲突,为什么使用线性探测呢?毕竟总有人觉得跟链表法比起来,尤其是跟使用了红黑树进行优化的Hashmap中的链表法比起来,线性探测很可能出现连续多次的冲突。其实,Threadlocal通过在hash值上做了个“小手脚”,使得求得的Hash值不会出现太多冲突,大致分布很均匀。这个小手脚是什么呢?我们看一下这里hash值的求法,threadlocal.threadLocalHashCode就得到了这个hash值,threadLocalHashCode做了什么呢?

代码语言:javascript
复制
 private final int threadLocalHashCode = nextHashCode();
 private static int nextHashCode() {
        return nextHashCode.getAndAdd(HASH_INCREMENT);
    }

threadLocalHashCode就是nextHashCode()的返回值,nextHashCode()就是将nextHashCode这个值加HASH_INCREMENT。nextHashCode指向一个AtomicInteger对象

代码语言:javascript
复制
private static AtomicInteger nextHashCode =
        new AtomicInteger();

HASH_INCREMENT是一个常量

代码语言:javascript
复制
private static final int HASH_INCREMENT = 0x61c88647;

总之呢,第一个hash值求出来就是0,然后第二个是0+HASH_INCREMENT,第三个0+HASH_INCREMENT+HASH_INCREMENT… 这个数很有魔力,这个数可以使得每次求得的hash值放入entry数组中分布均匀。有多均匀,请看实验结果

实验代码如下

代码语言:javascript
复制
public class Hash_increment {
    private static int hash = 0;
    private static final int HASH_INCREMENT = 0x61c88647;
    public static void main(String[] args) {
        int len = 16;
        int time = len/4*3;
        while (len<200){
            System.out.print("len等于"+len+"时:");
            for (int i=0;i<time;i++){
                System.out.print(String.valueOf(increment()&len-1)+" ");
            }
            System.out.println();
            len=len<<1;
            time = len/4*3;
        }

    }
    public static int increment(){
        return hash+=HASH_INCREMENT;
    }
}

至于这个数为啥这么厉害,更多的和数学相关,叫做斐波那契散列。数学渣渣就不在这多说了,再见。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2018-10-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 Vegout 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 使用
  • get方法源码解析
  • 浅析内存泄漏
    • ThreadLocalMap的set方法
    • ThreadLocal的Hash碰撞解决方案
    领券
    问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档