ChromiumonAndroid:Chromium线程局部存储系统

线程局部存储(Thread Local Storage), 简称TLS,提供了一种存储线程私有数据的方式,每个线程的私有数据对其他线程均不可见。Chromium是一个多进程多线程架构的浏览器,运行时会创建多达30几个线程,其中很多线程需要拥有自己私有数据,在TLS数量有限的系统上,例如Android 4.3或更早的系统,可能会因为无法分配足够的TLS而导致Chromium崩溃。本文将介绍最近在Chromium提交代码中是如何解决这个问题的。

成都创新互联公司从2013年创立,先为白塔等服务建站,白塔等地企业,进行企业商务咨询服务。为白塔企业网站制作PC+手机+微官网三网同步一站式服务解决您的所有建站问题。

TLS在Chromium中的使用

Chromium代码中,有些类提供了一个current()方法用来返回调用线程的私有数据,最典型的两个例子是MessageLoop和RenderThread。以MessageLoop为例,因为每个线程可能运行着一个主消息循环,如何能够获取与线程相关的主消息循环呢?为此,MessageLoop提供了current()方法,当线程在创建MessageLoop实例时,会将这个实例设置为线程的私有数据,当调用current()方法时,再将这个私有数据返回给调用者。

每个TLS槽都由一个唯一的键值(key)标识,这个键值由进程负责向OS申请分配,如果当前进程申请的键值数量超过系统规定的上限,申请将失败,即无法获取一个新的TLS槽。线程可以将TLS槽绑定到一个私有数据上,这个私有数据实际上是一个指针,指向一块由调用线程动态分配的内存块。

Chromium代码中,对TLS的使用都抽象在ThreadLocalPointer模板类中(参见base/threading/thread_local.h文件):

template 
class ThreadLocalPointer {
 public:
  ThreadLocalPointer() : slot_() {
    internal::ThreadLocalPlatform::AllocateSlot(slot_);
  }

  ~ThreadLocalPointer() {
    internal::ThreadLocalPlatform::FreeSlot(slot_);
  }

  Type* Get() {
    return static_cast(
        internal::ThreadLocalPlatform::GetValueFromSlot(slot_));
  }

  void Set(Type* ptr) {
    internal::ThreadLocalPlatform::SetValueInSlot(
        slot_, const_cast(static_cast(ptr)));
  }

 private:
  typedef internal::ThreadLocalPlatform::SlotType SlotType;

  SlotType slot_;

  DISALLOW_COPY_AND_ASSIGN(ThreadLocalPointer);
};

其中SlotType是对TLS槽(键值)类型的抽象,internal::ThreadLocalPlatform是对特定平台的TLS实现的抽象。例如,在POSIX系统上,ThreadLocalPlatform::AllocateSlot的实现为:

void ThreadLocalPlatform::AllocateSlot(SlotType& slot) {
  int error = pthread_key_create(&slot, NULL);
  CHECK_EQ(error, 0);
}

一般地,会结合LazyInstance使用ThreadLocalPointer,例如:

staticbase::LazyInstance >lazy_tls =
   LAZY_INSTANCE_INITIALIZER;
 
RenderThread* RenderThread::current() {
 return lazy_tls.Pointer()->Get();
}
 
RenderThread::RenderThread() {
 lazy_tls.Pointer()->Set(this);
}
 
RenderThread::~RenderThread() {
 lazy_tls.Pointer()->Set(NULL);
}

当创建RenderThread实例时,当前线程会通过访问lazy_tls设置线程的私有数据,此后每次调用current()方法时,都会返回线程私有的RenderThread实例。

由于LazyInstance是延迟初始化的,上述代码中,当首次访问Pointer()时,会创建一个新的ThreadLocalPointer实例,也就是向OS申请分配一个新的TLS槽。

潜在的问题

在三大桌面操作系统上(Windows/Linux/Mac),上述对ThreadLocalPointer的封装和实现都能工作的很好,但自从Chromium支持Android之后,潜伏在上述实现中的问题就浮出水面了。

如果一个线程中需要存储多个私有数据,比如除了RenderThread实例,还有MessageLoop实例等等,每个都要系统分配给进程的TLS键值,那么一旦键值的数据达到上限,申请失败导致程序崩溃。这个问题已经在Chromium WebView中暴露了,原因是Android 4.3或更老的系统,最大可用的TLS槽数量只有64个,除去Android系统库(opengl,jvm)需要占用一部分之外,留给Chromium使用的数量已经不多了,一旦发现分配不成功,Chromium会触发CHECK,程序立即异常退出。Android 4.4系统上,最大可用的TLS槽数量多达128个,这个问题得到一定的缓解,但仍没有从根本上杜绝这个问题。

解决方法

Chromium提供了一种新的方式解决上述问题,主要思路是Chromium自己管理TLS。

以POSIX系统为例,通过pthread_key_create创建的key对进程内所有的线程都可见,但每个线程可以绑定不同的私有数据到一个相同的key上,这就意味着整个Chromium可以共享同一个TLS槽,创建一个应用层的TLS表来彻底解决系统级别TLS槽的数量限制。

具体来说,Chromium TLS系统会首先向OS申请一个key,每个线程都将为这个key绑定一张线程私有的TLS表,Chromium设置了这张表可以容纳64个表项。当线程需要一个新的TLS槽时,首先会检查这个线程是否为key已经绑定了TLS表,如果没有,则需要创建这样一个TLS表并将其设置为线程私有,然后从表中按顺序取一个可用项,并设置新的私有数据。不难看出,新的TLS槽并不是向OS申请的,而是向Chromium TLS申请的。

ThreadLocalStorage模板类是新的ChromiumTLS系统中对TLS的抽象,StaticSlot和Slot封装了初始化Chromium TLS系统,创建TLS表以及设置和获取线程私有数据的操作。因此,上述ThreadLocalPointer模板类将从直接使用ThreadLocalPlatform操作TLS,应改为使用ThreadLocalStorage::Slot, 如下:

template 
class ThreadLocalPointer {
 public:
  ThreadLocalPointer() {}
  ~ThreadLocalPointer() { slot_.Free(); }
  Type* Get() {
    return static_cast(slot_.Get());
  }
  void Set(Type* ptr) {
    slot_.Set(const_cast(static_cast(ptr)));
  }
 private:
  ThreadLocalStorage::Slot slot_;

  DISALLOW_COPY_AND_ASSIGN(ThreadLocalPointer);
};

再次强调,ThreadLocalStorage::Slot只是向Chromium TLS系统申请可用的TLS槽,而不是向系统直接申请。

更多信息

  • Chromium项目的bug列表里已经报告了这个问题,参见这里。

  • Chromium TLS实现是最近才提交到Chromium代码库中的,参见这里。

  • Android源代码中对TLS槽数量的定义在BIONIC_TLS_SLOTS宏常量中,见Android 4.3和Android 4.4。

  • 关于Chromium TLS系统实现细节,感兴趣的读者可读读base/threading/thread_local_storage.h/cc等源文件。

  • 关于pthread_key_create,参见Linux Man Page。



网站标题:ChromiumonAndroid:Chromium线程局部存储系统
浏览路径:http://scyanting.com/article/poedhp.html