Android 11-用于本机C ++库的System.loadLibrary耗时60秒以上,在Android 10及更低版本上可完美快速地运行

问题描述

在基于游戏引擎cocos2d-x的Android游戏应用程序中,大多数代码都是用C ++编写的,自Android 11起,我们遇到了一个非常奇怪和关键的问题:

当本机库加载到onLoadNativeLibraries中时,现在突然需要60秒钟以上的时间。在Android 11之前,一切正常,并且在0.2-3秒内加载完毕。现在,当您开始游戏时,您将拥有60秒钟以上的灰屏。

我们已经发现JNI_OnLoad在60秒的停顿结束后立即被调用

这是onLoadNativeLibraries代码 功能

protected void onLoadNativeLibraries()
{
    try
    {
        ApplicationInfo ai = getPackageManager().getApplicationInfo(getPackageName(),PackageManager.GET_Meta_DATA);
        Bundle bundle = ai.MetaData;
        String libName = bundle.getString("android.app.lib_name");
        System.loadLibrary(libName); // line of 60 seconds stall
    }
    catch (Exception e)
    {
        e.printstacktrace();
    }
}

我们已经尝试了时间分析,但没有成功。它只是如何在该功能上花费大量时间。通过调试暂停也不会导致任何其他线索。本机调试器不会在代码的C ++端显示任何内容

有人知道为什么会发生这种情况,或者我们可以设法解决吗?任何帮助将不胜感激:)

解决方法

简短答案:

这是由Google修复但尚未部署的Android 11中的错误。

同时,如果您不关心在程序退出/库卸载时在lib中调用 static thread_local 变量析构函数,请传递标志{{1 }}编译器。 (有关使用clang注释的更精细解决方案,请参见长答案)

我在项目(不是cocos2d)上使用了此标志,没有问题,并且lib的加载速度比以前更快。

详细答案:

不幸的是,这是Google团队在android 11(R)中引入的性能下降。谷歌here正在跟踪该问题。

总而言之,当调用-fno-c++-static-destructors时,系统会使用__cxa_atexit()

为加载的库中包含的每个C ++全局变量注册一个析构函数。

自Android 11(R)起,此功能在android中的实现为changed

  • 在Q中,__cxa_atexit使用块的链接列表,并调用mprotect 在要修改的单个块上两次。
  • 在R中,__ cxa_atexit调用 mprotect在单个连续的处理程序数组上两次。每个数组 条目是2个指针。

当它们是许多C ++全局变量时,这种变化使性能急剧下降,在cocos2d so 库中似乎就是这种情况。

Google已经实施了修复程序https://android-review.googlesource.com/c/platform/bionic/+/1464716,但 如问题中所述:

最早要等到三月的QPR才能在Android 11中使用,并且 由于这不是安全问题,因此OEM不必强制要求 实际拿那个补丁。

Google团队还通过删除或跳过全局变量的析构函数在应用程序级别上建议一些workarounds

  • 对于特定的全局变量,[[clang :: no_destroy]]属性将跳过析构函数调用。
  • 将-fno-c ++-static-destructors传递给编译器以跳过所有静态变量的析构函数。此标志还跳过析构函数 用于thread_local变量。如果有thread_local变量 重要的析构函数,可以用 [[clang :: always_destroy]]覆盖编译器标志。
  • 将-Wexit-time-destructors传递给编译器,以使其对退出时间析构函数的每个实例发出警告,以突出显示 __cxa_atexit注册来自。