编译为字节码,Java与Python造成时间差异的原因是什么?

问题描述

Java和python(仅涉及CPython)都分别解释为Java和CPython字节码。然后,两个字节码由它们各自的虚拟机(JVM和Cpython VM)解释。 (这里我忽略了在运行10K后启动的JIT编译部分。)

我对此有2个问题:

  1. 为什么将Java编译为Java字节码要比python花费那么多时间?在Java中,编译是显式步骤,而在python中,编译是在运行时进行。
  2. 为什么在第一次运行和第n次运行python之间没有显着差异,但是在第一次运行中完成了对CPython字节码的编译并将其缓存在.pyc文件中,该文件在所有后续运行中都使用。这个字节码编译真的是Python中几乎零成本的工作吗?

尽管它在运行时中起着重要的作用,但我想静态和动态类型在编译过程中不应起太大作用,也不应该是造成这种时间差异的唯一原因。另外,我认为在这两种实现中,字节码生成过程中都会进行一些优化。

我这里缺少什么吗? (我没有使用Java的丰富经验。)

更新

我实际上在第一次运行和以后运行时对python进行了时间分析,发现语句2是错误的。运行大型python文件时,有一个非常明显的区别。

方法很简单。用重复的行创建一个大文件

a = 5
b = 6
c = a*b
print(str(c))

然后将其导入文件large.py并运行time python large.py

首次运行结果:

python large.py  1.49s user 0.33s system 97% cpu 1.868 total

第二次运行结果:

python large.py  0.20s user 0.08s system 90% cpu 0.312 total

删除__pycache__文件夹后:

python large.py  1.57s user 0.34s system 97% cpu 1.959 total

所以基本上在python中,编译为字节码也是一个昂贵的过程,只是它不像在Java中那样昂贵。

解决方法

Java字节码编译器必须比Python字节码编译器执行更多检查。为了说明这一点,请从“ hello world”程序中提取以下内容:

System.out.println("Hello World!");

要编译这一行代码,编译器必须查找其所有部分的含义。这比听起来要复杂得多:System可能是一个包。或者它可以是一个类,可以在与代码位于同一包中,也可以在一个导入的包中,或者位于java.lang中。因此,编译器必须按该顺序检查所有这些选项。找到System类后,就必须检查其访问修饰符是否允许这种使用。

之后,编译器必须弄清楚out是什么:它是嵌套类还是类成员,其访问修饰符是什么?编译器发现它是PrintStream类型的静态成员变量。然后,它必须对println做相同的检查。直到知道所有这些,编译器才能发出任何代码,因为生成的字节码根据所涉及对象的类型而有所不同。

所有这些检查都需要时间,最重要的是因为即使对于最琐碎的程序,编译器也必须从标准库中加载大量的类定义。

相比之下,Python字节码编译器只需要解析该行,它就可以立即生成代码而无需查看额外的模块。在Python中,代码将编译为:

  • 从当前范围(LOAD_NAME)查找“系统”对象
  • 从系统(LOAD_ATTR)中查找“出”属性
  • 从“出”(LOAD_METHOD)中查找“ println”
  • 生成代码以调用它(CALL_METHOD)

Python编译器不在乎其中某些查找是否在运行时失败。

另一个重要的区别是Java编译器完全用Java编写,并在运行时编译为机器代码,而许多CPython实现是提前编译的C代码。与Python相比,这意味着Java有点“冷启动”问题。

更新:从Java 9开始,您可以直接从源代码运行Java程序,而无需将其编译为字节码。运行一个琐碎的“ hello world”程序,即使对于一个琐碎的程序,也可以通过提前将Java编译为字节代码来节省多少钱:

  • time python hello.py为单位,python程序的运行时间为45-50毫秒。
  • Java程序无需提前编译为字节码,运行时间为350-400毫秒(用time java Hello.java测量)
  • 编译为字节码后的Java程序运行时间为70-80毫秒(以time java Hello测量)

免责声明:未遵循任何科学方法或未进行统计分析,因此请谨慎对待。测试环境:Fedora 32上的Python版本3.8.5,Java版本11.0.8,Intel i7 8750H CPU

hello.py:

print("hello world")

Hello.java:

public class Hello {
    public static void main(String[] args) {
        System.out.println("Hello world");
    }
}

相关问答

依赖报错 idea导入项目后依赖报错,解决方案:https://blog....
错误1:代码生成器依赖和mybatis依赖冲突 启动项目时报错如下...
错误1:gradle项目控制台输出为乱码 # 解决方案:https://bl...
错误还原:在查询的过程中,传入的workType为0时,该条件不起...
报错如下,gcc版本太低 ^ server.c:5346:31: 错误:‘struct...