在 java 编译器中标记行的问题

问题描述

我是硕士生,正在研究静态分析。 在我的一次测试中,我遇到了在 java 编译器中标记行的问题。

我有以下 java 代码

 226:   String json = "/org/elasticsearch/index/analysis/commongrams/commongrams_query_mode.json";
 227:   Settings settings = Settings.settingsBuilder()
 228:           .loadFromStream(json,getClass().getResourceAsstream(json))
 229:           .put("path.home",createHome())
 230:           .build();

在编译这段代码并执行命令 javap -p -v CLASSNAME 时,我得到一个表格,其中包含字节码中每条指令的源代码对应行。

见下图:

Bytecode table

问题是在调用.put (" path.home ",createHome ())方法时,字节码基本上会生成4条指令:

19: anewarray  
24: ldc - String path.home
30: invokespecial - createHome
34: invokevirtual - put

前两个标记为第 228 行(错误),后两个标记为第 229 行(正确)。

见下图:

Bytecode table

这是 .put("path.home",createHome()) 方法的原始实现:

     public Builder put(Object... settings) {
        if (settings.length == 1) {
            // support cases where the actual type gets lost down the road...
            if (settings[0] instanceof Map) {
                //noinspection unchecked
                return put((Map) settings[0]);
            } else if (settings[0] instanceof Settings) {
                return put((Settings) settings[0]);
            }
        }
        if ((settings.length % 2) != 0) {
            throw new IllegalArgumentException("array settings of key + value order doesn't hold correct number of arguments (" + settings.length + ")");
        }
        for (int i = 0; i < settings.length; i++) {
            put(settings[i++].toString(),settings[i].toString());
        }
        return this;
    }

我已经尝试使用 Oracle-JDK v8 和 Open-JDK v16 编译代码,并且都得到了结果。

我还通过删除其参数来更改 put() 方法进行了测试。编译这段代码时,没有出现标记行的问题。

我想知道为什么字节码指令将行 229: .put (" path.home ",createHome ()) 映射到 java 源代码中的原始行以外的行上?有谁知道这是故意的吗?

解决方法

这个是连接方式,行号关联存储在class文件和javac编译器的历史中。

line number table 仅包含将行号与标记其开头的代码位置相关联的条目。因此,假定该位置之后的所有指令都属于到表中明确提及的下一个位置的同一行。

由于详细信息会占用空间,并且规范不要求行号表具有特定的精度,因此编译器供应商对包含哪些详细信息做出了不同的决定。

过去,即直到 Java 7,javac 只为 语句 的开头生成行号表条目,所以当我用 Java 7 的 {{1 }}

javac

我得到类似的东西

String settings = new StringBuilder() // this is line 7 in my .java file
    .append('a')
    .append(
      5
      +
      "".length())
    .toString();

这将导致属于该语句的所有指令仅与第 7 行相关联。

这被认为太少了,因此从 Java 8 开始,stack=3,locals=2,args_size=1 0: new #2 // class java/lang/StringBuilder 3: dup 4: invokespecial #3 // Method java/lang/StringBuilder."<init>":()V 7: bipush 97 9: invokevirtual #4 // Method java/lang/StringBuilder.append:(C)Ljava/lang/StringBuilder; 12: iconst_5 13: ldc #5 // String 15: invokevirtual #6 // Method java/lang/String.length:()I 18: iadd 19: invokevirtual #7 // Method java/lang/StringBuilder.append:(I)Ljava/lang/StringBuilder; 22: invokevirtual #8 // Method java/lang/StringBuilder.toString:()Ljava/lang/String; 25: astore_1 26: return LineNumberTable: line 7: 0 line 14: 26 会在跨越多行的表达式中为方法调用生成额外的条目。因此,当我使用 Java 8 或更高版本编译相同的代码时,我得到

javac

注意每个附加条目(与 Java 7 版本相比)如何指向一个调用指令,以确保方法调用与正确的行号相关联。这极大地改进了异常堆栈跟踪以及步骤调试。

没有显式条目的非调用指令仍将与其最近的具有条目的前面代码位置相关联。

因此,对应于 stack=3,args_size=1 0: new #2 // class java/lang/StringBuilder 3: dup 4: invokespecial #3 // Method java/lang/StringBuilder."<init>":()V 7: bipush 97 9: invokevirtual #4 // Method java/lang/StringBuilder.append:(C)Ljava/lang/StringBuilder; 12: iconst_5 13: ldc #5 // String 15: invokevirtual #6 // Method java/lang/String.length:()I 18: iadd 19: invokevirtual #7 // Method java/lang/StringBuilder.append:(I)Ljava/lang/StringBuilder; 22: invokevirtual #8 // Method java/lang/StringBuilder.toString:()Ljava/lang/String; 25: astore_1 26: return LineNumberTable: line 7: 0 line 8: 9 line 12: 15 line 9: 19 line 13: 22 line 14: 26 常量的 bipush 97 指令与第 7 行相关联,因为只有后续使用该常量的 'a' 调用具有将其与第 8 行相关联的显式条目。

下一个表达式 append 的后果更加戏剧化。

推送常量 5 + "".length()iconst_5 的指令与第 8 行相关联,即前一个 ldc [""] 调用的位置,而 append 指令,实际上属于 iadd+ 常量之间的 5 运算符,与第 12 行相关联,因为获得显式行号的最新调用指令是 ""调用。

为了比较,Eclipse 是这样编译相同代码的:

length()

Eclipse 编译器没有 stack=3,args_size=1 0: new #20 // class java/lang/StringBuilder 3: dup 4: invokespecial #22 // Method java/lang/StringBuilder."<init>":()V 7: bipush 97 9: invokevirtual #23 // Method java/lang/StringBuilder.append:(C)Ljava/lang/StringBuilder; 12: iconst_5 13: ldc #27 // String 15: invokevirtual #29 // Method java/lang/String.length:()I 18: iadd 19: invokevirtual #35 // Method java/lang/StringBuilder.append:(I)Ljava/lang/StringBuilder; 22: invokevirtual #38 // Method java/lang/StringBuilder.toString:()Ljava/lang/String; 25: astore_1 26: return LineNumberTable: line 6: 0 line 7: 7 line 9: 12 line 11: 13 line 9: 18 line 8: 19 line 12: 22 line 6: 25 line 13: 26 的历史,而是首先被设计为为表达式生成行号条目。我们可以看到它将属于调用表达式(不是调用指令)的第一条指令与右侧的行相关联,即javac和{{1}的bipush 97 } 对于append('a')

此外,它还有 ldc [""]"".length()iconst_5 的附加条目,以将它们与正确的行相关联。当然,这种更高的精度也会导致类文件稍大。