Java 的错误处理

Hi，我是阿昌，今天学习记录的是关于Java 的错误处理。

Java 错误处理的缺陷和滥用也成为了一个热度始终不减的老话题。

但是，Java 的异常处理，有着天生的优势，特别是它在错误排查方面的作用，我们很难找到合适的替代方案。

那有没有可能改进 Java 的异常处理，保持它在错误排查方面的优势的同时，提高它的性能呢？

一、阅读案例

要尝试解决一个问题，首先要做的，就是把问题梳理清楚，定义好。

先来看看 Java 异常处理的三个典型使用场景。

下面的这段代码里，有三个不同的异常使用方法。

public class UseCase {
    public static void main(String[] args) {
        String[] algorithms = {"SHA-128", "SHA-192"};
        
        String availableAlgorithm = null;
        for (String algorithm : algorithms) {
            Digest md;
            try {
                md = Digest.of(algorithm);
            } catch (NoSuchAlgorithmException ex) {
                // ignore, continue to use the next algorithm.
                continue;
            }
            
            try {
                md.digest("Hello, world!".getBytes());
            } catch (Exception ex) {
                System.getLogger("co.ivi.jus.stack.former")
                        .log(System.Logger.Level.WARNING,
                             algorithm + " does not work",
                             ex);
                continue;
            }
            
            availableAlgorithm = algorithm;
        }
        
        if (availableAlgorithm != null) {
            System.out.println(availableAlgorithm + " is available");
        } else {
            throw new RuntimeException("No available hash algorithm");
        }
    }
}

1、可恢复异常

catch住异常，当不打出信息

第一种就是可恢复的异常处理。这是什么意思呢？

对于代码里的异常 NoSuchAlgorithmException 来说，这段代码尝试捕获、识别这个异常，然后再从异常里恢复过来，继续执行代码。

把这种可以从异常里恢复过来，继续执行的异常处理叫做可恢复的异常处理，简称为可恢复异常。

为了深入理解可恢复异常，需要仔细地看看 NoSuchAlgorithmException 这个异常的处理过程。

这个处理的过程，其实就只有一行有效的代码，也就是 catch 语句。

} catch (NoSuchAlgorithmException nsae) {
    // ignore, continue to use the next algorithm.
}

只要 catch 语句能够捕获、识别到这个异常，这个异常的生命周期就结束了。

catch 只需要知道异常的名字，而不需要知道异常的调用堆栈。不使用异常的调用堆栈，也就意味着这样的异常处理，极大地消弱了 Java 异常在错误排查方面的作用。

既然可恢复异常不使用异常的调用堆栈，是不是可恢复异常就不需要生成调用堆栈了呢？这是我们提出的第一个问题。从 Java 异常的性能基准测试结果看，生成异常的调用堆栈是异常处理影响性能的最主要因素。

如果不需要生成调用堆栈，那么 Java 异常的处理性能就会有成百上千倍的提升。

所以，如果我们找到了第一个问题的答案，我们就解决了可恢复异常的性能瓶颈。

2、不可恢复异常

catch异常，并抛出堆栈信息
对于代码里的异常 RuntimeException 来说，上面的代码并没有尝试捕获、识别它。

这个异常直接导致了程序的退出，并且把异常的信息和调用堆栈打印了出来。

Exception in thread "main" java.lang.RuntimeException: No available hash algorithm
  at co.ivi.jus.stack.former.UseCase.main(UseCase.java:27)

这样的异常处理方式导致了程序的中断，程序不能从异常抛出的地方恢复过来。

这种方式，叫做不可恢复的异常处理，简称为不可恢复异常。

调用堆栈对于不可恢复异常来说至关重要，因为我们可以从异常调用堆栈的打印信息里，快速定位到出问题的代码。毫无疑问，这加快了问题排查，降低了运维的成本。

由于不可恢复异常中断了程序的运行，所以它的性能开销是一次性的。

因此，不可恢复异常对于性能的影响，其实我们不用太在意。使用了异常信息和调用堆栈，又不用担心性能的影响，不可恢复异常似乎很理想。

可是，在多大的程度上，我们可以允许程序由于异常中断而退出呢？

这是一个很难回答的问题。

试想一下，如果是作为服务器的程序，会希望它能一直运行，遇到异常能够恢复过来。

所以一般情况下，服务器的场景下，不会使用不可恢复异常。现在的客户端程序呢？

比如手机里的 app，如果遇到异常就崩溃，我们就不会有耐心继续使用了。

似乎，客户端的程序，也没有多少不可恢复异常的使用场景。

高质量的产品里，似乎很难允许不可恢复异常的存在。

既然我们无法忍受程序的崩溃，那么不可恢复异常还有存在的必要吗？这是我们提出的第二个问题。

3、记录的调试信息

对于代码里的异常 Exception 来说，这段代码尝试捕获、识别这个异常，然后从异常里恢复过来继续执行代码。

它是一个可恢复的异常。

和第一个场景不同的是，这段代码还在日志里记录了下了这个异常；

一般来说，这个异常的调试信息，也就是异常信息和调用堆栈，也会被详细地记载在日志里。

其实，这也是可恢复异常的一个典型的使用场景；

程序可以恢复，但是异常信息可以记录待查。我们再来仔细看看异常信息是怎么记录在案的。

为了方便我们观察，我把日志记录的这几行代码单独摘抄了出来。

System.getLogger("co.ivi.jus.stack.former")
        .log(System.Logger.Level.WARNING,
             algorithm + " does not work",
             ex);

我们可以看到，日志记录下来了如下的关键信息：

在异常捕获的场景下，这个异常的记录方式，包括是否记录（“co.ivi.jus.stack.former”）；
在异常捕获的场景下，这个异常的记录地点（System.getLogger()）；
在异常捕获的场景下，这个异常的严重程度（Logger.Level）；
在异常捕获的场景下，这个异常表示的影响（“[algorithm] does not work”）；
异常生成的时候携带的信息，包括异常信息和调用堆栈（ex）。

其中，前四项信息，是在方法调用的代码里生成的；

第五项，是在方法实现的代码里生成的。

也就是说，记录在案的调试信息，既包括调用代码的信息，也包括实现代码的信息。

如果放弃了 Java 的异常处理机制，我们还能够获得足够的调试信息吗？

换种说法，我们有没有快速定位问题的替代方案？这是我们提出的第三个问题。

二、改进的共用错误码

刚才，我们通过 Java 异常处理的三个典型场景，提出了三个棘手的问题：

既然可恢复异常不使用异常的调用堆栈，是不是可恢复异常就不需要生成调用堆栈了？
既然我们无法忍受程序的崩溃，那么不可恢复异常还有存在的必要吗？
我们有没有快速定位问题的替代方案？

带着这三个问题，我们再来看看能不能改进一下讨论的共用错误码的方案。

共用错误码本身，并没有携带调试信息。为了能够快速定位出问题，我们需要为共用错误码的方案补上调试信息。

下面的两段代码，就是要在补充调试信息方面做的尝试。

第一段代码，是我们在方法实现的代码里的尝试。

在这段代码里，我们使用异常的形式补充了调试信息，包括问题描述和调用堆栈。

public static Returned<Digest> of(String algorithm) {
    return switch (algorithm) {
        case "SHA-256" -> new Returned.ReturnValue(new SHA256());
        case "SHA-512" -> new Returned.ReturnValue(new SHA512());
        case null -> {
            System.getLogger("co.ivi.jus.stack.union")
                    .log(System.Logger.Level.WARNING,
                        "No algorithm is specified",
                        new Throwable("the calling stack"));
            yield new Returned.ErrorCode(-1);
        }
        default -> {
            System.getLogger("co.ivi.jus.stack.union")
                    .log(System.Logger.Level.INFO,
                    "Unknown algorithm is specified " + algorithm,
                            new Throwable("the calling stack"));
            yield new Returned.ErrorCode(-1);
        }
    };
}

第二段代码，是我们在方法调用的代码里的尝试。

在这段代码里，我们补充了调用场景的信息。

Returned<Digest> rt = Digest.of("SHA-128");
switch (rt) {
    case Returned.ReturnValue rv -> {
            Digest d = (Digest) rv.returnValue();
            d.digest("Hello, world!".getBytes());
        }
    case Returned.ErrorCode ec ->
        System.getLogger("co.ivi.jus.stack.union")
                .log(System.Logger.Level.INFO,
                        "Failed to get instance of SHA-128");
}

经过这样的调整，类似于使用异常处理的、快速定位出问题的调试信息就又回来了。

Nov 05, 2021 10:08:23 PM co.ivi.jus.stack.union.Digest of
INFO: Unknown algorithm is specified SHA-128
java.lang.Throwable: the calling stack
  at co.ivi.jus.stack.union.Digest.of(Digest.java:37)
  at co.ivi.jus.stack.union.UseCase.main(UseCase.java:10)

Nov 05, 2021 10:08:23 PM co.ivi.jus.stack.union.UseCase main
INFO: Failed to get instance of SHA-128

调试信息又回来了，难道不是以性能损失为代价的吗？

是的，使用调试信息带来的性能损失，并不比使用异常性能的损失小多少。

不过好在，日志记录既可以开启，又可以关闭。

如果我们关闭了日志，就不用再生成调试信息了，当然它的性能影响也就消失了。

当需要我们定位问题的时候，再启动日志。

这时候，我们就能够把性能的影响控制到一个极小的范围内了。

那么，使用错误码的错误处理方案，是怎么处理我们在阅读案例提到的问题的呢？

其实，每一个问题的处理，都很清晰

在这里插入图片描述

当然，日志并不是唯一可以记录调试信息的方式。

比如说，我们还可以使用更便捷的 JFR（Java Flight Recorder）特性。

其实，错误码的调试信息使用方式，更符合调试的目的：只有需要调试的时候，才会生成调试信息。

那么，如果继续沿用 Java 的异常处理机制，调试信息能不能按需开启、关闭呢？

这是我们今天的第四个问题，也是提给 Java 语言设计师的问题。

如果有一天， Java 语言的异常能够支持可以开合的异常处理机制了，想必到时候你就不会感到惊讶了。

三、总结

Java 异常处理的两个概念：

可恢复异常
不可恢复异常

还给出了在使用错误码的场景下，快速定位问题的替代方案。

了解可恢复异常和不可恢复异常这两个概念，以及它们的使用场景；
- 面试问题：你的代码是怎么处理 Java 异常的？
了解怎么在使用错误码的方案里，添加快速定位出问题的调试信息；
- 面试问题：你的代码，是怎么定位可能存在的问题的？

对 Java 错误处理机制的改进，这会是一个持续热门的话题。

而能够了解替代方案，并且使用替代方案的软件工程师，现在还不多。

如果你能够展示错误处理的替代方案，而且还不牺牲异常处理的优势，这是一个能够在面试里获得主动权，控制话语权的必杀技。

java java jvm 开发语言异常异常错误错误错误

Day717. Java 的错误处理 -Java8后最重要新特性