问题描述
|
我们正在使用docbook(和xep)来生成大量pdf和html格式的文档。
作为重构的一部分,我们希望使针对这些文档的自动构建过程更加健壮。一种方法是,当新创建的html或pdf文档包含对imagedata的错误引用(即,对不存在的图像文件的引用)时,使我们的构建失败。
现在,如果我们的docbook源引用了任何丢失的图像,则我们的自动构建无论如何都会创建文档,并且损坏的图像链接可能很长一段时间都不会被注意到。
有没有一种自动的方法来捕获此类错误?我可以在docbook或xep中设置的一些参数会很好,但找不到类似的东西。
解决方法
Docbook Toolkit主要是纯XSL,其工作级别高于文件系统调用。
因此,它无法检测到丢失的二进制文件,尤其是通过URI引用的二进制文件。
考虑一下-它需要一个具有HTTP支持的库,该库实际上将解析路径并遍历链接并查看其背后的内容。
就像Martin所说的那样,最好使用单独的工具完成此操作,我可能会从docbook中收集所有href \,并将其包含在构建工具中。如果文件丢失,构建工具本身将报告为丢失。