Groovy脚本检查html坏链接

这些天在搞Gradle翻译,因为原译者在翻译的同时也把文件进行了整理,并且把翻译过的章节放到新的文件夹中,导致可能有些超链接未改正过来变成死链接

本想在网上找个工具来检查的,百度了几个工具要么太大要么要安装,懒得弄那么多,于是用Groovy写了一个脚本。此脚本仅检查本地超链接代码如下:

if (args.size() != 1) {
    printf("Please specify a folder or HTML file path...")
    return
}

def file = new File(args[0])
if(file.isFile()) {
    if(!args[0].toLowerCase().endsWith(".html")) {
        return
    }
    checkHtml(file)
} else if (file.isDirectory()) {
    def errorLinks = new HashMap<String,List<String>>()
    file.eachFileMatch( ~/.*\.html/,{
        checkHtml(it,errorLinks)
    })
    errorLinks.each {name,links ->
        println "file: " + name
        links.each {
            println "href:\t" + it
        }
    }
}

void checkHtml(File file,HashMap<String,List<String>> errorlinks) {
    def matches = file.text.findAll('href="([^#(http)].+?)("|#)')
    def links = new ArrayList<String>()
    matches.each {
        def path = it - 'href="' - '"' - '#'
        if(!new File(file.getParentFile(),path).exists()) {
            links.add(path)
        }
    }
    if(!links.isEmpty()) {
        errorlinks.put(file.path,links)
    }
}
运行时传入一个地址。如果是HTML文件,则检查该文件。如果是目录,则检查里面的HTML文件,其他文件不检查。然后把有错误文件及其超链接在最后打印出来,正确的不打印。

相关文章

背景:    8月29日,凌晨4点左右,某服务告警,其中一个...
https://support.smartbear.comeadyapi/docs/soapui/steps/g...
有几个选项可用于执行自定义JMeter脚本并扩展基线JMeter功能...
Scala和Java为静态语言,Groovy为动态语言Scala:函数式编程,...
出处:https://www.jianshu.com/p/ce6f8a1f66f4一、一些内部...
在运行groovy的junit方法时,报了这个错误:java.lang.Excep...