命令行perl regex查找悬空的Javascript逗号

问题描述

|| 您好,我正在寻找一种Perl单行代码,以扫描我们所有的Javascript文件,以查找所谓的“流氓逗号”。也就是说,逗号位于数组或对象数据结构的末尾,因此逗号紧接在\'] \'或\'} \'字符之前。 我遇到的主要挑战是如何使用于检查]或}的正则表达式不贪心。正则表达式需要跨越多行,因为逗号可以结束一行,然后在下一行中使用}或],但是我已经在Minimal Perl的帮助下找到了解决方法。 另外,我希望能够将大量文件通过此管道(通过find / xargs)传递到此Perl正则表达式中,因此我想打印输入文件名称以及该文件中的行号。 以下是我的各种尝试,这些尝试与根据我的bash历史进行的工作并不太接近。提前致谢:
find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,\\s+$/ and print $_;\' find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,\\s+/ and print $_;\' find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,\\s+\\]/ and print $_;\' find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,\\s+[\\]\\}]/ and print $_;\' find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,\\s+[\\]\\}]/ and print $_;\' | wc -l find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,\\s+}/ and print $_;\' | wc -l find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,\\s+}?/ and print $_;\' | wc -l find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,\\s+}+?/ and print $_;\' | wc -l find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,$/\' and print $_;\' find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/,$/ and print $_;\' find winhome/workspace/SsuExt4Zoura/quotetool/js
-name \"*.js\" | xargs perl -00 -wnl -e \'/\\,$/ and print $_;\'
    

解决方法

使用
-00
开关,您可以更改记录分隔符,并且(可能)将整个文件放在一行中,从而可以查找多行尾随逗号。但是,这也会使
print $_
打印整行。您可能想要的是打印文件名:
print $ARGV if /,\\s*[\\]\\}]/;
    ,其中大多数看起来像是解决问题的一种体面方法,只有一个小问题。您可能想要
,\\s*(?:$|[\\]\\}])
而不是
,\\s+(?:$|[\\]\\}])
,因为可能甚至没有一个空格。您的
+
量词可能会漏掉类似
,]
的形式。 话虽这么说,JavaScript可能非常微妙,您可能会遇到注释和其他内容,这些内容可能以逗号结尾,在出现意外情况之前,例如文件末尾或“ 8”。一种便宜的解决方案可能是使用perl
s///
表单在应用测试之前简单地删除所有注释。 如果您正在处理JSON,则JSON :: XS可以使用其宽松选项来强制执行有效性。 如果您需要真正的验证,则可以采用JSLint之类的方法。使用Rhino嵌入JavaScript取得了很多成功(将Perl与SpiderMonkey结合使用的效果略有下降),并将其作为针对JavaScript代码的一组测试将是确保长期可靠性的一种不错的方法。     ,解决此问题的一个简单方法是使用逗号优先样式。由于逗号永远不会出现在行尾,因此永远不会出现“尾随逗号”。 例如:
var myObj = { foo: 1,bar: 2,baz: 4
            }
您可以轻松地检测到是否缺少逗号,很明显,哪些元素属于哪一组大括号,并且永远不会出现“尾随逗号问题”。 另请参阅https://gist.github.com/357981