Java petitparser 可选的表达式结束

问题描述

我需要一个只从文本文件提取重要标记部分的解析器。 这是示例输入:

else before 1
else before 2
--Start Query 1
important 1
--End 1
else between 1 and 2 - 1
else between 1 and 2 - 2
--Start Query 2
important 2
--End 2 
else after1-1
else after1-2

我写了这个解析器:

public class ExpressionDeFinition extends GrammarDeFinition {
        {
            def("start",ref("expr").star().end());
            def("nl",of("\r\n").or(of("\n").or(of("\r"))));
            def("expr",ref("else").starLazy(ref("expr_start").flatten())
                    .seq(ref("expr_start"))
                    .seq(ref("expr_body"))
                    .seq(ref("expr_end"))
                    .seq(ref("else").starLazy(ref("expr_start")).optional()).map(in -> {
                        if (in instanceof List) {
                            for (Object o: (List)in) {
                                if (o instanceof Body) {
                                    return o;
                                } 
                            }
                        }
                        return null;
                    }));
            def("expr_start",of("--Start Query").seq(any().starLazy(ref("nl")),ref("nl")));
            def("expr_body",any().starLazy(ref("expr_end")).flatten().map((String in) -> new Body(in)));
            def("expr_end",of("--End").seq(any().starLazy(ref("nl")).optional(),ref("nl").optional()));
            def("else",any().starLazy(ref("nl")).seq(ref("nl")));
        }

使用这个用于获取重要数据的小实用程序 Pojo:

@Data
@AllArgsConstructor
public static class Body {
    private final String val;
    @Override public String toString() { return val; }
}

运行方式:

ExpressionDeFinition def = new ExpressionDeFinition();
Parser parser = def.build();
Result result = parser.parse(input);

它抛出了一个异常: org.petitparser.context.ParseError: end of input expected 但是没有明显的原因,因为最后一行是 else 类型的内容,我们希望它具有星级条件,并且它是 expr 的一部分:ref("else").starLazy(ref("expr_start")).optional()

我如何更改解析器,以便它期望每个 expr 的末尾是任意数量else,在输入的末尾有和没有可能的换行符?使 else 成为贪婪会消耗第二个 expr_body。使它 any().optional() 导致无限循环挂起。 有什么解决办法吗?

解决方法

可能您想使用 exec program 运算符,它为您提供了一个解析器,该解析器使用 a.delimitedBy(b) 一次或多次分隔并可能以参数 a 结束。如果您需要更多控制,请查看它是如何implemented

相关问答

Selenium Web驱动程序和Java。元素在(x,y)点处不可单击。其...
Python-如何使用点“。” 访问字典成员?
Java 字符串是不可变的。到底是什么意思?
Java中的“ final”关键字如何工作?(我仍然可以修改对象。...
“loop:”在Java代码中。这是什么,为什么要编译?
java.lang.ClassNotFoundException:sun.jdbc.odbc.JdbcOdbc...