根据全局变量的值设置规则

问题描述

在ocamllex和ocamlyacc的词法分析器中,我有一个.mly,如下所示:

%{
  open Params
  open Syntax
%}

main:
| expr EOF { $1 }

expr:
| INTEGER { EE_integer $1 }
| LBRACKET expr_separators RBRACKET { EE_brackets (List.rev $2) }

expr_separators:
  /* empty */  { [] }
| expr         { [$1] }
| expr_separators ...... expr_separators { $3 :: $1 }

params.ml中,定义了一个变量separator。其值为;,,并由上游系统设置。

.mly中,我希望基于expr_separators的值定义Params.separator的规则。例如,当params.separtor;时,只有[1;2;3]被视为expr,而[1,2,3]不是。当params.separtor,时,只有[1,3]被视为expr,而[1;2;3]不是。

有人知道如何修改词法分析器和解析器以实现这一点吗?

PS:

Params.separator的值是在解析之前设置的,在解析期间不会更改。

此刻,在词法分析器中,,返回令牌COMMA,而;返回SEMICOLON。在解析器中,还有其他涉及COMMASEMICOLON的规则。

expr_separators为{{时,我只想设置一个规则;,使它考虑,并忽略Params.separator(可能由其他规则解析)。 1}};并且当;,时,它会考虑;并忽略Params.separator(可能由其他规则解析)。

解决方法

在某些方面,此请求与请求宏预处理器在运行时更改其替换或通过编译器更改变量的类型相同。与程序本身一样,一旦语法被编译(无论是编译成可执行代码还是解析表),就无法返回并对其进行修改。至少对于大多数产生确定性解析器的LR(k)解析器生成器来说就是这种情况。

此外,配置参数唯一的区别似乎不太可能是选择单个分隔符。如果未选择的分隔符令牌“可以由其他规则解析”,则当它是选定的分隔符令牌时,可以由那些其他规则解析,除非配置设置也使那些其他规则受到抑制。因此,至少,您似乎正在寻找类似的东西:

expr : general_expr
expr_list : expr
%if separator is comma
expr : expr_using_semicolon
expr_list : expr_list ',' expr
%else
expr : expr_using_comma
expr_list : expr_list ';' expr
%endif

对于要实现的目标没有更具体的了解,我可以提供的最佳建议是编写两个语法,然后根据配置设置选择要在运行时使用的一个语法。大概这两个语法几乎是相似的,因此您可能可以使用自己的自定义编写的预处理器来从相同的输入文本中生成这两个语法,这看起来与上面的示例有点类似。 (您可以使用m4,它是通用的宏处理器,但是对于这样一个简单的应用程序,您可能会觉得学习曲线太陡了。)

产生通用解析器的解析器生成器通过运行时动态修改,使时间更短;许多这样的解析器生成器都有可以做到的机制(尽管它们不一定是有效的机制)。例如,Bison工具可以生成GLR解析器,在这种情况下,您可以使用谓词操作选择或取消选择特定规则。 OCAML GLR生成器Dypgen允许在解析过程中将规则集动态添加到语法中。 (我从未使用过dypgen,但我一直想尝试它;它看起来很有趣。)还有很多其他人。

在某些GLR解析器中使用了动态解析功能后,我只能说我的个人经历有些复杂。在运行时修改语法是一种易碎的技术。语法往往很难拆分成多个独立的部分,因此在不希望受到影响的地方修改语法规则可能会产生意想不到的后果。您并不总是确切知道解析接受的语言,因为动态修改可能很难预测。等等。我的建议是,如果您尝试使用此技术,则应从尽可能简单的修改开始,然后在语法测试中投入更多的精力(无论如何,这总是一个好主意)。