问题描述
我正在尝试为一种旧文件格式编写PEG,该文件格式包含大约100个不能用作标识符的关键字。
这是关键字规则的示例:
IN = { ^"in" } // Caret means case insensitivity
keyword = { IN } // plus others
标识符规则如下:
identifier = @{ ( "_" | ASCII_ALPHA ) ~ ASCII_ALPHANUMERIC* }
当前,此标识符规则将匹配所有关键字。因此,标识符规则变为:
identifier = @{ !keyword ~ ( "_" | ASCII_ALPHA ) ~ ASCII_ALPHANUMERIC* }
除了标识符以与关键字相同的字母开头外,这种工作方式还可以。例如,标识符inner
被当作关键字in
,后跟文本。
如何允许以关键字开头的标识符?请注意,在pest解析器生成器中,只能将终端指定为字符串,而不能将其指定为正则表达式。
解决方法
您可以使用predicate强制docker run --env NODE_TLS_REJECT_UNAUTHORIZED=0
仅匹配完整单词。例如:
keyword
这将匹配identifier_start = _{ "_" | ASCII_ALPHA }
identifier_continue = _{ "_" | ASCII_ALPHANUMERIC }
keyword = @{ (^"for" | ^"in") ~ !identifier_continue }
identifier = @{ !keyword ~ identifier_start ~ identifier_continue* ~ !identifier_continue }
和for
,但不匹配in
或form
。