PEG语法与PEST解析器的歧义

问题描述

我正在尝试为一种旧文件格式编写PEG,该文件格式包含大约100个不能用作标识符的关键字。

这是关键字规则的示例:

IN = { ^"in" } // Caret means case insensitivity

keyword = { IN } // plus others

标识符规则如下:

identifier = @{ ( "_" | ASCII_ALPHA ) ~ ASCII_ALPHANUMERIC* }

当前,此标识符规则将匹配所有关键字。因此,标识符规则变为:

identifier = @{ !keyword ~ ( "_" | ASCII_ALPHA ) ~ ASCII_ALPHANUMERIC* }

除了标识符以与关键字相同的字母开头外,这种工作方式还可以。例如,标识符inner被当作关键字in,后跟文本。

如何允许以关键字开头的标识符?请注意,在pest解析器生成器中,只能将终端指定为字符串,而不能将其指定为正则表达式。

解决方法

您可以使用predicate强制docker run --env NODE_TLS_REJECT_UNAUTHORIZED=0 仅匹配完整单词。例如:

keyword

这将匹配identifier_start = _{ "_" | ASCII_ALPHA } identifier_continue = _{ "_" | ASCII_ALPHANUMERIC } keyword = @{ (^"for" | ^"in") ~ !identifier_continue } identifier = @{ !keyword ~ identifier_start ~ identifier_continue* ~ !identifier_continue } for,但不匹配inform