解析器Yacc似乎忽略了语法中的标记

问题描述

解析类似C的示例代码,我遇到以下问题。像某些标记(如标识符)一样,其被语法忽略,从而导致非原因的语法错误

解析器代码

%{
#include <stdio.h>
#include <stdlib.h>

int yylex();
void yyerror (char const *);

%}

%token T_MAINCLASS T_ID T_PUBLIC T_STATIC T_VOID T_MAIN T_PRINTLN T_INT T_FLOAT T_FOR T_WHILE T_IF T_ELSE T_EQUAL T_SMALLER T_BIGGER T_NOTEQUAL T_NUM T_STRING

%left '(' ')'
%left '+' '-'
%left '*' '/'
%left '{' '}'
%left ';' ','
%left '<' '>'

%% 
        
PROGRAM     : T_MAINCLASS T_ID '{' T_PUBLIC T_STATIC T_VOID T_MAIN '(' ')' COMP_STMT '}'
        ;

COMP_STMT   : '{' STMT_LIST '}'
        ;
    
STMT_LIST   : /* nothing */
        | STMT_LIST STMT
        ;

STMT        : ASSIGN_STMT
        | FOR_STMT
        | WHILE_STMT
        | IF_STMT
        | COMP_STMT
        | DECLaraTION
        | NULL_STMT
        | T_PRINTLN '(' EXPR ')' ';'
        ;

DECLaraTION : TYPE ID_LIST ';'
        ;

TYPE        : T_INT
        | T_FLOAT
        ;

ID_LIST     : T_ID ',' ID_LIST
        |
        ;

NULL_STMT   : ';'
        ;

ASSIGN_STMT : ASSIGN_EXPR ';'
        ;

ASSIGN_EXPR : T_ID '=' EXPR
        ;

EXPR        : ASSIGN_EXPR
        | RVAL
        ;

FOR_STMT    : T_FOR '(' OPASSIGN_EXPR ';' OPBOOL_EXPR ';' OPASSIGN_EXPR ')' STMT
        ;

OPASSIGN_EXPR   : /* nothing */
        | ASSIGN_EXPR
        ;

OPBOOL_EXPR : /* nothing */
        | BOOL_EXPR
        ;

WHILE_STMT  : T_WHILE '(' BOOL_EXPR ')' STMT
        ;

IF_STMT     : T_IF '(' BOOL_EXPR ')' STMT ELSE_PART
        ;

ELSE_PART   : /* nothing */
        | T_ELSE STMT
        ;

BOOL_EXPR   : EXPR C_OP EXPR
        ;

C_OP        : T_EQUAL | '<' | '>' | T_SMALLER | T_BIGGER | T_NOTEQUAL
        ;

RVAL        : RVAL '+' TERM
        | RVAL '-' TERM
        | TERM
        ;

TERM        : TERM '*' FACTOR
        | TERM '/' FACTOR
        | FACTOR
        ;

FACTOR      : '(' EXPR ')'
        | T_ID
        | T_NUM
        ;

%%

void yyerror (const char * msg)
{
  fprintf(stderr,"C-like : %s\n",msg);
  exit(1);
}

int main ()
{
  if(!yyparse()){
    printf("Compiled !!!\n");
   }
}

词法扫描器代码的一部分:

{Empty}+    { printf("EMPTY ") ; /* nothing */ }

"mainclass" { printf("MAINCLASS ") ; return  T_MAINCLASS ; }

"public"    { printf("PUBLIC ") ; return T_PUBLIC; }
    
"static"    { printf("STATIC ") ; return T_STATIC ; }

"void"      { printf("VOID ") ; return T_VOID ; }

"main"      { printf("MAIN ") ; return T_MAIN ; }

"println"   { printf("PRINTLN ") ; return T_PRINTLN ; }

"int"       { printf("INT ") ; return T_INT ; }

"float"     { printf("FLOAT ") ; return T_FLOAT ; }

"for"       { printf("FOR ") ; return T_FOR ; }

"while"     { printf("WHILE ") ; return T_WHILE ; }

"if"        { printf("IF ") ; return T_IF ; }

"else"      { printf("ELSE ") ; return T_ELSE ; }

"=="        { printf("EQUAL ") ; return T_EQUAL ; }

"<="        { printf("SMALLER ") ; return T_SMALLER ; }

">="        { printf("BIGGER ") ; return T_BIGGER ; }

"!="        { printf("NOTEQUAL ") ; return T_NOTEQUAL ; }

{id}        { printf("ID ") ; return T_ID ; }

{num}       { printf("NUM ") ; return T_NUM ; }

{string}    { printf("STRING ") ; return T_STRING ; }

{punct}     { printf("PUNCT ") ; return yytext[0] ; }

<<EOF>>     { printf("EOF ") ; return T_EOF; }

.       { yyerror("lexical error"); exit(1); }

示例:

mainclass Example {
       public static void main ( )
       {
         int c;
         float x,sum,mo;
         c=0;
         x=3.5;
         sum=0.0;
         while (c<5)
         {
                  sum=sum+x;
                  c=c+1;
                 x=x+1.5;
        }
       mo=sum/5;
       println (mo);
       }
}

运行所有这些东西,它将显示以下输出

C-like : Syntax error
MAINCLASS EMPTY ID 

尽管在语法上我们有:id似乎位置错误

PROGRAM     : T_MAINCLASS T_ID '{' T_PUBLIC T_STATIC T_VOID T_MAIN '(' ')' COMP_STMT '}'

解决方法

基于OP's self answer中提出的“解决方案”,很明显,最初的问题是生成的用于编译扫描器的标头与解析器规范中的bison / yacc生成的标头不同

生成的标头包含所有标记类型的定义,如小整数;为了使扫描程序与解析器进行通信,它必须标识具有正确令牌类型的每个令牌。因此,解析器生成器(bison / yacc)根据解析器规范(.y文件)生成标头,并且必须将该标头#include放入生成的扫描器中,以便扫描器操作可以使用符号令牌键入名称。

如果使用从解析器规范的某些先前版本生成的头文件来编译扫描程序,则令牌编号很有可能不再与解析器所期望的相对应。

避免此问题的最简单方法是使用make之类的构建系统,该系统会在必要时自动重新编译扫描程序。

检测此问题的最简单方法是使用野牛的built-in trace facility。启用跟踪只需要几行代码,就可以避免在整个扫描器和解析器中分散printf语句。野牛跟踪将向您确切显示正在发生的事情,因此,它不仅比添加printf少工作,而且更加精确。特别是,它报告传递给解析器的每个令牌(稍加努力,您也可以使其报告这些令牌的语义值)。因此,如果解析器获取的令牌代码错误,您将立即看到它。

,

经过许多潜在的有用更改后,解析器通过更改这些标记的顺序来工作。

  • 来自

    %token T_MAINCLASS T_ID T_PUBLIC T_STATIC T_VOID T_MAIN T_PRINTLN T_INT T_FLOAT T_FOR T_WHILE T_IF T_ELSE T_EQUAL T_SMALLER T_BIGGER T_NOTEQUAL T_NUM T_STRING

  • TO

    %token T_MAINCLASS T_PUBLIC T_STATIC T_VOID T_MAIN T_PRINTLN T_INT T_FLOAT T_FOR T_WHILE T_IF T_EQUAL T_ID T_NUM T_SMALLER T_BIGGER T_NOTEQUAL T_ELSE T_STRING

看起来阅读元素是else,但lexer通常返回一个id。某种程度上,这种修改是解决方案。