ANTLR 4错误50-字符“ i”不匹配,期望“ {”

问题描述

ANTLR4新手在这里

我正在尝试创建我的第一个ANTLR4语法-一个小的Oracle sql * Loader-但似乎无法摆脱困境!

当我通过推荐别名antlr4运行语法时,收到以下错误消息:

error(50): HQLLDR.g4::: Syntax error: mismatched character 'i' expecting '{'

我以为该错误是由使用ANTLR4关键字(例如OPTIONS)引起的,因此我将代码更改为使用OPTS,但是该错误仍然存​​在。

这是语法:

grammar HQLLDR;

hqlldr: hqlhdr hqlbody ;

hqlhdr: LOAD DATA ;

hqlbody: hql_express hql_full ;

hql_express: infile_express ;

hql_full: options infile tbldefn fielddefn datalines ;

opts: OPTS '(' opt ( ',' opt )* ')' ;
opt: skipit | database | schema ;
skipit: SKIPIT '='  DIGIT+ ;
database: DATABASE '=' OBJNM ;
schema: SCHEMA '=' OBJNM ;

infile_express: INFILE filelist_express ;
filelist_express: '(' '"' file_express '"' ')' ;
file_express: TEXT ;

infile: INFILE (DATALInes | filelist)? ;
filelist: '(' '"' file '"' ( ',' '"' file '"' )* ')' ;
file: TEXT ;

tbldefn: (TruncATE | APPEND | CREATE) INTO TABLE tblnm ;
tblnm: OBJNM OBJDESC? ;

fielddefn: termdefn encdefn? fieldlist ;
termdefn: TERMINATED BY DELIMITER terminators ;
terminators: (TAB|SEMICOLON|COMMA|COLON|SPACE) ;
encdefn: ENCLOSED BY ENCLOSURE enclosures ;
enclosures: (DOUBLEQUOTE|APOSTROPHE) ;
fieldlist: '(' fieldname fielddesc? fielddatatype ( ',' fieldname fielddesc? fielddatatype )* ')' ;
fieldname: OBJNM ;
fielddesc:  OBJDESC? ;
fielddatatype: (BIGINT | INT | SMALLINT | tinyint | TIMESTAMP | STRING | FLOAT | DOUBLE) ;

datalines: ROWTEXT '\r'? '\n' ;

ROWTEXT: ~[\n\r]+ ;
LETTER:   [a-zA-Z_] ;
DIGIT:   [0-9] ;
LOAD:   [Ll][Oo][Aa][Dd] ;
DATA:   [Dd][Aa][Tt][Aa] ;
OPTS:   [Oo][Pp][Tt][Ii][Oo][Nn][Ss] ;
SKIPIT:   [Ss][Kk][Ii][Pp] ;
DATABASE:   [Dd][Aa][Tt][Aa][Bb][Aa][Ss][Ee] ;
SCHEMA:   [Ss][Cc][Hh][Ee][Mm][Aa] ;
INFILE:   [Ii][Nn][Ff][Ii][Ll][Ee] ;
DATALInes:   [Dd][Aa][Tt][Aa][Ll][Ii][Nn][Ee][Ss] ;
TruncATE:   [Tt][Rr][Uu][Nn][Cc][Aa][Tt][Ee] ;
APPEND:   [Aa][Pp][Pp][Ee][Nn][Dd] ;
CREATE:   [Cc][Rr][Ee][Aa][Tt][Ee] ;
INTO:   [Ii][Nn][Tt][Oo] ;
TABLE:   [Tt][Aa][Bb][Ll][Ee] ;
FIELDS:   [Ff][Ii][Ee][Ll][Dd][Ss] ;
TERMINATED:   [Tt][Ee][Rr][Mm][Ii][Nn][Aa][Tt][Ee][Dd] ;
BY:   [Bb][Yy] ;
ENCLOSED:   [Ee][Nn][Cc][Ll][Oo][Ss][Ee][Dd] ;
OBJDESC:   '(' '"' .*? '"' ')' ;
OBJNM:   LETTER+ (LETTER | DIGIT)* ;
TEXT:   ~[,\n\r"']+ ;
TAB:   [Tt][Aa][Bb] ;
SEMICOLON:   [Ss][Ee][Mm][Ii][Cc][Oo][Ll][Oo][Nn] ;
COMMA:   [Cc][Oo][Mm][Mm][Aa] ;
COLON:   [Cc][Oo][Ll][Oo][Nn] ;
SPACE:   [Ss][Pp][Aa][Cc][Ee] ;
DELIMITER:   (TAB | SEMICOLON | COMMA | COLON | SPACE) ;
DOUBLEQUOTE:   [Dd][Oo][Uu][Bb][Ll][Ee][Qq][Uu][Oo][Tt][Ee] ;
APOSTROPHE:   [Aa][Pp][Oo][Ss][Tt][Rr][Oo][Pp][Hh][Ee] ;
ENCLOSURE:   (DOUBLEQUOTE | APOSTROPHE) ;
BIGINT:   [Bb][Ii][Gg][Ii][Nn][Tt] ;
INT:   [Ii][Nn][Tt] ;
SMALLINT:   [Ss][Mm][Aa][Ll][Ll][Ii][Nn][Tt] ;
tinyint:   [Tt][Ii][Nn][Yy][Ii][Nn][Tt] ;
TIMESTAMP:   [Tt][Ii][Mm][Ee][Ss][Tt][Aa][Mm][Pp] ;
STRING:   [Ss][Tt][Rr][Ii][Nn][Gg] ;
FLOAT:   [Ff][Ll][Oo][Aa][Tt] ;
DOUBLE:   [Dd][Oo][Uu][Bb][Ll][Ee] ;
NL:   '\r'? '\n' ;
WS:   [ \t]+ -> skip ;

任何帮助将不胜感激!

谢谢! 斯科特

解决方法

好!没关系!我忘记将规则“ options”更改为“ opts”,以及解决了字段列表中的问题。它编译了。 :-)

,

ANTLR的词法分析器通过以下方式构造令牌:

  1. 尝试为单个令牌消耗尽可能多的字符(词法分析器规则)
  2. 如果有2个或更多匹配相同字符的词法分析器规则,则让第一个定义的“ win”规则获胜

给出您的词法分析器规则:

ROWTEXT: ~[\n\r]+ ;

和输入"load data\n",很明显(或应该清楚)将仅创建2个令牌:

ROWTEXT : 'load data'
NL      : '\n'

解析器是否尝试匹配LOAD令牌后跟DATA令牌都没有关系:词法分析器独立于解析器进行操作。

您必须删除ROWTEXT并尝试在解析器中进行构造:

rowtext
 : ~NL+
 ;

请注意,解析器规则中的~会否定标记,而不是字符。因此,它的意思是:“匹配NL以外的一个或多个令牌”。