내 대학에서 컴파일러 디자인 과정을 마친 후 간단한 프로그래밍 언어로 컴파일러를 만들었지 만 파서에 문제가 있습니다. 나는 컴파일러를 mosml로 만들고 내장 파서 mosmlyac을 사용하여 파서를 구성했다. 다음은 문법과 연관성 + 우선 순위를 보여주는 파서의 발췌 부분입니다.사용자 프로그래밍 언어 용 문맥 자유 문법
...
%right ASSIGN
%left OR
%left AND
%nonassoc NOT
%left EQUAL LESS
%left PLUS MINUS
%left TIMES DIVIDE
%nonassoc NEGATE
...
Prog : FunDecs EOF { $1 }
;
FunDecs : Fun FunDecs { $1 :: $2 }
| { [] }
;
Fun : Type ID LPAR TypeIds RPAR StmtBlock { FunDec (#1 $2, $1, $4, $6, #2 $2) }
| Type ID LPAR RPAR StmtBlock { FunDec (#1 $2, $1, [], $5, #2 $2) }
;
TypeIds : Type ID COMMA TypeIds { Param (#1 $2, $1) :: $4 }
| Type ID { [Param (#1 $2, $1)] }
;
Type : VOID { Void }
| INT { Int }
| BOOL { Bool }
| CHAR { Char }
| STRING { Array (Char) }
| Type LBRACKET RBRACKET { Array ($1) }
;
StmtBlock : LCURLY StmtList RCURLY { $2 }
;
StmtList : Stmt StmtList { $1 :: $2 }
| { [] }
;
Stmt : Exp SEMICOLON { $1 }
| IF Exp StmtBlock { IfElse ($2, $3, [], $1) }
| IF Exp StmtBlock ELSE StmtBlock { IfElse ($2, $3, $5, $1) }
| WHILE Exp StmtBlock { While ($2, $3, $1) }
| RETURN Exp SEMICOLON { Return ($2,(), $1) }
;
Exps : Exp COMMA Exps { $1 :: $3 }
| Exp { [$1] }
;
Index : LBRACKET Exp RBRACKET Index { $2 :: $4 }
| { [] }
;
Exp : INTLIT { Constant (IntVal (#1 $1), #2 $1) }
| TRUE { Constant (BoolVal (true), $1) }
| FALSE { Constant (BoolVal (false), $1) }
| CHRLIT { Constant (CharVal (#1 $1), #2 $1) }
| STRLIT { StringLit (#1 $1, #2 $1) }
| LCURLY Exps RCURLY { ArrayLit ($2,(), $1) }
| ARRAY LPAR Exp RPAR { ArrayConst ($3,(), $1) }
| Exp PLUS Exp { Plus ($1, $3, $2) }
| Exp MINUS Exp { Minus ($1, $3, $2) }
| Exp TIMES Exp { Times ($1, $3, $2) }
| Exp DIVIDE Exp { Divide ($1, $3, $2) }
| NEGATE Exp { Negate ($2, $1) }
| Exp AND Exp { And ($1, $3, $2) }
| Exp OR Exp { Or ($1, $3, $2) }
| NOT Exp { Not ($2, $1) }
| Exp EQUAL Exp { Equal ($1, $3, $2) }
| Exp LESS Exp { Less ($1, $3, $2) }
| ID { Var ($1) }
| ID ASSIGN Exp { Assign (#1 $1, $3,(), #2 $1) }
| ID LPAR Exps RPAR { Apply (#1 $1, $3, #2 $1) }
| ID LPAR RPAR { Apply (#1 $1, [], #2 $1) }
| ID Index { Index (#1 $1, $2,(), #2 $1) }
| ID Index ASSIGN Exp { AssignIndex (#1 $1, $2, $4,(), #2 $1) }
| PRINT LPAR Exp RPAR { Print ($3,(), $1) }
| READ LPAR Type RPAR { Read ($3, $1) }
| LPAR Exp RPAR { $2 }
;
PROG는 %start
상징이며 나는 목적에 %token
및 %type
선언을 떠났다.
문제는이 문법이 모호하고 문법에 따라 mosmlyac -v
을 실행하는 결과를 보는 것입니다. 문제가되는 토큰 ID를 포함하고있는 규칙 인 것처럼 보입니다. shift/reduce 및 reduce/갈등을 줄이십시오. 출력은 또한 Exp : ID 규칙이 절대로 줄어들지 않는다고 알려줍니다.
아무도 내가이 문법을 명확하게 만들 수 있도록 도와 줄 수 있습니까?
고맙습니다. 이제는 문법이 명확합니다. lvalue/rvalue 문법에 대해 자세히 설명 할 수 있습니까? 아니면 더 자세히 읽을 수있는 곳으로 안내 할 수 있습니까? – LBJensen
@ LBJensen : lvalue는 대입 연산자의 왼쪽에있을 수있는 항목입니다. 일부 언어에서는 구문 적으로 인식 할 수 있습니다. 다른 것들에는 의미 론적 제약이있다. 일반적으로 표현식 구문의 하위 집합입니다 (C++에서는 C++에 참조 값이 있으므로 구문 하위 집합은 아닙니다.) [Lua] (http://www.lua.org/manual/5.3/manual .html # 9) (production var), [Tiger] (https://github.com/roneill/CS-4410-Compilers-Homework/wiki/Tiger-BNF-Grammar) 또는 [awk] (http : // pubs.opengroup.org/onlinepubs/9699919799/utilities/awk.html#tag_20_06_13_16) – rici