在这一节中,将介绍语法分析器。
在上一节的词法分析上实现SysY语言语法分析,来解析类似2 - 15 / 7 + 3 * 8 T_EOF
(T_EOF
表示终结符)
SysY 语言的文法采用扩展的 Backus 范式(EBNF,Extended Backus-NaurForm)表示,其中:
- 符号[…]表示方括号内包含的为可选项
- 符号{…}表示花括号内包含的为可重复 0 次或多次的项
- 终结符或者是由单引号括起的串,或者是 Ident、InstConst 这样的记号
现在,给出SySY语言的关于加减乘除取余的简易语法。
加减表达式: AddExp → UnaryExp (’+’ | ‘−’) UnaryExp
乘除模表达式: MulExp → UnaryExp (’*’ | ‘/’ | ‘%’) UnaryExp
在这里,“UnaryExp”可以简单地看作是整数。
可以看到SysY语言的语法是递归的,因此可以递归解析它。可以编写如下所示的伪代码:
递归解析函数()
{
扫描并检查第一个令牌是一个数字。如果不是,则返回错误。
获取下一个单词。
如果到达输入的末尾,则返回结果。
否则,调用递归解析函数()。
}
抽象语法树
为了进行语义分析,我们需要代码来解释识别的输入,或将其转换为另一种格式,例如汇编代码。因此我们首先要将输入转换为语法分析树,也称为 AST。
AST 的节点结构:
// AST节点类型
enum
{
A_ADD, A_SUB, A_MUL, A_DIV, A_MOD, A_INT
};
// 抽象语法树结构
struct ASTnode
{
int op; // 节点的操作类型
struct ASTnode *left;
struct ASTnode *right;
int intvalue; // 整数节点的值,没有子树
};
构建AST
用以下代码构建AST:
struct ASTnode *mkastnode(int op, struct ASTnode *left, struct ASTnode *right, int intvalue)
{
struct ASTnode *n;
n = (struct ASTnode *) malloc(sizeof(struct ASTnode));
if (n == NULL)
{
fprintf(stderr, "Unable to malloc in mkastnode()\n");
exit(1);
}
n->op = op;
n->left = left;
n->right = right;
n->intvalue