编译原理:从正则表达式到NFA,python实现
两年前编译原理课的实验一,从正则表达式生成NFA,使用的Thompson算法,具体原理不再阐述(我也不太记得了),不过代码里写了注释~
- 理论请参考其他大神的博客:https://blog.csdn.net/moodfriend/article/details/106011361
stateNum=0
a=[]
#读入写有re的文本文件,先暂定为
def ReadRe():
file = open("/home/TerryLee/PycharmProjects/pythonProject1/sample",'r')
REs=[]
while 1:
line = file.readline()
REs.append(line)
print(type(REs[0]))
if not line:
break
pass
# for item in a:
# print(item)
return REs
#Thompson算法的第一步是要将正则表达式(中缀形式)转为后缀形式
def Thompson(re):
'''用一个字典来表示运算符的优先级'''
ops={
'*':5,'.':4,'|':3}
postfix=""
stack=""
'''将中缀表达式表达式转化为后缀表达式'''
for a in re:
'''()的优先级最高,首先讨论'''
if a=="(":
stack=stack+a
elif a==")":
#print(stack)
'''读入)以后,就将)之前直到(的所有运算符输出,再让(出栈,不输出括号的原因是后缀表达式不需要括号也能表示优先级'''
while stack[-1]!="(":
postfix,stack= postfix+stack[-1],stack[:-1]
stack=stack[:-1] #删除")"
elif a in ops:
'''新进入栈的运算符优先级如果比栈内的运算符优先级高,直接入栈。否则就把栈内的高优先级的运算符依次出栈,加入后缀表达式中,读入的运算符则是入栈'''
while stack and ops.get(a,