0% ont trouvé ce document utile (0 vote)

18 vues148 pages

Analyse Syntaxique

L'analyse syntaxique a pour rôle de vérifier si une séquence d'unités lexicales est générée par la grammaire d'un langage, en utilisant des méthodes d'analyse descendante et ascendante. L'analyse descendante, notamment par la méthode prédictive, construit un arbre de dérivation à partir de l'axiome de la grammaire, en utilisant des techniques comme l'élimination de la récursivité à gauche et de l'ambiguïté. La construction d'une table d'analyse syntaxique repose sur les ensembles PREMIER et SUIVANT, permettant de déterminer les règles de production à appliquer lors de l'analyse d'une chaîne.

Transféré par

rouaaessid2002

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

18 vues148 pages

Analyse Syntaxique

Transféré par

rouaaessid2002

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

Vous êtes sur la page 1/ 148

Analyse Syntaxique

Chapitre 6
1. Rôle d’un analyseur syntaxique

Le rôle principal de l’analyse syntaxique est de vérifier si la

séquence d’unité lexicale retourné par l’analyseur lexical est
générée par la grammaire du langage.

Il existe plusieurs méthodes d’analyse appartenant à l’une des

deux catégories qui sont l’analyse descendante et l’analyse
ascendante.
Dans l’analyse descendante nous essayons de dériver à partir de
l’axiome de la grammaire le programme source.
D’une façon opposée, l’analyse ascendante établit des réductions
sur les chaînes à analyser pour aboutir à l’axiome de la
grammaire
2. Analyse descendante

a- Principe de l’Analyse descendante (méthode :Analyse

prédictive)
Le principe de l’analyse hiérarchique descendante d’un mot
consiste à construire l’arbre de dérivation du haut (l’axiome) vers
le bas (les unités lexicales).
A titre d’exemple, soit la grammaire G ayant S pour axiome et
pour règles de production, l’ensemble P = {S → aSbT |cT |d, T →
aT |bS|c} et le mot w = accbbadbc qu’on cherche à vérifier la
possibilité de sa génération par la grammaire G. Pour le faire, on
réalise la lecture successive des lettres du mot w tout en avançant
la construction descendante de l’arbre.
2. Analyse descendante
Avec cet exemple, c’est très facile de trouver l’arbre de dérivation
du mot w parce-que chaque règle commence par un terminal
différent, donc on sait immédiatement laquelle prendre.
Il est très fréquent de se trouver devant la situation où en lisant
un terminal, on ne sait pas quelle règle il faut prendre, vu
l’existence de plusieurs (au moins deux) règles qui commencent
par ce terminal. Pour le savoir, il faut lire aussi la lettre suivante,
ou bien, il faut se donner la possibilité de faire des retour en
arrière (backtracking).
Dans d’autres situations plus compliquées, pour savoir quelle
règle utiliser, il faut cette fois connaître aussi la dernière lettre du
mot, ce qui complique énormément le problème.
Analyse syntaxique prédictive non récursive

C’est une technique d’analyse descendante basée sur la construction de

l’arbre de dérivation à partir de ses sous-arbres en utilisant une pile.
▶ Initialement la pile contient le symbole fond de pile $ et au sommet
l’axiome de la grammaire, le tampon d’entrée contient le mot à analyser
suivi du symbole $, la tête de lecture pointe sur le premier symbole.
La racine de l’arbre
▶ A la fin de l’analyse, la pile contient le symbole $ et la tête de Lecture
pointe sur le symbole $ de fin de la chaı̂ ne d’entrée.
L’arbre est construit.
La grammaire doit être non récursive à gauche et non ambiguë.
▶ Élimination de la récursivité à gauche et de l’ambiguı̈ té si elles
existent.
L’évolution de l’analyse s’effectue en consultant une table d’analyse.
▶ Construite conformément à la grammaire du langage.
Élimination de la récursivité à gauche
Grammaire récursive à gauche
Une grammaire est dite récursive à gauche si elle admet une règle de
la forme : A → Aα
Transformation de cette grammaire en une équivalente non récursive
à gauche
Une grammaire récursive à gauche avec les règles de production
A → Aα1 |Aα2 | . . . |Aαn |β1 |β2 | . . . |βm Est transformée en une
grammaire non récursive à gauche ayant les règles de production :

A → β1 A′ |β2 A′ | . . . |βm A′
A′ → α1 A′ |α2 A′ | . . . |αn A′ |ε
Élimination de la récursivité à gauche

Exemple
La grammaire dont les règles de production sont les suivantes est
récursive à gauche
Exp → Exp op Exp|(Exp)|id|nb

Elle est transformée en une grammaire équivalente non récursive

à gauche avec les règles suivantes :

Exp → (Exp) E′ |id E′ |nb E′

E′ → op Exp E′ |ε
Élimination de l’ambiguı̈ té

Grammaire ambiguë
Admet des règles de la forme : A → αβ1 |αβ2

Transformation d’une grammaire ambiguë en une non ambiguë

Une grammaire ambiguë avec les règles de production :

A → αβ1 |αβ2 | . . . |αβm |α1 |α2 | . . . |αn

Est transformée en une grammaire non ambiguë :

A → αA′ |α1 |α2 | . . . |αn

A′ → β1 |β2 | . . . |βm
Élimination de l’ambiguı̈ té

Exemple

La grammaire suivante est ambiguë

I → If (Expression) Then I|If (Expression) Then I else I
Elle est transformée en une grammaire non ambiguë :

I → If (Expression) Then I S
S → ε|else I
2. Analyse descendante

Conclusion: ce qui serait pratique, ça serait d'avoir une table

qui nous dit: quand je lis tel caractère et que j'en suis a dériver
tel symbole non-terminal, alors j'applique telle règle et je ne
me pose pas de questions. Heureusement ça existe, et ça
s'appelle une table d'analyse .

Pour construire une table d'analyse, on a besoin des

ensembles PREMIER et SUIVANT.
Calcul des premiers et suivants
Premier :
Pour toute chaı̂ ne composée de symboles terminaux et non-
terminaux, on cherche PREMIER(α) : l’ensemble de tous les
terminaux qui peuvent commencer une chaı̂ ne qui se dérive de α.
On cherche alors tous les terminaux a tel qu’il existe une
dérivation α ⇒* aβ (β étant une chaı̂ ne quelconque composée de
symboles terminaux et non-terminaux)

Suivant :
Pour tout non-terminal A, on cherche SUIVANT(A) : l’ensemble de
tous les symboles terminaux a qui peuvent apparaître
immédiatement à droite de A dans une dérivation : S→ αAaβ
Calcul des premiers et suivants
Calcul des premiers
Appliquer les règles suivantes jusqu’à ce qu’aucun terminal ni ε ne
puisse être ajouté aux ensembles PREMIER :
1 Si X est un terminal, PREMIER(X) est {X}.
2 Si X → ε est une production, ajouter ε à PREMIER(X).
3 Si X est un non-terminal et X → Y1 Y2 . . . Yk une production,
mettre a dans PREMIER(X) s’il existe i tel que a est dans PREMIER(Yi )
et que ε est dans tous les PREMIER(Y1 ), . . ., PREMIER(Yi−1 ) c.a.d Y1
,. . .,Yi−1 ⇒* ε. Si Y1 ne dérive pas en ε,
on n’ajoute rien de plus à PREMIER(X), mais si Y1 ⇒ *ε, on ajoute
PREMIER(Y2 ), etc.
2. Analyse descendante
Algorithme de construction des ensembles PREMIER :
Exemple

S → AB | Da
A → aAb | ε
B → bB | ε
D → dD | e

ε-production { A, B, S}
Premier (S) = ? { a,b,d,e}
Premier (A) = ? {a,ε}
Premier (B) = ? {b,ε}
Premier (D) = ? {d,e}
Exemple suite

Premier (S) = Premier (A) ∪ Premier (B) ∪ Premier (D)

Premier (A) = {a, ε}
Premier (B) = {b, ε}
Premier (D) = {d, e} Premier (aAb) = {a}
D’où Premier (bB) = {b}
Premier (S) = {a, b, d, e} Premier (dD) = {d}
Premier (A) = {a, ε} Premier (e) = {e}
Premier (B) = {b, ε} Premier (ε) = ∅
Premier (D) = {d, e}
2. Analyse descendante

Exemple

E →TE’
E’→+TE’|-TE’|ε
T →FT’
T’→*FT’|/FT’|ε
PREMIER(E) = PREMIER(T )= PREMIER(F) = {(,nb}
F →(E)|nb PREMIER(E’) = {+,-,ε}
PREMIER(T) = PREMIER(F ) = {(,nb}
PREMIER(T’) = {*,/,ε}
PREMIER(F) = {(, nb}
2. Analyse descendante

Autre Exemple
2. Analyse descendante

Calcul de l’ensemble Suivant :

Pour tout non-terminal A, on cherche l’ensemble

SUIVANT(A), qui est l’ensemble de tous les terminaux a qui
peuvent apparaître juste après (à droite de) A dans une
dérivation S →* αAaβ, avec α et β sont deux chaînes
quelconques composées de symboles terminaux et non-
terminaux.

Pour l’ensemble des symboles non-terminaux, l’algorithme

permettant de définir les ensembles SUIVANT est le suivant :
2. Analyse descendante
2. Analyse descendante

Exemple Soit la grammaire G :

S → aSb| cd |SAe
A → aAdB | ε
B → bb

SUIVANT(S) = ? {$, b, a,e}

SUIVANT(A) = ? {d,e}
SUIVANT(B) = ? Suivant(A) = {d,e}
2. Analyse descendante

Exemple Soit la grammaire G :

S → aSb| cd |SAe
A → aAdB | ε
B → bb

SUIVANT(S) = SUIVANT(S) U PREMIER(A) { $,b,a,e} (e, car on a

la règle A→ ε)
SUIVANT(A) = {d,e}
SUIVANT(B) = SUIVANT(A) = {d,e} (Règle : A→ aAdB)
2. Analyse descendante

Autre Exemple Soit la grammaire G :

E → TE’
E’ → +TE’|-TE’|ε
T → FT’
T’ →*FT’|/FT’|ε
F → (E)|nb

SUIVANT(E) = {$,)}
SUIVANT(E’) = SUIVANT(E) = {$,)}
SUIVANT(T) = PREMIER(E’) U SUIVANT(E)
(cas E’ = ε) = {+,-, $,)}
SUIVANT(T’) = SUIVANT(T) = {+,-, $,)}
SUIVANT(F) = PREMIER(T’) U SUIVANT(T) (cas T’ =ε) = {*,/,+,-,$,)}
2. Analyse descendante

c. Construction de la table d’analyse syntaxique

Une table d'analyse est un tableau M à deux dimensions qui

indique pour chaque symbole non-terminal A et chaque
symbole terminal a ou symbole $ la règle de production a
appliquer. Ceci revient à appliquer l’algorithme suivant :
1 Pour chaque production A → α faire :
- pour tout a ∈ PREMIER(α) (avec, α ≠ ε), rajouter la
production A → α dans la case M [A, a] ;
- si ε ∈ PREMIER(α) , alors pour chaque b ∈
SUIVANT(A)
ajouter A → α dans M [A, b].
2 - chaque case M [A, a] vide est une erreur syntaxique.
2. Analyse descendante
Exemple :

Soit la grammaire G ayant E pour axiome et pour règles de

productions l’ensemble :

E → TE’
E’→ +TE’ | −TE’| ε
T → FT’
T’→ ∗FT’ | /FT’| ε
F → (E) | nb
La construction de la table d’analyse du grammaire G revient à
l’application des 3 étapes suivantes :
2. Analyse descendante

●
1. Calcul du PREMIER
PREMIER(E) = {(,nb}
PREMIER(E’) = {+,-,ε}
PREMIER(T) = {(,nb}
PREMIER(T’) = {*,/,ε}
PREMIER(F) = {(, nb}
●
2. Calcul du SUIVANT
SUIVANT(E) = {$,)}
SUIVANT(E’) = {$,)}
SUIVANT(T) = {+,-, $,)}
SUIVANT(T’) = {+,-, $,)}
SUIVANT(F) = {*,/,+,-,$,)}
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E
E’
T
T’
F
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E E→TE’
E’
T
T’
F
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E E→TE’ E→TE’
E’
T
T’
F
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E E→TE’ E→TE’
E’ E’→+TE E’→-TE
T
T’
F
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E E→TE’ E→TE’
E’ E’→+TE E’→-TE E’→ε E’→ε
T
T’
F
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E E→TE’ E→TE’
E’ E’→+TE E’→-TE E’→ε E’→ε
T T→FT’ T→FT’
T’
F
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E E→TE’ E→TE’
E’ E’→+TE E’→-TE E’→ε E’→ε
T T→FT’ T→FT’
T’ T’→*FT’ T’→/FT’
F
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E E→TE’ E→TE’
E’ E’→+TE E’→-TE E’→ε E’→ε
T T→FT’ T→FT’
T’ T’→ε T’→ε T’→*FT’ T→/FT’ T’→ε T’→ε
F
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E E→TE’ E→TE’
E’ E’→+TE E’→-TE E’→ε E’→ε
T T→FT’ T→FT’
T’ T’→ε T’→ε T’→*FT’ T→/FT’ T’→ε T’→ε
F F→nb
2. Analyse descendante
3. Construction de la table d’analyse

nb + - * / ( ) $
E E→TE’ E→TE’
E’ E’→+TE E’→-TE E’→ε E’→ε
T T→FT’ T→FT’
T’ T’→ε T’→ε T’→*FT’ T→/FT’ T’→ε T’→ε
F F→nb F→(E)
2. Analyse descendante
●
Analyse Syntaxique

Nous allons voir maintenant, comment utiliser la table

d’analyse et plus particulièrement le tableau M , relative à
une grammaire G, pour décider si un mot m peut être
généré par la grammaire G. Pour ce faire, on a besoin
d’une pile pour empiler les symboles. En fait, ayant une
pile contenant initialement les symboles $ et S (en
sommet de pile) et un pointeur ps sur la première lettre de
m, l’analyse syntaxique revient à l’application de la boucle
répéter suivante :
Ainsi, le mot m = id + id ∗id peut être généré par la grammaire G,
puisque l’analyse syntaxique a réussie. Ceci correspond à la génération
descendante de l’arbre suivant :
Récupération sur erreur
Quand on distingue une erreur ?
Une erreur provient dans une analyse syntaxique prédictive non
récursive lorsque :
1- nous avons un symbole non terminal A en sommet de pile et un
symbole a en entrée et M[A, a] = ∅
2 - le symbole terminal sommet est différent du symbole en entrée.
Récupération sur erreur
Une erreur peut être récupérée :
1 - en mode panique : l’analyseur saute les symboles en entrée
jusqu’à ce qu’apparaisse une unité lexicale appartenant à un
ensemble sélectionné d’unités lexicales de synchronisation
2 - au niveau du syntagme : l’analyseur exécute des routines
d’erreurs qui remplacent, insèrent ou suppriment des symboles
d’entrée et émettre des messages d’erreur.
Récupération sur erreur en mode panique

1 Nous avons un symbole non terminal A en sommet de pile et un

symbole a en entrée et M[A, a] = ∅ :

a - On est au début de l’analyse alors sauter jusqu’à premier(A) dans

l’espoir de continuer avec A
b - On n’est pas au début de l’analyse alors sauter jusqu’à suivant(A)
et dépiler A dans l’espoir de continuer avec les suivants de A

2 Nous avons un symbole terminal a en sommet de pile et un symbole b

en entrée et a ̸= b

On dépile le sommet a et on informe l’utilisateur par a manquant

Grammaires LL(1)

Si la table prédictive est multi définie c à d que si une case

occupée par plus d’une règle on dit que la grammaire n’est pas
LL(1) Left-to-right scanning, Leftmost derivation, use 1 symbol
lookahead

Le premier L signifie : parcours de l’entrée de gauche à droite

(Left to right Scanning).
Le deuxième L signifie : dérivation gauche (Left most
derivation)
le 1 signifie qu’on utilise un seul symbole de prévision.
Exemple

soit p= { S→ aAb , A→ cd |c }

Nous avons Premier (S)= {a} , Premier (A)= {c} , Suivant (S)= {$} ,
Suivant (A)= {b} , ce qui donne la table d’analyse :

Cette grammaire
n’est pas LL(1)
Il y a deux réductions pour la case M[A, c], donc ce n’est
pas une grammaire LL(1) On ne peut pas utiliser cette
méthode d‘analyse, pour pouvoir choisir entre la
production A →cd et la production A →c, il faut lire la lettre
qui suit celle que l’on pointe (donc deux symboles de
prévision sont nécessaires).
Grammaires LL(1)

Conditions nécessaires pour q’une Grammaire Soit LL(1) :

Théorème :
Une grammaire ambiguë ou récursive à gauche n‘est pas
LL(1)
Définition d’une grammaire LL(1)

Une grammaire est dite LL(1) si et seulement si elle vérifie

les conditions suivantes :
Pour toutes paire de règles de production A→α|β

Premier(α) ∩ Premier(β) = ∅

α→*ε ou bien β→*ε mais pas les deux.

Si α→*ε alors Premier(β)∩ Suivant(A) = ∅
3. Limites de l’analyse descendante

Cela dit certaines grammaires ne pourront pas s’analyser de

manière descendante quel que soit le nombre d’unités
lexicales lues en avance.
4. Approche ascendante pour l’analyse syntaxique

Principe
●
Construire l’arbre de dérivation en démarrant des unités
lexicales (feuilles) d’une chaîne jusqu’à arriver à la racine
(axiome de départ)
●
Des réductions successives jusqu’à retrouver l’axiome de
départ de la grammaire.
●
On procède à la réduction des symboles on allant de
gauche à droite.
●
Parfois plusieurs règles peuvent être utilisées pour réduire
une suite de symboles.
Réduction

Une réduction est une dérivation prise dans le sens inverse :

●
On remplace une séquence de terminaux et/ou non-
terminaux par un non-terminal.
●
La séquence doit être reconnue par la partie droite d’une
production.
Exemple

m = abbaab On va commencer par les

S→AB|SAB feuilles et essayer de remonter
A→a|aab jusqu’à trouver l’axiome de
départ
B→b|bba
Exemple

m = abbaab On va commencer par les

S→AB|SAB feuilles et essayer de remonter
A→a|aab jusqu’à trouver l’axiome de
départ
B→b|bba
Exemple

m = abbaab On va commencer par les

S→AB|SAB feuilles et essayer de remonter
A→a|aab jusqu’à trouver l’axiome de
On réduit départ
B→b|bba aàA
Exemple

m = abbaab On va commencer par les

S→AB|SAB feuilles et essayer de remonter
A→a|aab jusqu’à trouver l’axiome de
On réduit départ
B→b|bba bba à B
Exemple

On a réussi à retrouver la racine après une série de

réductions. Donc l’expression ‘’abbaab’’ est reconnue par la
grammaire.
Analyse par décalage-réduction
Manche
Informellement, un manche d’une chaı̂ ne est une sous-chaı̂ ne qui
correspond à la partie droite d’une production et dont la réduction
vers le non terminal de la partie gauche de cette production
représente une étape le long de la dérivation droite inverse.
Formellement, un manche d’une proto-phrase droite γ est une
production A → β et une position dans γ où la chaı̂ ne β peut être
trouvée et remplacée par A pour produire la proto-phrase droite
précédente dans une dérivation droite de γ. Autrement :
Si S ⇒d α A ω ⇒d αβω
Alors, A → β dans la position qui suit α est un manche de αβω
On dit aussi que β est un manche pour αβω
Analyse par décalage-réduction
Illustration d’un Manche
Considérons la grammaire suivante :
E → E + E| E * E|(E)
E → id
Une dérivation droite est :
E⇒E+E
⇒E+E∗E
⇒ E + E * id3
⇒ E + id2 * id3
⇒ id1 + id2 * id3
●
id1 est un manche de la proto-phrase droite id1+id2*id3 car id est
la partie droite de la production E→ id et le remplacement de id1
par E produit la proto-phrase droite précédente E + id2 * id3.
●
La séquence de réductions réduit id1 + id2 * id3 vers l’axiome E
Analyse ascendante par décalage-réduction
Les opérations de base de l’analyseur :
(1) décaler, (2) réduire, (3) accepter et (4) erreur.
(1) Dans une action décaler, le prochain symbole du tampon
d’entrée est enlevé du tampon et placé en sommet de la pile.
(2) Dans une action réduire, l’analyseur sait que l’extrémité de la
partie droite du manche est dans la pile et décide par quel non-
terminal remplacer le manche
(3) Dans une action accepter, l’analyseur s’arrête et annonce la
réussite finale de l’analyse.
(4) Dans une action erreur, l’analyseur découvre qu’une erreur de
syntaxe s’est produite et appelle une routine de récupération sur
erreur.
Analyse ascendante par décalage-réduction
Implantation de l’analyse à l’aide d’une pile
Nous utilisons une pile pour conserver les symboles grammaticaux
et un tampon d’entrée qui contient la chaı̂ ne β à analyse.
Le symbole $ est utilisé pour marquer le fond de la pile et
l’extrémité droite du tampon d’entrée.
Algorithme par Décalage/Réduction (Shift/Reduce)
1 - Initialement, la pile contient $ et l’entrée contient ω$
2 - A chaque étape, l’analyseur décale un ou plusieurs symboles
(action décaler) jusqu’à ce qu’un manche apparaı̂ t au sommet de la
pile.
3 - Une action réduire est alors réalisée en remplaçant le manche
par la partie gauche de la règle de production associée.
Analyse ascendante par décalage-réduction
●
Exemple : on utilisant une pile, vérifier que la séquence aabbac est
valide par rapport à la grammaire
S→aaSSac| b
Pile Entrée Action
$ aabbac$
Analyse ascendante par décalage-réduction

S→aaSSac| b
Pile Entrée Action
$ aabbac$ Décalage
Analyse ascendante par décalage-réduction

S→aaSSac| b
Pile Entrée Action
$ aabbac$ Décalage
$a abbac$ Décalage
Analyse ascendante par décalage-réduction

S→aaSSac| b
Pile Entrée Action
$ aabbac$ Décalage
$a abbac$ Décalage
$aa bbac$ Décalage
Analyse ascendante par décalage-réduction