7analyse 3 Cours 02
7analyse 3 Cours 02
y.c
em
Cours d’Analyse 3
ad
Fonctions de plusieurs variables
c
oa
all
w.
ww
sin(x2 +3y 2 )
F IGURE 1 – Représentation de la fonction f : R2 7→ R définie par (x, y) 7→ z = 0.1+r2 +
exp(1−r2 ) p
(x2 + 5y 2 ) · 2
, avec r = x2 + y 2 , et projection des courbes de niveau sur les plans
z = 0 et z = 9.
1
m
Préambule
o
y.c
Le but de ce cours est de généraliser la notion de dérivée d’une fonction d’une variable réelle
à valeurs réelles à partir de la théorie du calcul différentiel appliquée aux fonctions de plusieurs
variables. L’idée fondamentale de cette théorie est d’approcher une application “quelconque” (de
plusieurs variables réelles ici) par une application linéaire au voisinage d’un point.
em
Le cadre général pour la mettre en œuvre est celui des espaces vectoriels (ce qui donne un sens
au mot "linéaire" comme nous le verrons dans les chapitres qui suivent), munis d’une norme sur
l’espace de départ (pour avoir une notion de voisinage) et une norme sur l’espace d’arrivée (pour
savoir "approcher").
Nous verrons que de cette théorie découle plusieurs propriétés et théorèmes classiques importants
ainsi que plusieurs applications notamment pour l’optimisation (voir le dernier chapitre du cours).
ad
Toutefois, avant de s’attaquer au calcul différentiel proprement dit, il paraît nécessaire de bien
définir les notions de bases en topologie associées à cette théorie, à savoir :
- les distances, boules ouvertes, fermées,
- les ensembles ouverts, fermés, les normes, etc.
c
Nous ne le ferons pas dans le contexte des espaces vectoriels de dimension infinie (hors pro-
gramme), mais dans le cas particulier des espaces Rn (et le plus souvent les espaces où R2 et R3 )
oa
2
o m
y.c
Table des matières
em
1 Notion de topologie dans Rn 5
1.1 Espaces métriques, distance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Normes des espaces vectoriels . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.3 Boules ouvertes, fermées et parties bornée . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Ouverts et fermés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5 Position d’un point par rapport à une partie de E . . . . . . . . . . . . . . . . . . 14
ad
1.6 Suites numériques dans un espace vectoriel normé . . . . . . . . . . . . . . . . . . 18
1.7 Ensemble compact . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.8 Ensemble convexe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.9 HORS PROGRAMME : Applications d’une e.v.n. vers un e.v.n. . . . . . . . . . 23
1.9.1 Généralités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
c
1.9.2 Opérations sur les fontions continues . . . . . . . . . . . . . . . . . . . . 24
1.9.3 Extension de la définition de la continuité . . . . . . . . . . . . . . . . . . 25
oa
3 Calcul différentiel 41
3.1 Dérivées partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.2 Opérateurs différentiels classiques . . . . . . . . . . . . . . . . . . . . . . . . . . 43
ww
3.2.1 Gradient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
3.2.2 Divergence . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2.3 Rotationnel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.3 Propriétés des dérivées partielles . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.4 Notion de différentiabilité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.5 Opérations sur les fonctions différentiables . . . . . . . . . . . . . . . . . . . . . . 50
3.6 Propriétés géométriques des fonctions de plusieurs variables . . . . . . . . . . . . 51
3
m
TABLE DES MATIÈRES TABLE DES MATIÈRES
o
3.6.2 Le gradient indique la ligne de plus grande pente . . . . . . . . . . . . . . 52
3.6.3 Plan tangent à un graphe d’une fonction de 2 variables . . . . . . . . . . . 53
y.c
4 Théorème des accroissements finis 55
4.1 Fonction d’une variable réelle à valeurs réelles . . . . . . . . . . . . . . . . . . . . 56
4.2 Fonction d’une valeur sur un espace Rp et à valeurs réelles . . . . . . . . . . . . . 56
4.3 Fonction d’une variable réelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.4 Théorème général . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4.5 Application . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
em
5 Difféomorphismes 61
5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
5.2 Théorème d’inversion locale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.3 Théorème des fonctions implicites . . . . . . . . . . . . . . . . . . . . . . . . . . 63
6 Formules de Taylor
ad
6.1 Applications deux fois différentiables . . . . . . . . . . . . . . . . . . . . . . . .
67
68
6.2 Exemples de différentielles d’ordre 2 . . . . . . . . . . . . . . . . . . . . . . . . . 69
6.3 Matrice Hessienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.4 Différentielle d’ordre k . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
6.5 Formule de Taylor avec reste intégral . . . . . . . . . . . . . . . . . . . . . . . . . 73
c
6.5.1 Fonction d’une variable réelle à valeur réelle . . . . . . . . . . . . . . . . 73
6.5.2 Fonction d’une variable réelle à valeurs dans Rq . . . . . . . . . . . . . . . 73
oa
7 Extrema 79
7.1 Rappels d’algèbre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
7.2 Extrema libres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
7.2.1 Condictions nécessaires du premier ordre . . . . . . . . . . . . . . . . . . 82
w.
4
o m
y.c
Chapitre 1
em
c ad
(a) Leonhard Euler (b) Maurice René (c) Johann Bene-
(1707-1783) : en Fréchet (1878-1973) : dict Listing (1808-
oa
à développer la
théorie liée à cette
discipline.
Nous allons donc définir de nouvelles notions : distances, normes, ouverts, fermés, etc. dans les
o
domaines inclus dans Rn qui nous seront utiles tout au long de ce semestre pour tous les nouveaux
outils abordés.
y.c
Toutefois, même si nous travaillerons principalement dans R2 , R3 ou de façon générale Rn , nous
pourrons de temps à autre donner des résultats plus généraux qui resteront valables dans des es-
paces autres que ceux-ci (ce sera le cas de ce premier chapitre). Mais ce ne seront pas n’importe
quels espaces. Les définitions et propositions ci-dessous font en effet intervenir des combinaisons
entre eux des éléments d’un même espace, des multiplications par des scalaires, etc. Par consé-
quent il est nécessaire que cet espace reste stable par combinaison linéaires de ses éléments, et les
em
plus appropriés ici seront les espaces vectoriels que nous rappelons ci-dessous.
Exemple .
L’espace
w.
Rn = R
| × {z
... × R}
n−f ois
= {x = (x1 , ..., xn ), tel que xi ∈ R, pour tout i ∈ {1, ..., n}}.
ww
Rn est un espace vectoriel de dimension n. C’est celui que nous utiliserons le plus souvent ici.
Une fois donné l’espace vectoriel, il faut pouvoir évaluer ses éléments les uns par rapport aux
autres. D’où la notion de distance.
6
m
Notion de topologie dans Rn 1.1 Espaces métriques, distance
o
Soit E un ensemble non vide (on utilisera le plus souvent Rn ici). On dit qu’une applica-
y.c
tion
d : E × E → R+ ,
(x, y) 7→ d(x, y),
est une distance sur E si elle vérifie
1. (SEPARATION) pour tout (x, y) ∈ E × E, {x = y} ⇐⇒ {d(x, y) = 0},
2. (SYMETRIE) pour tout (x, y) ∈ E × E, d(x, y) = d(y, x),
em
3. (INEGALITE TRIANGULAIRE) pour tout (x, y, z) ∈ E × E × E,
ad
Définition 1.3 (ESPACE METRIQUE)
On appelle espace métrique tout couple (E, d) où E 6= ∅ est un espace vectoriel et d est
une distance.
c
Exemple .
oa
X
d1 (x, y) = |xi − yi |.
i=1
Xn
d2 (x, y) = ( |xi − yi |2 )1/2 .
i=1
n
X
dp (x, y) = ( |xi − yi |p )1/p .
i=1
7
m
1.1 Espaces métriques, distance Notion de topologie dans Rn
o
y.c
em
ad
F IGURE 1.2 – Représentation de trois distances. 1. Plan de Manhattan qui, par ses rues quadrillées a
donné son nom à la distance de Manhattan. 2. Cette distance est représentée en bleu, jaune et rouge
c
dans la figure 2. On peut noter que la distance euclidienne dans cette figure est représentée en vert
et correspond a la somme des diagonales des petits carrés (d’après le théorème de Pythagore). 3.
oa
Enfin dans la figure 3, est représentée la distance infinie qui correspond au nombre minimum de
mouvements nécessaire au roi pour se déplacer de sa case (ici f6) à une autre case.
all
Il est à noter que la distance de Manhattan est la distance de Minkowski pour p = 1, la distance
Euclidienne est la distance de Minkowski pour p = 2 et la distance de Thcebychev est la distance de
Minkowski quand p 7→ ∞. Voir figure 1.2 pour une illustration des différentes distances abordées
dans cet exemple.
w.
ww
Pour rendre le cours plus simple, nous utiliserons plutôt la notion de norme dans tout le reste
de notre cours, et les espaces vectoriels normés plutôt que les espaces métriques. Il se trouve que
toute norme induit une distance (mais attention tout distance induit n’induit pas nécessairement une
norme). Donc ce qui va suivre peut s’adapter parfaitement dans le cadre des espaces métriques, tout
en étant plus facilement compréhensible.
8
m
Notion de topologie dans Rn 1.2 Normes des espaces vectoriels
o
Définition 1.4 (NORME)
y.c
Soit E un espace vectoriel sur R (on utilisera en général E = Rn ). On appelle norme sur
E une application
E → R+ ,
x 7→ kxk,
et vérifie
em
1. (SEPARATION) pour tout x ∈ E, kxk = 0 ⇐⇒ x = 0,
2. (HOMOGENEITE POSITIVE) pour tout λ ∈ R, pour tout x ∈ E kλxk = |λ|.kxk,
3. (INEGALITE TRIANGULAIRE) pour tous x, y ∈ E, kx + yk ≤ kxk + kyk.
d : E × E → R+ ,
(x, y) 7→ d(x, y) := kx − yk,
all
est une distance sur E. On l’appelle DISTANCE INDUITE sur E par la NORME.
o
Soient x ∈ Rn , x = (x1 , ..., xn ), avec xi ∈ R pour tout i ∈ {1, ..., n}, et p ∈ R tel que p ≥ 1,
n
y.c
X
1. kxk1 = |xi | (NORME MANHATTAN),
1
Xn
2. kxk2 = ( |xi |2 )1/2 (NORME EUCLIDIENNE),
1
Xn
3. kxkp = ( |xi |p )1/p (NORME p, p ≥ 1),
em
1
4. kxk∞ = max |xi | (NORME INFINIE),
1≤i≤n
sont des normes sur Rn .
Proposition 1.8 (PROPRIETE DES NORMES)
Toute norme k.k dans un e.v.n (E, k.k) vérifie, pour tous x, y ∈ E
c ad
|kxk − kyk| ≤ kx − yk.
Deux normes k.k et k.k0 sur E sont EQUIVALENTES s’il existe deux constantes réelles
λ > 0 et µ > 0 telles que pour tout x ∈ E
Proposition 1.10
Sur Rn (et tout autre espace vectoriel normé de dimension finie) TOUTES les normes
sont équivalentes.
10
m
Notion de topologie dans Rn 1.3 Boules ouvertes, fermées et parties bornée
o
Remarque . Dans la suite du cours on notera donc (sauf précision) k.k pour désigner une norme
y.c
quelconque sur Rn .
Nous nous plaçons désormais dans des espaces vectoriels normés (E, k.k). En général nous pren-
drons E = Rn . Il nous faudra ensuite nous approcher d’un élément de cet espace et regarder ce
qu’il se passe autour de lui (comme par exemple, le définir comme la limite d’une suite d’éléments
de l’espace métrique). Il nous faudra donc définir la notion de voisinage. Et les outils que nous
em
utiliserons ici sont les boules.
Dans le cas où a = 0 (vecteur nul) et r = 1 on a ce qu’on appelle les boules ou sphères unités.
Remarque . Dans la suite et pour éviter les lourdeurs d’écriture nous ne mettrons pas la norme
ww
en indice et nous écrirons juste B(a, r), B(a, r), et S(a, r) lorsque l’on désignera respectivement
la boule fermée, ouverte ou la sphère de centre a et de rayon r pour une norme k.k quelconque. Si
jamais la norme devait être spécifiée, nous l’ajouterons alors en indice.
Remarque . ATTENTION : les boules ont des formes différentes selon les espaces métriques
utilisés. Voir un exemple dans R2 pour la distance euclidienne dans la figure 1.3, ou la figure 1.4
pour des distances p, où p = 0.5, 1, 2, 4 et ∞.
11
m
1.3 Boules ouvertes, fermées et parties bornée Notion de topologie dans Rn
o
y.c
em
F IGURE 1.3 – Exemples sur R2 avec la norme euclidienne d’une boule fermée (1.), ouverte (2.), et
d’une sphère (3.) centrée en a et de rayon r.
c ad
oa
all
F IGURE 1.4 – Exemples sur R2 avec la norme de Minkowski p de la sphère unité (centrée en 0
et de rayon 1, avec p = 1, 2, 4 et ∞). Le cas p = 0.5 est à part puisqu’on rappelle que k.kp avec
w.
0 < p < 1 n’est pas une norme sur Rn ). On dessine juste l’ensemble {x ∈ Rn , kxk0.5 = 1}
Soit (E, k.k) un e.v.n. Une partie bornée P de E est une partie de E pour laquelle on
peut trouver une boule (ouverte ou fermée) qui contient tous les points de P (voir figure
1.5 pour un exemple).
12
m
Notion de topologie dans Rn 1.4 Ouverts et fermés
o
y.c
em
ad
F IGURE 1.5 – Exemples sur R2 de partie bornée, avec la norme euclidienne.
que pour tout x ∈ U , il existe r > 0 réel, tel que B(x, r) ⊂ U . Autrement dit, tout point
de U est le centre d’une boule ouverte de rayon non-nul, incluse dans U (voir figure 1.6
pour un exemple).
all
Soit (E, k.k) un e.v.n. Une partie fermée (ou un fermé) de E est une partie telle que son
w.
o
y.c
em
ad
F IGURE 1.6 – Exemples sur R2 de partie ouverte, avec la distance euclidienne.
o
y.c
em
ad
F IGURE 1.7 – Exemples sur R2 de voisinage V de x, avec la norme euclidienne.
Soit (E, k.k) un e.v.n. Soit A ⊂ E une partie quelconque de E. Alors A contient au-moins un
ouvert (en effet ∅ ⊂ A). [
Soit OA l’ensemble de toutes les parties ouvertes de E contenues dans A. Alors P est un
c
P ∈OA
ouvert (comme réunion de parties quelconques d’ouverts).
oa
Soient (E, k.k) un e.v.n. et A ⊂ E. L’intérieur de A est la plus grande partie ouverte
incluse dans A.
ww
Remarque . On a :
◦
1. A est un ouvert,
15
m
1.5 Position d’un point par rapport à une partie de E Notion de topologie dans Rn
◦
2. A ⊂ A,
o
◦
3. A est un ouvert ⇐⇒ A = A.
y.c
Preuve : (3.) fait en cours.
Soit (E, k.k) un e.v.n. Soit A une partie quelconque de E. Alors E contient au-moins une partie
fermée contenant A (en effet E est fermé). \
Soit F l’ensemble des parties fermées contenant A. Alors F est la plus petite partie fermée
em
\ F ∈F
contenant A. Et F est bien une partie fermée (comme intersection de familles fermées).
F ∈F
Soient (E, k.k) un e.v.n. et A ⊂ E. Un point x de E est dit adhérent à A si tout voisinage
ad
de x rencontre A , autrement dit, si toute boule ouverte contenant x contient au-moins un
élément de A.
L’adhérence de A ⊂ E, notée A ou adh(A), est l’ensemble des points adhérents à A.
c
Proposition 1.23 (PROPRIETE DE L’ADHERENCE)
Soient (E, k.k) un e.v.n. et A ⊂ E. L’adhérence de A est la plus petite fermée contenant
oa
\
Remarque . On a x ∈ A = F.
F ∈F
Remarque . On a :
1. A est un fermé,
2. A ⊂ A,
w.
3. A est un fermé ⇐⇒ A = A.
Preuve : (3.) fait en cours.
16
m
Notion de topologie dans Rn 1.5 Position d’un point par rapport à une partie de E
o
Définition 1.25 (FRONTIERE)
y.c
Soit (E, k.k) un e.v.n. On appelle frontière de A ⊂ E, notée F r(A) l’ensemble défini
◦
par F r(A) = A − A.
On dit que x est un point frontière de A si et seulement si x ∈ F r(A).
em
Proposition 1.26 (INTERSECTION OUVERT ET FERME)
A ∩ P 6= ∅ ⇐⇒ A ∩ P 6= ∅
ad
Preuve : Faite en cours.
◦
1. x ∈ A ⇐⇒ il existe r > 0, tel que B(x, r) ⊂ A,
2. x ∈ A ⇐⇒pour tout r > 0, B(x, r) ∩ A 6= ∅,
3. x ∈ F r(A) ⇐⇒pour tout r > 0, B(x, r) ∩ A 6= ∅ et B(x, r) ∩ {E A 6= ∅.
all
Maintenant que les notions de bases qui nous intéressent sont établies, nous pouvons nous inté-
resser à des outils qui nous seront utiles dans certaines preuves du cours : les suites et la notion
d’ensemble compact.
17
m
1.6 Suites numériques dans un espace vectoriel normé Notion de topologie dans Rn
o
Dans cette section, nous nous plaçons (sauf exception spécifiée) dans un (E, k.k) un e.v.n
y.c
quelconque.
em
n 7→ xn .
L’ensemble des suites bornées dans un espace vectoriel normé est un espace vectoriel.
all
Soit (xn )n∈N , une suite de E muni de la norme k.k. On dit que (xn )n∈N converge dans
(E, k.k), si et seulement s’il existe l ∈ E, tel que pour tout ε > 0, il existe N ∈ N, tel
que pour tout n ≥ N , kxn − lk < ε.
ww
o
L’ensemble des suites convergentes dans un espace vectoriel normé est un espace vecto-
y.c
riel.
em
Sur Rn , comme toutes les normes sont équivalentes , toute suite convergente pour l’une
des normes est convergente pour l’autre.
Soit A ⊂ E. On dit que (xn )n∈N est une suite de points de A si et seulement si pour tout
n ∈ N, xn ∈ A.
c
oa
Si (xn )n∈N est une suite de points de A et (xn )n∈N converge vers l, alors l ∈ A.
all
Soit A ⊂ E, alors A est fermé si et seulement TOUTE suite de points de A qui converge
a sa limite qui appartient à A.
Soit (xn )n∈N une suite de E. On dit que (xn )n∈N est une suite de Cauchy si et seulement
si pour tout ε > 0, il existe N ∈ N, tel que pour tous n, m ≥ N , kxn − xm k < ε.
19
m
1.6 Suites numériques dans un espace vectoriel normé Notion de topologie dans Rn
o
Si une suite est convergente alors elle est de Cauchy.
y.c
Preuve : Faite en cours.
Remarque . ATTENTION : la réciproque n’est pas vraie en général. Par contre, le fait de tra-
vailler sur un espace où la réciproque est vraie serait bien pratique. En effet nous pourrions mon-
em
trer la convergence d’une suite sans avoir à calculer la limite de cette suite. Les espaces dont la
réciproque de la propriété ci-dessus.
Si dans un ensemble, toute suite de Cauchy est convergente, on dit que l’ensemble est
complet.
ad
Remarque .
– Tout espace vectoriel normé complet est appelé espace de Banach.
c
– Les e.v.n. (Rn , k.k) dans lesquels nous travaillerons pratiquement tout le temps, sont des
espaces de Banach. Donc toute suite de Cauchy dans ces espaces sera convergente.
oa
p
X
1 2 p p
existe un unique p-uplet (x , x , .., x ) ∈ R tel que x = xi ei .
i=1
Pour tout n ∈ N, on aura donc (un élément d’une suite par exemple qui s’écrit)
w.
p
X
xn = xn i ei .
i=1
Soit (xn )n∈N une suite convergente vers l = (l1 , ...., lp ) dans (Rp , k.k). Alors
lim xn = l ⇐⇒ lim xn = li ,
n→+∞ n→+∞
20
m
Notion de topologie dans Rn 1.7 Ensemble compact
o
La notion de compacité sera utile dans la théorie de fonctions de plusieurs variables. Il est donc utile
y.c
de la rappeler ici. Et pour la définir, nous utilisons les sous-suites, d’où l’intérêt d’avoir rappeler
quelques résultats sur les suites dans la section précédente. Encore une fois, dans tout ce qui suit,
nous nous placerons dans l’e.v.n. (E, k.k).
em
Soient (xn )n∈N une suite de E et ϕ : N → N une application strictement croissante, alors
la suite (xϕ(n) )n∈N définie pour tout n ∈ N est appelée suite extraite ou sous-suite de la
suite (xn )n∈N .
1. De toute suite de points de A on peut extraire une sous-suite qui converge vers un
point de A.
2. De tout recouvrement ouvert de A on peut extraire un sous-recouvrement fini.
ww
Une partie A qui vérifie une de ces deux propriétés est un COMPACT.
21
m
1.8 Ensemble convexe Notion de topologie dans Rn
o
Soit A ⊂ E. Si A est FERME et BORNE dans E on dit qu’il est COMPACT.
y.c
Remarque . ATTENTION : on a toujours la propriété suivante :
-Si A est compact alors A est un FERME BORNE.
-MAIS la réciproque n’est pas toujours vraie en dimension infinie (elle l’est TOUJOURS par contre
em
dans Rn (ce qui nous intéresse ici)).
-Nous verrons quels sont les avantages de la compacité un peu plus tard. Notamment la compacité
et la continuité : toute fonction continue sur un compact est uniformément continue (nous verrons
ce que cela veut dire) sur ce compact et toute fonction continue sur un compact admet un minimum
et un maximum.
-On peut également énoncer la propriété suivante grâce à la compacité :
Soit E un espace vectoriel normé de dimension finie n, alors E est ISOMORPHE à Rn (un co-
ad
rollaire à ce résultat nous permettrait de montrer l’équivalence des normes en dimension finie).
chapitre sur les extrema (maxima et minima) de fonctions. Il est donc utile de la rappeler ici dans
cette dernière section.
Soient (E, k.k) et C une partie de E. On dit que C est un convexe si et seulement si pour
tous x, y ∈ C, pour tout λ ∈ [0, 1], on a
λx + (1 − λ)y ∈ C.
w.
ww
22
m
n
Notion de topologie dans R1.9 HORS PROGRAMME : Applications d’une e.v.n. vers un e.v.n.
o
e.v.n.
y.c
1.9.1 Généralités
Cette partie présente des résultats généraux intéressants qui restent hors programme pour la
deuxième année de licence. Cependant ils pourront quand même être très utiles pour les années
suivantes.
em
Soient (E, k.k) et (F, k.k) deux espaces vectoriels normés et U une partie ouverte non vide de
E. On considère l’application f : U → F .
On dit que f est continue sur U si et seulement f est continue en tout point de U .
all
est un ouvert de U .
– f est continue sur U si et seulement si l’image réciproque de tout fermé de F est un
fermé de U .
ww
Si f : (E, k.kE ) → (E, k.kF ) est continue sur U ⊂ E et si k.k∗E ∼ k.kE et k.k∗F ∼
k.kF . Alors f : (E, k.k∗E ) → (E, k.k∗F ) est également continue sur U relativement à ces
nouvelles normes.
23
m
1.9 HORS PROGRAMME : Applications d’une e.v.n. vers un e.v.n.Notion de topologie dans Rn
o
Soit f : U ⊂ E → F continue sur U . Soit (xn )n∈N une suite de points de U convergeant
y.c
vers un point x ∈ U . Alors (f (xn ))n∈N converge vers f (x).
em
Soit f : U ⊂ E → F une application. Si pour toute suite (xn )n∈N convergeant vers
x ∈ U on a la suite (f (xn ))n∈N qui converge vers f (x) alors f est continue en x.
ad
Proposition 1.57 (CONTINUITE ET ADHERENCE)
Soient
f : U ⊂E → F et g : U 0 ⊂ F → G
,
x 7→ f (x) ∈ U, y = f (x) 7→ g(f (x)).
24
m
n
Notion de topologie dans R1.9 HORS PROGRAMME : Applications d’une e.v.n. vers un e.v.n.
o
Définition 1.60 (CONTINUITE RELATIVE)
y.c
Soient f : D ⊂ (E, k.kE ) → (F, k.kF ) avec D 6= ∅ et a ∈ D. On dit que f est continue
en a relativement à D si et seulement si pour tout ε > 0, il existe η > 0, pour tout x ∈ D,
em
Remarque . La notion de continuité relative correspond au fait que la restriction de f à la partie
D de E, noté f |D est continue en a. On notera que f |D peut être continue sans que f soit continue
en un seul point de E (on pourrait par exemple prendre la fonction caractéristique d’une partie
D de E, où D est dense sur E ainsi que son complémentaire. Si cette application est définie de E
dans l’espace discret {0, 1} alors elle n’est continue en aucun de ses points mais sa restriction à
D l’est.
ad
Proposition 1.61 (CONTINUITE RELATIVE ET SUITE)
25
m
1.9 HORS PROGRAMME : Applications d’une e.v.n. vers un e.v.n.Notion de topologie dans Rn
o
Pour tout i = 1, ..., q, fi est continue en a ∈ D relativement à D si et seulement si f est
y.c
continue en a relativement à D.
em
problème de “transfert” des suites de Cauchy. D’où la définition suivante.
Soient f : D ⊂ (E, k.kE ) → (F, k.kF ) avec D 6= ∅. On dit que f est uniformément
continue sur D relativement à D si et seulement si pour tout ε > 0, il existe η > 0, pour
tous x, y ∈ D,
ad
kx − ykE < η =⇒ kf (x) − f (y)kF < ε.
c
Remarque . Pour bien faire la différence entre la continuité simple et la continuité uniforme en
oa
un point x de E, on peut faire la comparaison entre les deux définitions suivantes (sans passer par
la continuité relative pour simplifier les définitions) (qui mettront les choses au clair) :
l’application f est continue de E dans F si et seulement si pour tout x ∈ E, pour tout εx > 0, il
existe ηε,x > 0, pour tout y ∈ E,
all
Et d’autre part
l’application f est uniformément continue de E dans F si et seulement si ε > 0, il existe ηε > 0,
pour tous x, y ∈ E,
w.
26
m
n
Notion de topologie dans R1.9 HORS PROGRAMME : Applications d’une e.v.n. vers un e.v.n.
o
Proposition 1.67 (APPLICATIONS LINEAIRE CONTINUES)
y.c
Soient f : (E, k.kE ) → (F, k.kF ) une application linéaire. Alors les propriétés suivantes
sont équivalentes :
1. f est continue en un point a de E,
2. f est continue en tous points de E,
3. f est bornée sur la boule unité fermée de E,
4. f est bornée sur la sphère unité de E,
em
5. f est bornante, c’est à dire que l’image d’un borné de E est un borné de F .
Soient f : (E, k.kE ) → (F, k.kF ) une application linéaire avec dim E < +∞, alors f
est continue.
ad
Remarque . Cette dernière proposition sera très utile pour nous étant donné que dans ce cours
nous travaillerons principalement en dimension finie. Pour montrer la continuité de f il faudra
c
juste montrer alors f est linéaire.
oa
(E, k.kE ) et (F, k.kF ) deux e.v.n., alors l’ensemble des applications linéaires continues de E vers
F , noté L (E, F ) es un espace vectoriel. Comment normer cet espace ?
27
m
1.9 HORS PROGRAMME : Applications d’une e.v.n. vers un e.v.n.Notion de topologie dans Rn
o
y.c
em
c ad
oa
all
w.
ww
28
o m
y.c
Chapitre 2
em
Continuité.
c ad
oa
à utiliser systématique-
ment les équations aux
dérivées partielles pour
étudier les surfaces.
F IGURE 2.1 – Quelques mathématiciens célèbres liés à l’étude de fonctions de plusieurs variables.
ww
Que sont les fonctions de plusieurs variables ? Dans ce chapitre nous allons étudier les fonc-
tions de plusieurs variables dans des cadres particuliers (R2 ou R3 ), mais également dans un cadre
très général (Rn ). Nous n’étudierons pas le cas encore plus général dans lequel la dimension des
espaces est infinie. Nous laissons cela pour un cours un peu plus avancé. Ces fonctions seront donc
de la forme
f : E ⊂ Rp → F ⊂ Rq ,
29
m
Fonctions de plusieurs variables. Limite. Continuité.
où p et q sont des entiers naturels > 0. Autrement dit, les éléments de l’ensemble de départ E
o
seront des vecteurs du type x = (x1 , ..., xp ), et les éléments de l’ensemble d’arrivée seront des
vecteurs du type f (x) = (f1 (x), ..., fq (x)), où x est un vecteur de E.
y.c
Nous considérons plusieurs cas de fonctions à plusieurs variables, donc voici quelques illustrations
graphiques.
em
2. p = 1, q > 1. f : I ⊂ R → F ⊂ Rq : elles sont représentées par exemple par des courbes
paramétrées (q = 2 ou 3),
3. = p = 2, q = 1. f : E ⊂ R2 → J ⊂ R : elles sont représentées par exemple par des surfaces
(on les appelle également champs scalaires), ou des courbes de niveau,
4. p = 2, q > 1. f : E ⊂ R2 → F ⊂ Rq : elles sont représentées par exemple par des surfaces
paramétriques, ou des champs vectoriels (q = 2 ou 3).
ad
5. p = 3, q = 3. f : E ⊂ R3 → F ⊂ R3 : elles sont représentées par exemple par des champs
vectoriels.
c
oa
all
F IGURE 2.2 – Quelques représentations graphiques illustrant des fonctions de plusieurs variables.
30
m
Fonctions de plusieurs variables. Limite. Continuité. 2.1 Fonctions réelles de variable réelle
o
y.c
F IGURE 2.3 – Représentation du champ de vecteur donné par (x, y, z) 7→ (y/z, −x/z, z/4).
em
Dès que p et q sont > 3, il est assez difficile d’avoir une vision graphique de leur représentation,
mais cela ne veut pas dire qu’il n’y a pas d’interprétation possible. Les variables peuvent représen-
ter bien autre chose que l’espace : cela peut être des populations, des traits caractéristiques (taille,
âge, maturité, gènes,...), etc. Nous essaierons de donner quelques illustrations tout au long de ce
cours.
ad
Dans la suite de ce cours, nous distinguerons parfois des résultats pour deux types bien distincts
de fonctions :
- les fonctions scalaires Rp → R (qu’on appelle aussi fonctions réelles de variables réelles),
-les fonctions vectorielles Rp → Rq , q > 1.
c
ATTENTION : certains résultats seront donnés pour les fonctions scalaires alors que d’autres le
seront pour les fonctions vectorielles.
oa
Soient E un sous-ensemble non vide de Rn et G une partie de E × R telle que pour tout
vecteur x ∈ E, il existe un nombre réel y et un seul tel que le couple (x, y) appartienne
à G. Alors le triplet (f, E, R) s’appelle fonction définie sur E à valeurs dans R.
w.
-on dit que E est l’ensemble de départ de f (ou le domaine de définition), et on le désigne
par D(f ).
-le sous-ensemble {y ∈ R, il existe x ∈ E, f (x) = y} est appelé l’image de E par f et il
est noté Im(f ).
-l’UNIQUE nombre réel y correspondant à l’élément x ∈ E par f s’appelle l’image de
ww
f : E → R.
31
m
2.1 Fonctions réelles de variable réelle Fonctions de plusieurs variables. Limite. Continuité.
o
Soient E un sous-ensemble non vide de R2 et f : E → R une fonction réelle de deux
y.c
variables.
1. L’ensemble des points de R3
em
2. Soit A = (a, b) un point intérieur de E. Les fonctions R → R telles que x → f (x, b)
et y → f (a, y) définies sur des intervalles ouverts contenant respectivement a et b sont
appelées FONCTION PARTIELLES associées à f au point A.
3. Soit k ∈ R. L’ensemble Lk = {(x, y) ∈ E; f (x, y) = k} est appelé LIGNE DE
NIVEAU k de la fonction f .
c ad
oa
all
w.
Remarque . Pour les fonctions de 3 variables, la notion analogue à la ligne de niveau est celle de
la SURFACE de niveau.
32
m
Fonctions de plusieurs variables. Limite. Continuité. 2.2 Notion de limite
o
y.c
em
F IGURE 2.5 – Surfaces de niveau pour illustrer la fonction f : (x, y, z) 7→ f (x, y, z) = x2 +y 2 +z 2 .
ad
Les surfaces de niveaux sont données par l’équation x2 + y 2 + z 2 = a2 , où a = 1, 2, 3 et elles ont
été coupées pour laisser entrevoir les surfaces des différents niveaux.
tel que les relations x ∈ E et 0 < kx − x0 k < η impliquent |f (x) − l| < ε. On écrit alors
lim f (x) = l.
x→x0
ww
Remarque .
1. La notion de limite ici ne dépend pas des normes utilisées.
2. La limite, si elle existe est unique.
3. Nous pouvons généraliser ces définitions aux fonctions de E ⊂ Rp → Rq .
33
m
2.2 Notion de limite Fonctions de plusieurs variables. Limite. Continuité.
o
Une fonction f : E ⊂ Rp → Rq définie au voisinage de x0 admet une limite l lorsque x
tend vers x0 si et seulement si pour toute suite (xn )n∈N d’éléments de {x ∈ E, x 6= x0 }
y.c
qui converge vers x0 , la suite (f (xn ))n∈N converge vers l.
em
Proposition 2.6 (OPERATIONS SUR LES LIMITES)
Soient :
-a ∈ R, b = (b1 , ..., bn ) ∈ Rn et f : E ⊂ Rn → R une fonction telle que pour tout
x = (x1 , ...xn ) ∈ E,
lim f (x) = l,
x→b
w.
-soient g1 , ..., gn : R → R, n fonctions réelles telles que lim gi (t) = bi , pour tout i =
t→a
1, ..., n,
-supposons de plus qu’il existe α ∈ R, α > 0 tel que pour tout t avec 0 < |t − a| < α on
ait (g1 (t), ..., gn (t)) 6= (b1 , ..., bn ) alors,
ww
o
Soit f : R2 → R une fonction telle que lim f (x, y) = l. Supposons de plus que
(x,y)→(a,b)
y.c
pour tout x ∈ R lim f (x, y) existe et que pour tout y ∈ R, lim f (x, y) existe. Alors
y→b x→a
em
Preuve : Pas faite en cours.
x→x0
35
m
2.3 Fonctions continues Fonctions de plusieurs variables. Limite. Continuité.
o
Soit f : E ⊂ Rp → R. Soit a = (a1 , ..., ap ) ∈ E, alors les p fonctions f1 , ..., fp définies
y.c
par
em
Proposition 2.13 (CONTINUITE FONCTIONS PARTIELLES)
Remarque . -ATTENTION :
-en général la réciproque est fausse !
-Soit l ∈ R, si f : R2 → R une fonction telle que pour tout α ∈ R, lim f (x, αx) = l. Peut-on en
x→0
conclure que f est continue au point (0, 0) ? La réponse est non.
all
x0 .
3. enfin, la composée de fonctions continues est continue.
36
m
Fonctions de plusieurs variables. Limite. Continuité. 2.4 Coordonnées polaires
o
Soit f : E ⊂ Rp → F ⊂ Rq une fonction continue. Les propriétés suivantes sont
y.c
équivalentes
1. f est continue en tout point de E,
2. pour tout ouvert U de F , f −1 (U ) est un ouvert de E.
3. pour tout fermé V de F , f −1 (V ) est un fermé de E.
4. pour toute suite (xn )n∈N de E convergeant vers x0 , la suite (f (xn )n∈N converge vers
f (x0 ) pour tout x0 ∈ E.
em
Preuve : Pas faite en cours.
on peut définir une application bijective de R∗+ × [0, 2π[ vers R2 donnée par les formules
suivantes :
R∗+ × [0, 2π[ → R2 \ {0, 0}
(r, θ) 7→ (x, y) = (r cos(θ), r sin(θ)),
Son application réciproque est l’application suivante :
all
arctan(x/y) si x > 0 et y ≥ 0,
arctan(x/y) + 2π si x > 0, et y < 0,
arctan(x/y) + π si x < 0,
θ= π
si x = 0 et y > 0,
ww
2π
−
si x = 0 et y < 0.
2
Donc en particulier, on a r2 = x2 + y 2 .
Dans certains exemples d’étude de continuité des fonctions, il est utile de passer aux coordonnées
polaires : en effet, la condition sur deux variables (x, y) → 0 devient une condition sur une seule
variable r → 0 et prouver la continuité d’une fonction devient plus facile (voir les exemples du
37
m
2.5 Continuité sur un compact Fonctions de plusieurs variables. Limite. Continuité.
cours).
o
On aurait également pu considérer θ sur l’intervalle ] − π, π] au lieu de [0, 2π[ mais alors il aurait
fallu changer la fonction réciproque arctan...(à faire en exercice).
y.c
Exemple . Voir en cours.
em
Définition 2.17 (EXTREMA DE FONCTIONS A VALEURS SUR R)
Une fonction continue sur un compact est bornée et atteint ses bornes.
ww
38
m
Fonctions de plusieurs variables. Limite. Continuité. 2.6 Théorème des valeurs intermédiaires
o
Définition 2.20 (ARC CONTINU)
y.c
On dit qu’une partie Γ de Rp est un arc continu si on peut trouver une application continue
γ : [a, b] ⊂ R → Rp dont l’image soit Γ. L’application γ est appelée un paramétrage de
Γ. Les points de Γ, A = γ(a) et B = γ(b) s’appellent les extrémités de Γ.
em
Remarque . ATTENTION :
1. Γ est un objet géométrique tandis que γ, fonction continue, est un objet analytique.
Un arc continu admet une infinité de paramétrages possibles.
2. Ne pas confondre ensemble CONVEXE et ensemble CONNEXE. Dans un ensemble CONVEXE,
le segment reliant deux points de cet ensemble doit se trouve en entier dans cet ensemble.
Tandis qu’un ensemble CONNEXE (ensemble “en un seul morceau” peut ne pas être CONVEXE
F IGURE 2.6 – Exemples sur R2 d’un ensemble CONVEXE E à gauche et d’un ensemble
w.
Soit E un sous-ensemble de Rp . On dit que E est connexe par arc si étant donnés deux
points arbitraires A et B de E on peut trouver un arc continu Γ, d’extrémités A, et B
entièrement contenu dans E.
39
m
2.6 Théorème des valeurs intermédiaires Fonctions de plusieurs variables. Limite. Continuité.
o
y.c
F IGURE 2.7 – Exemples sur R2 d’un arc continu dans un ensemble E ⊂ R2
em
Exemple .
1. Dans E = R, tous les intervalles I sont connexes par arc.
2. R∗ n’est pas connexe par arc.
3. Les ensembles convexes sont connexes par arc.
ad
4. Les boules étant convexes, elles sont connexes par arc.
5. La réunion de deux connexes par arc non disjoints est connexe par arc.
Voir une illustration de connexité par arc sur la figure 2.8.
c
oa
all
w.
F IGURE 2.8 – Exemples sur R2 de partie connexe par arc E et de partie non connexe par arc
E1 t E2 .
40
o m
y.c
Chapitre 3
Calcul différentiel
em
c ad
(a) Pierre de Fermat (b) Charles Gustave Jacob (c) Hermann Schwarz
oa
41
m
3.1 Dérivées partielles Calcul différentiel
o
du type du rappel précédent n’a pas de sens parce que l’on ne peut pas diviser par un vecteur.
Par contre, si on fixe toutes les composantes du vecteur x sauf une, on peut définir les dérivées
y.c
partielles de cette fonction f de la façon suivante.
em
∂xi
de f prise en ai
∂f f (a1 + h, a2 ) − f (a1 , a2 )
(a1 , a2 ) = lim ,
∂x1 h→0 h
c
et,
∂f f (a1 , a2 + k) − f (a1 , a2 )
(a1 , a2 ) = lim .
oa
∂x2 k→0 k
On les note parfois fx0 1 (a1 , a2 ) et fx0 2 (a1 , a2 ).
all
Remarque . Si f : E ⊂ Rp →
Rq ce sont les composantes fj de f pour j = 1, ..., q qui admettent p dérivées partielles. Nous le
verrons un peu plus bas dans la définition de la matrice jacobienne.
Remarque . Attention : une fonction peut posséder des dérivées partielles en un point sans pour
w.
autant être continue en ce point ! C’est pour cela que l’on donne la condition suffisante suivante
pour qu’une fonction soit continue en un point
∂f
Soit f : E ⊂ Rp → R une fonction continue telle que les p fonctions , i = 1, ..., p
∂xi
soient continues au point (a1 , ..., ap ) ∈ E. Alors f est aussi continue en ce point.
o
La matrice des dérivées partielles de f : E ⊂ Rp → Rq s’appelle la matrice jacobienne
y.c
ou la Jacobienne de f . On la note J(f )x0 , elle a p colonnes et q lignes :
em
∂x1 ∂xp
Autrement dit, si x = (x1 , ..., xp ) pour une fonction vectorielle f (x1 , ..., xp ) à valeurs
∂f
dans Rq , la Jacobienne a pour colonnes les vecteurs . En particulier, pour une fonction
∂xi
de p variables à valeurs réelles, la matrice jacobienne est juste une matrice ligne :
∂f (x) ∂f (x)
ad
J(f )(x1 ,...,xp ) =
∂x1
, ...,
∂xp
grad est appelé gradient de f et il est noté ∇f (x) (qui se lit nabla f de x).
3.2.1 Gradient
Pour une fonction à valeurs scalaires (q = 1)
f : E ⊂ Rp → R
ww
grad(f ) : E ⊂ Rp → Rp
t
∂f (x) ∂f (x)
x 7→ (grad(f ))(x) := , ..., .
∂x1 ∂xp
43
m
3.3 Propriétés des dérivées partielles Calcul différentiel
3.2.2 Divergence
o
Pour une fonction f : E ⊂ Rp → Rp (q = p) de composante f1 , ..., fp , dont toutes les dérivées
y.c
partielles existent, on définit sa divergence par
div(f ) : E ⊂ Rp → R
p
X ∂fi
x 7 → (div(f ))(x) := tr(J(f )x ) = (x),
i=1
∂x i
em
où tr(J(f )x ) est la trace de la matrice jacobienne. On peut écrire parfois div(f ) = ∇.f , où le
produit scalaire canonique sur Rp est défini par
p
X
x.y = xi y i .
i=1
ad
ATTENTION : ne pas confondre les notions de gradient et de divergence. grad(f ) est un vecteur
alors que div(f ) est un scalaire !
c
3.2.3 Rotationnel
oa
rot(f ) : E ⊂ R3 → R3
x 7→ (rot(f ))(x),
all
où
∂f3 ∂f2 ∂f1 ∂f3 ∂f2 ∂f1
(rotf )(x) = (x) − (x), (x) − (x), (x) − (x) = ∇ × f,
w.
o
Soient
g : I ⊂ R → J ⊂ R, h : J ⊂ R → R,
y.c
x 7→ g(x), y 7→ h(y),
et,
f : I ⊂ R → R,
x 7→ f (x) = h(g(x)).
On a
df dh dg
em
(x0 ) = (g(x0 )). (x0 ),
dx dy dx
que l’on écrivait plus souvent de la façon suivante : f 0 (x0 ) = h0 (g(x0 )).g 0 (x0 ).
Soient
g : D ⊂ Rp → E ⊂ Rm , h : E ⊂ Rm → Rq ,
c
x 7→ g(x), y 7→ h(y),
oa
et,
f : D ⊂ Rp → Rq ,
x 7→ f (x) = h(g(x)).
des fonctions telles que les p dérivées partielles de chacune des m composantes de g en
x0 ∈ D existent et h en g(x0 ) ∈ E soit une fonction continûment dérivable (i.e. ses
all
dérivées partielles existent et sont continues) alors pour tout i = 1, ..., p, et pour tout
j = 1, ..., q on a :
1. chaque fj possède une dérivée partielle par rapport à xi au point x0 ,
2. on a la formule suivante
w.
ce qui donne les entrées d’une matrice jacobienne de f qui est un produit des matrices
jacobiennes de h et g. Autrement dit,
45
m
3.4 Notion de différentiabilité Calcul différentiel
o
Remarque . Attention : si dans l’énoncé de la proposition on ne suppose pas que les dérivées
y.c
partielles de f sont toutes continues au point g(x0 ) alors le résultat peut très bien cesser d’être
vrai !
Par contre, si en plus les applications partielles de g sont de continûment dérivables alors f aura
ses dérivées partielles continues également en x0 .
em
Nous avons pour l’instant étudié la dérivabilité des composantes de f pour se ramener aux cas que
l’on connaissait des fonctions de R dans R. Mais cela n’est pas satisfaisant dans le sens où l’on n’a
pas de résultats propre à f sans passer par les dérivées partielles. D’où l’intérêt de cette section de
la notion de différentielle de f , qui pourrait être abordé dans le cas de la dimension infinie mais
que l’on ne traitera qu’en dimension finie pour rester dans le cadre du programme. Nous donnerons
ad
des résultats permettant de relier la différentielle d’une fonction avec ses dérivées partielles.
lim = 0,
x→a
x6=a
kx − ak
ou encore, en posant h = x − a,
kf (a + h) − f (a) − l(h)k
lim = 0,
all
h→0
h6=0
khk
w.
Remarque .
-l’application l est linéaire et continue (ici c’est évident puisqu’elle est linéaire en dimension finie,
donc forcément continue),
-cette application l lorsqu’elle existe est unique et on la note dfa ,
-on peut également écrire cette définition sous la forme, pour tout h ∈ Rp
ww
kr(h)k
lim = 0,
h→0 khk
h6=0
46
m
Calcul différentiel 3.4 Notion de différentiabilité
o
tiable si et seulement si elle est dérivable et pour tout x ∈ I, et h ∈ R, on a
y.c
dfx (h) = hf 0 (x),
em
dfx (h) = f (h),
la fonction
g : R → Rq
x 7→ g(t) := f (x + th),
est dérivable en t = 0 et
all
f (x + th) − f (x)
g 0 (0) = dfx (h)(= lim ).
t→0 t
C’est la dérivée de f en x suivant la direction h (si h est non nul), ou encore dérivée
directionnelle.
w.
o
On dit que l’application f est différentiable sur E si elle est différentiable en tout point
x ∈ E. Dans ce cas, on appelle la différentielle de f la fonction
y.c
df : E → L (Rp ; Rq )
x 7→ dfx ,
où L (Rp ; Rq ) est l’ensemble des fonctions linéaires (donc continues car nous sommes
en dimension finie) de Rp à valeurs dans Rq .
em
Si de plus df est continue, on dit que f est continûment différentiable ou de façon équi-
valente que f est de classe C 1 .
Remarque .
ATTENTION : bien remarquer que la formulation ci-dessus correspond à df et non pas à dfx
ad
qui est d’après la définition toujours linéaire et continue de Rp dans Rq . Autrement dit, ne pas
confondre df et dfx !
Remarque . Il faudra bien distinguer deux cas. Les fonctions à valeurs dans un espace produit,
autrement dit f (x) sera un vecteur de composantes fi (x) pour tout x dans l’espace de départ. Et
c
le cas où f est définie sur un espace produit, c’est à dire que f sera définie pour tout x ∈ E ⊂ Rn ,
x étant un vecteur de Rn .
oa
Bien entendu, la plupart du temps nous travaillerons sur le cas général qui est un mélange de ces
deux cas, et donc f sera une fonction définie de E ⊂ Rn vers Rp . Il faudra alors garder à l’esprit
les résultats suivants.
1. Une fonction f : I ⊂ R → Rq définie pour tout x dans I par f (x) = (f1 (x), ..., fq (x)) est
différentiable en un point x ∈ I si et seulement si toutes composantes fi de f , i = 1, ..., q
all
sont différentiables et dfx (h) = (df1,x (h), ..., dfq,x (h)) = hf 0 (x), où dans ce cas h est un
réel (scalaire) et f 0 (x) est le vecteur de composantes les dérivées fi0 (x). Attention, cela ne
marche que si l’espace de départ est R ici. Cela ne marche plus du tout si l’espace de départ
est inclus dans Rp . On aura alors le résultat suivant.
w.
2. On considère une fonction f : E ⊂ Rp → R définie pour tout x = (x1 , .., xp ) dans E par
f (x) ∈ R.
Si f est différentiable en un point x ∈ E alors les dérivées partielles seront différentiables.
Mais la réciproque sera FAUSSE en général.
On peut résumer ce dernier point de la façon suivante :
ww
-Si f est différentiable alors les applications partielles sont dérivables (c’est le résultat de
la proposition 3.10).
-PAR CONTRE,l’existence de la dérivée des applications partielles n’implique pas néces-
sairement la différentiabilité de f .
-Mais, si les applications partielles sont continûment différentiables alors f est continûment
différentiable (ce sera le résultat de la proposition 3.11).
Nous allons énoncer ces résultats dans les deux propositions suivantes.
48
m
Calcul différentiel 3.4 Notion de différentiabilité
o
Soient f : E ⊂ Rp → Rq et a ∈ E. On suppose f différentiable en a, alors f admet en
∂f
y.c
a les dérivées partielles : pour tout i = 1, ..., p, (a) et
∂xi
∂f
(a) = dfa (ei ),
∂xi
où ei est un vecteur de Rp dont la ième composante est 1 et le reste est 0.
em
Attention : quand on parle des dérivées partielles de f , il s’agit en fait des dérivées
partielles de chacune des applications fj (avec f = (f1 , ..., fq ), j = 1, ..., q, car ne
l’oublions pas, f est à valeurs dans Rq .
p
X ∂f
= hi
(a),
i=1
∂xi
= < ∇f (a)|h >,
∂f ∂f
où ∇f (a) = ( (a), ..., (a)) et < .|. > est le produit scalaire canonique sur Rp , c’est dire
all
∂x1 ∂xp
p
X
< x|y >= xi y i .
i=1
w.
en a et de rayon ε > 0 telle que pour tout x ∈ B(a, ε), les dérivées partielles (a),
∂xi
i = 1, ..., p existent et soient continues en a. Alors f est différentiable en a et de plus on
a
dfa (h) =< ∇f (a)|h > .
49
m
3.5 Opérations sur les fonctions différentiables Calcul différentiel
o
Proposition 3.12 (GENERALISATION)
y.c
Soient f : E ⊂ Rp → Rq et a ∈ E. On suppose qu’il existe une boule ouverte centrée en
∂fi
a et de rayon ε > 0 telle que pour tout x ∈ B(a, ε), les dérivées partielles (a), j =
∂xj
1, ..., p et pour tout i = 1, ..., q, existent et soient continues en a. Alors f est différentiable
en a et de plus on a
em
dfa (h) = J(f )a .h,
où J(f )a est la matrice jabobienne de f en a avec p colonnes et q lignes.
∂xi
on regarde si
kf (a + h) − f (a) − l(h)k
lim = 0,
h→0
h6=0
khk
all
En termes de Jacobiennes :
-J(f + g)x = J(f )x + J(g)x ,
-J(λf )x = λJ(f )x .
o
Soient f : E ⊂ Rp → Rn est différentiable en x ∈ E et g : U ⊂ Rn → Rq différentiable
en y = f (x) ∈ U , alors la composée g ◦ f est différentiable en x et
y.c
d(g ◦ f )x (h) = dgf (x) (dfx (h)),
em
pour tout x ∈ E.
En termes de Jacobiennes :
d(g ◦ f )x = J(g ◦ f )x = J(g)f (x) .J(f )(x).
infinie (hors programme), et il peut être utilisé lorsque le calcul des jacobiennes peut s’avérer trop
long.
Pour finir ce chapitre, nous allons donner quelques interprétations géométriques des différentielles.
Avant de donner le résultat directement, rappelons la définition d’un vecteur normal à une courbe
en un point de cette courbe ainsi que la définition d’une ligne de niveau pour une fonction définie
sur un domaine de R2 à valeurs dans R.
51
m
3.6 Propriétés géométriques des fonctions de plusieurs variables Calcul différentiel
o
niveau La (f ).
y.c
Proposition 3.16 (GRADIENT ET NORMALE)
em
On en déduit alors facilement la proposition suivante.
∂f ∂f
(x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) = 0.
∂x ∂y
c
oa
Le vecteur gradient ∇f (x, y) indique la direction de plus grande pente positive sur Γf à
partir d’un point.
w.
parcourir pour obtenir une variation donnée de f . Autrement dit, si l’on veut passer le plus vite
possible du niveau a au niveau b à partir d’un point (x, y) donné de niveau f (x, y) = a, il faut
suivre le gradient.
On a des résultats similaires pour les surfaces de niveau. Pour cela rappelons ce qu’est l’équation
d’un plan dans R3 .
52
m
Calcul différentiel 3.6 Propriétés géométriques des fonctions de plusieurs variables
o
Considérons un plan P passant par le point P0 (x0 , y0 , z0 ) et de vecteur normal n =
y.c
(a, b, c). L’équation cartésienne de ce plan est alors
em
Preuve : Faite en cours.
ad
Proposition 3.20 (PLAN TANGENT A SURFACE DE NIVEAU)
∂f ∂f ∂f
(x0 , y0 , z0 )(x − x0 ) + (x0 , y0 , z0 )(y − y0 ) + (x0 , y0 , z0 )(z − z0 ) = 0.
∂x ∂y ∂z
all
Attention ici, il ne faut pas confondre le graphe d’une fonction scalaire (à valeurs dans R) de deux
variables avec la surface de niveau. En effet, dans cette section nous nous intéressons à l’équation
du plan tangent à la surface représentant une fonction f : E ⊂ R2 → R qui est donnée par
f (x, y) = z pour tout (x, y) ∈ E, où z est un réel image de (x, y) par f . Rappelons que les
surfaces de niveau pour une application g définie sur un domaine de R3 la surface est donnée par
g(x, y, z) = a, où a est un réel.
53
m
3.6 Propriétés géométriques des fonctions de plusieurs variables Calcul différentiel
o
Soit f : E ⊂ R2 → R une fonction continûment différentiable sur E. L’équation du
plan tangent à la surface S définie par f (x, y) = z, z ∈ R en un point P0 (x0 , y0 , z0 ), où
y.c
z0 = f (x0 , y0 ) de S , tel que le gradient de f en ce point soit non nul est donné par
∂f ∂f
(x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) − z + z0 ) = 0,
∂x ∂y
ou encore
em
∂f ∂f
f (x, y) = f (x0 , y0 ) + (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ).
∂x ∂y
c ad
oa
all
w.
ww
54
o m
y.c
Chapitre 4
em
Théorème des accroissements finis
c ad
oa
(a) Michel Rolle (1652- (b) Pierre Varignon (c) René Eugène Ga-
1719) : mathématicien (1654-1722) : mathé- teaux (1889-1914),
français, à l’origine du célèbre maticien français, à mathématicien
théorème qui porte son l’origine du formalisme français à l’origine
all
Il a réussi à convaincre
Rolle de l’utilité du
calcul infinitésimal.
F IGURE 4.1 – Quelques mathématiciens célèbres liés à la théorie des accroissements finis.
ww
Ce chapitre est dédié à l’un des résultats fondamentaux du calcul différentiel qui permettra de
résoudre pas mal d’exercices. Nous allons commencer par des résultats connus pour des fonctions
d’une variable réelle à valeurs réelles. Nous généraliserons un résultat analogue en dimension su-
périeure (pour l’espace de départ, puis pour l’espace d’arrivée). Nous terminerons enfin ce chapitre
par une application.
55
m
4.1 Fonction d’une variable réelle à valeurs réelles Théorème des accroissements finis
o
Théorème 4.1 (RAPPEL : THEOREME DE ROLLE)
y.c
Soit f : [a, b] → R, où a < b, une fonction continue sur [a, b] et dérivable sur ]a, b[ telle
que f (a) = f (b). Alors il existe c ∈]a, b[ tel que f 0 (c) = 0.
em
Théorème 4.2 (EGALITE DES ACCROISSEMENTS FINIS)
Soit f : [a, b] → R continue, dérivable sur ]a, b[, où a < b, alors il existe c ∈]a, b[ tel que
Rappelons la définition d’un segment et d’un ensemble convexe (voir section (1.49)). Nous en
aurons en effet besoin tout au long de ce chapitre étant donné que nous formulerons les résultats
sur des convexes ouverts inclus dans l’ensemble de définition de f . Lorsque f sera définie sur un
domaine de R un tel ensemble sera un intervalle I du type ]a, b[ et si f est à valeurs sur un domaine
all
espace Rp , l’ensemble
[a, b] (resp. ]a, b[) = {ta + (1 − t)b tel que t ∈ [0, 1] (resp. t ∈]0, 1[)}.
ww
On dit que A ⊂ Rp est convexe si pour tout (a, b) ∈ A2 , le segment fermé [a, b] ⊂ A.
56
m
Théorème des accroissements finis 4.3 Fonction d’une variable réelle
o
Soit U ⊂ Rp , convexe et soit f : U → R continue, et [a, b] ⊂ U . Si f est différentiable
y.c
en tout point de ]a, b[ alors il existe c ∈]a, b[ tel que f (b) − f (a) = dfc (b − a).
em
Rp → Rq , où q > 1, - voir exemple en cours.
Remarque . On remarque :
1. que l’on peut avoir une inégalité (4.1) plus fine en prenant
t∈[0,1]
t∈[0,1]
pour tous x, y ∈ I.
2. que ce résultat s’applique même pour x et y au bord de l’intervalle I à condition que f soit
continue sur l’intervalle fermé I et que l’on ait une estimation de f 0 sur l’intervalle ouvert
I.
o
Soit f : I ⊂ R → Rq une fonction dérivable sur un intervalle ouvert I et à valeur dans
Rq . On suppose qu’il existe une fonction ϕ : I → R dérivable, telle que
y.c
kf 0 (t)kRq ≤ ϕ0 (t) quel que soit t ∈ I.
Alors
kf (x) − f (y)kRq ≤ |ϕ(x) − ϕ(y)| quel que soit (x, y) ∈ I × I.
em
Preuve. Pas faite en cours.
Alors
kf (x) − f (y)kRq ≤ kkx − ykRp quel que soit (x, y) ∈ U × U.
all
Nous avons en fait un résultat un peu plus général qui ne nécessite pas le fait que U soit convexe.
Il est donné dans la proposition suivante.
58
m
Théorème des accroissements finis 4.5 Application
o
Soit f : U ⊂ Rp → Rq , U ouvert de Rp , et soient x, y ∈ U , tels que le segment
[x, y] = {x + t(y − x), t ∈ [0, 1]} ⊂ U . On suppose que f est continue sur [x, y] et
y.c
différentiable sur ]x, y[= {x + t(y − x), t ∈]0, 1[} ⊂ U . Alors
em
Grâce à cette proposition, nous pouvons démontrer le corollaire suivant.
Corollaire 4.10 (FONCTION LIPSCHITZIENNE)
Un sous-ensemble d’un espace topologique X (par exemple Rn ) est dit CONNEXE s’il
w.
n’admet pas de sous-ensemble à la fois ouvert et fermé autre que l’ensemble vide et
lui-même.
o
y.c
em
adc
oa
all
w.
ww
60
o m
y.c
Chapitre 5
em
Difféomorphismes
5.1 Introduction ad
Soient U et V des OUVERTS ( non vides) de Rp .
si
1. f est une bijection,
2. f est de classe C 1 , c’est à dire continûment différentiable sur U ,
3. f −1 est de classe C 1 sur V .
all
o
Si f : U → V est un difféomorphisme alors sa différentielle est en tout point de U un
isomorphisme (de Rp dans lui-même) et la différentielle de sa fonction réciproque f −1
y.c
est liée à celle de f par la formule
em
Preuve. Faite en cours.
Si
1. f : U → V est de classe C 1 ,
2. a ∈ U est tel que dfa soit un isomorphisme (de Rp dans lui-même),
c
alors il existe un voisinage ouvert Ua de a dans U et un voisinage ouvert Vb de b = f (a)
dans V tel que la restriction de f à Ua soit un difféomorphisme de Ua sur Vb .
oa
o
Le théorème des fonctions implicites concerne la résolution d’équations non-linéaires de la forme
y.c
f (x, y) = 0,
et doit son nom au fait que, sous les hypothèses que l’on va préciser, on peut en tirer y comme
fonction de x : on dit alors que f (x, y) = 0 définit implicitement y, ou encore y comme fonction
implicite de x.
em
Donnons d’abord une formulation générale (qui peut être utilisée sans passer par les matrices
jacobiennes), puis un cas particulier de fonctions de R2 à valeurs dans R pour finalement énoncé
le résulat avec les matrices jacobiennes.
telle que
((x, y) ∈ U(a,b) et f (x, y) = 0G ) ⇔ y = ϕ(x).
all
o
Soient U ⊂ R2 , U ouvert et f : U → R une application de classe C 1 sur U . On suppose
∂f
y.c
qu’il existe (a, b) ∈ U tel que f (a, b) = 0 et que (a, b) 6= 0. Alors il existe un
∂y
voisinage U(a,b) de (a, b) dans U , un voisinage ouvert Wa de a dans U et une fonction de
classe C 1 (Wa , R)
ϕ : Wa → R,
telle que
em
((x, y) ∈ U(a,b) et f (x, y) = 0) ⇔ y = ϕ(x),
et quitte à réduire Wa on a
∂f
∂f (x, ϕ(x))
(x, ϕ(x)) 6= 0, et ϕ0 (x) = − ∂x
∂y ∂f
(x, ϕ(x))
c ad ∂y
oa
all
w.
ww
o
Soient U ⊂ Rp × Rq , E ouvert et f : U → Rq une application de classe C 1 sur U .
y.c
On note fi , i = 1, ..., q les composantes de f chacune définie de U à valeurs dans R.
On suppose qu’il existe (a, b) ∈ U tel que f (a, b) = 0 et que la matrice définie par les
∂fi
coefficients {( )(a, b)}1≤i,j≤q est inversible (autrement dit le déterminant de cette
∂xp+j
matrice est non nul). Alors il existe un voisinage U(a,b) de (a, b) dans U , un voisinage
ouvert Wa de a dans Rp et une fonction de classe C 1 (Wa , Rq )
em
ϕ : Wa → Rq ,
telle que
((x, y) ∈ U(a,b) et f (x, y) = 0) ⇔ y = ϕ(x),
et quitte à réduire Wa on a la jacobienne de ϕ en (x1 , ..., xp )
Jϕ (x1 , ..., xp ) =
∂f1 ∂f1
ad −1
∂f1 ∂f1
(x, ϕ(x)) ... (x, ϕ(x)) (x, ϕ(x)) ... (x, ϕ(x))
∂xp+1 ∂xp+q ∂x1 ∂xp
− .. .. .. ..
.
. .
. .
∂fq ∂fq ∂fq ∂fq
c
(x, ϕ(x)) ... (x, ϕ(x)) (x, ϕ(x)) ... (x, ϕ(x))
∂xp+1 ∂xp+q ∂x1 ∂xp
oa
65
m
5.3 Théorème des fonctions implicites Difféomorphismes
o
y.c
em
c ad
oa
all
w.
ww
66
o m
y.c
Chapitre 6
em
Formules de Taylor
c ad
oa
(a) Brook Taylor (1685- (b) William Henry Young (c) Hermann
1731) : mathématicien (1863-1942) : mathémati- Amandus Schwarz
britannique, à l’origine cien britannique. L’une des (1843-1921), mathé-
de la notion du calcul plus importantes contribu- maticien allemand
des différences finies, tion fut dans l’étude des (né en Pologne).
on lui doit également fonctions de plusieurs va- On lui doit entre
all
F IGURE 6.1 – Quelques mathématiciens célèbres liés aux différentielles d’ordre supérieures ou
égales à 2.
ww
Avant de donner les formules de Taylor, qui dépendent des différentielles d’ordre n ≥ 1 dans
différents cas de fonctions : fonctions de R dans R, fonctions de R dans Rq et fonctions de Rp dans
Rq , nous allons donner un aperçu de ce qu’est une différentielle d’ordre 2 dans un premier temps,
avec un théorème de symétrie important : le théorème de Schwarz. Nous définirons également la
matrice Hessienne qui nous servira beaucoup dans le chapitre 7 sur les extrema.
67
m
6.1 Applications deux fois différentiables Formules de Taylor
o
Définition 6.1 (APPLICATIONS DEUX FOIS DIFFERENTIABLES)
y.c
Une fonction f définie sur un OUVERT (non vide) U ⊂ Rp et à valeurs dans Rq est dite
deux fois différentiable en x ∈ U si
1. elle est différentiable dans un voisinage ouvert Ux de x et si,
2. sa différentielle df : Ux → L (Rp ; Rq ) est différentiable en x.
On dit que f est deux fois différentiable dans U si elle est différentiable en tout point de
em
U.
Remarque .
Par sa définition, la différentielle de df en x, que l’on écrit d(df )x est une application linéaire
continue de Rp dans L (Rp ; Rq ). Autrement dit, on a
ad
df : U → L (Rp ; Rq ),
et
d(df )x : U → L (Rp , L (Rp ; Rq )).
c
Mais elle s’identifie naturellement avec une application linéaire continue sur Rp × Rp (c’est à dire
une application bilinéaire continue sur Rp ) grâce à la proposition suivante.
oa
Les espaces L (Rp ; L (Rq ; Rn )) et L (Rp , Rq ; Rn ) munis des normes usuelles sont iso-
métriques.
all
x 7→ d2 fx
définie par
68
m
Formules de Taylor 6.2 Exemples de différentielles d’ordre 2
Remarque . On peut interpréter cette définition de la façon suivante (qu’on utilise en pratique
o
pour calculer d2 f ). Si f est deux fois différentiable sur U , alors, quel que soit k ∈ Rp , l’application
y.c
g : U → Rq
x 7→ dfx (k)
est différentiable et
em
dgx (h) = d2 fx (h, k).
ad
Théorème 6.4 (THEOREME DE SCHWARZ)
Donnons ici quelques différentielles d’ordre 2 pour deux types de fonctions classiques : les
applications affines et les applications quadratiques.
1. Une application affine f : x 7→ l(x) + b avec l ∈ L (Rp ; Rq ) et b ∈ Rq est deux fois
différentiable et sa différentielle seconde est identiquement nulle.
2. Une application quadratique f : x 7→ φ(x, x) avec φ ∈ L (Rp , Rp ; Rq ) est deux fois diffé-
rentiable et sa différentielle seconde est constante, et même égale à 2φ si φ est symétrique.
69
m
6.3 Matrice Hessienne Formules de Taylor
o
Définition 6.5 (MATRICE HESSIENNE)
y.c
Soit f : U ⊂ Rp → R et soit (e1 , ..., ep ) la base canonique de Rp . Si f est deux fois
différentiable sur l’ouvert U alors pour tout x ∈ E, pour tous i, j ∈ {1, ..., p}
∂ ∂f
d2 fx (ei , ej ) = (x).
∂xi ∂xj
em
Alors la matrice
∂ 2f ∂ 2f
(x) . . . (x)
∂x21 ∂x1 ∂xp
.. ..
d2 fx := Hess fx :=
. .
∂ 2f ∂ 2f
(x) . . . (x)
ad ∂xp ∂x1 ∂x2p
∂ ∂f ∂ ∂f
=
∂xi ∂xj ∂xj ∂xi
pour tous i, j ∈ {1, ..., p}. Et donc la matrice hessienne est symétrique. Ces dérivées sont en
général notées
all
∂ 2f
.
∂xi ∂xj
Par bilinéarité, si h et k sont deux vecteurs de Rp de composantes (h1 , ..., hp ) et (k1 , ..., kp ) respec-
w.
tivement, alors
p p
2 t
X X ∂ 2f
dx f (h, k) = h.Hess fa .k = hi kj (x).
i=1 j=1
∂xi ∂xj
Autrement dit, Hess fa est la matrice de la forme bilinéaire d2 fa par rapport à la base canonique
ww
o
Soit une fonction f définie sur un ouvert (non vide) U de Rp et à valeurs dans un Rq , et
y.c
k un entier au moins égal à 2. On dit qu’elle est :
1. k fois différentiable en x ∈ U si sa différentielle df : Ux → L (Rp ; Rq ) est (k − 2)
fois différentiable dans un voisinage ouvert Ux de x, et sa (k − 1)ième différentielle est
différentiable en x.
2. k fois différentiable dans U si elle est k fois différentiable en tout point de U .
3. de classe C k si et seulement si sa différentielle est de classe C k−1 .
4. de classe C ∞ si elle est de classe de C k pour tout k ≥ 1.
em
Proposition 6.7 (APPLICATIONS LINEAIRES ET CLASSE C ∞ )
Nous pouvons maintenant donner un résultat qui permettra d’établir de façon nécessaire et suffi-
sante les différentielle d’ordre k, k ∈ N, qui généralisera le cas des différentielles d’ordre 2. Par
généralisation du théorème de Schwarz, il vient que si une fonction f est k fois différentiable en un
point x, sa différentielle d’ordre k sera une application k-linéaire symétrique (nous ne montrerons
pas ce résultat ici). Il est donc tout naturel de définir un tel espace dans laa définition ci-dessous
ww
71
m
6.4 Différentielle d’ordre k Formules de Taylor
o
Soit Lk (Rp ; Rq ) l’espace des applications k-linéaires continues sur (Rp )k . Une appli-
cation φ ∈ Lk (Rp ; Rq ) est dite symétrique si pour tout permutation σ de l’ensemble
y.c
{1, ..., k} et pour tout k-uplet (x1 , ..., xk ) ∈ (Rp )k ,
On notera Lks (Rp ; Rq ) l’espace des applications k-linéaires continues et symétriques sur
(Rp )k .
em
Nous pouvons dès lors donner une condition nécessaire et suffisante pour qu’une fonction f soit
k-fois différentiable.
Théorème 6.12 (CNS APPLICATION DIFFERENTIABLE)
ad
Une fonction f : U ⊂ Rp → Rq est k fois différentiable au point x ∈ U si et seulement
s’il existe
1. un voisinage ouvert Ux de x dans U ,
2. des fonctions dn f : Ux → Lns (Rp ; Rq ) pour n ≤ k − 1, et
3. dk fx ∈ Lks (Rp ; Rq )
c
telles que
1. d1 f = df dans Ux ,
oa
2. pour tout n ≤ k − 2, dn f est différentiable sur Ux , avec pour tout y ∈ Ux , et pour tout
(h1 , ..., hn+1 ) ∈ (Rp )n+1 :
[n]
dn+1 fy (h1 , ..., hn+1 ) = dn+1 g(h1 ,...,hn ,y) (hn+1 )
De façon analogue aux différentielles d’ordre 2, nous obtenons que si h et k et l sont trois vecteurs
de Rp de composantes (h1 , ..., hp ), (k1 , ..., kp ) et (l1 , ..., lp ) respectivement, alors
ww
p p p
X X X ∂ 3f
d3x f (h, k, l) = hi kj ln (x).
i=1 j=1 n=1
∂xi ∂xj ∂xn
Les différentielles d’ordre supérieure à 1 étant définies, nous pouvons nous intéresser désormais
aux différents résultats concernant les formules de Taylor. Nous nous intéressons dans la section
suivante aux formules de Taylor avec reste intégral, aux formules de Taylor-Lagrange et enfin aux
formules de Taylor-Young.
72
m
Formules de Taylor 6.5 Formule de Taylor avec reste intégral
o
6.5.1 Fonction d’une variable réelle à valeur réelle
y.c
Commençons cette section par la formule déjà étudiée durant les années précédentes et qui corres-
pond à la formule de Taylor avec reste intégral pour les fonctions d’une variable réelle à valeurs
réelles.
Soit I ⊂ R un ouvert non vide, nous avons alors le résultat suivant :
em
Théorème 6.13 (TAYLOR AVEC RESTE INTEGRAL f : I ⊂ R → R)
trer un lemme qui sera une des clés de beaucoup de preuves de ce chapitre. Nous allons également
rappeler quelques résultats sur les intégrales de Riemann pour des fonctions définies sur un inter-
valle [a, b] à valeurs dans Rq .
w.
o
Soient a, b ∈ R, a ≤ b. Alors l’intégrale de Riemann sur le segment [a, b] définit une
application linéaire continue sur l’espace C ([a, b]; Rq ) des fonctions continues sur [a, b]
y.c
et à valeurs dans Rq , muni de la norme sup. Pour tout g ∈ C ([a, b]; Rq ), l’intégrale de
Z b
Riemann de g sur le segment [a, b], notée g(t)dt, vérifie l’inégalité
a
Z b Z b
k g(t)dtk ≤ kg(t)kdt ≤ (b − a) max kg(t)k.
em
a a t∈[a,b]
Z b
q
Remarque . Dans notre cas, nous sommes en dimension finie R et pour simplifier g(t)dt est
ww
Z b a
simplement le vecteur dont les composantes sont gi (t)dt où les gi sont les i ∈ 1, ..., q sont les
a
composantes de g dans la base canonique.
o
Si I est un intervalle ouvert de R contenant [0, 1], et g : I → Rq une fonction de classe
C (n+1) , alors
y.c
n Z 1
X 1 (k) (1 − t)n (n+1)
g(1) − g(0) − g (0) = g (t)dt.
k=1
k! 0 n!
em
Nous pouvons alors passer au cas le plus général de cette section qui sont les fonctions de Rp à
valeurs dans Rq .
Si U est un ouvert de Rp , et f : U → Rq est une fonction de classe C n+1 , alors pour tout
(x, h) ∈ U × Rp tel que le segment [x, x + h] soit inclus dans U ,
n Z 1
X 1 k [k] (1 − t)n n+1
f (x + h) = f (x) + d fx (h ) + d fx+th (h[n+1] )dt.
k=1
k! 0 n!
all
au-moins n + 1-fois différentiable (ou dérivable si c’est une fonction d’une variable réelle). On
o
perd par contre l’égalité avec le reste intégral précédent pour obtnir une inégalité définie dans les
forumes de Taylor-Lagrange ci-dessous.
y.c
Proposition 6.18 (TAYLOR LAGRANGE f : I ⊂ R → Rq )
em
alors n
X 1 (k) M
kg(1) − g(0) − g (0)k ≤ .
k=1
k! (n + 1)!
1. Si U est un ouvert Rp
2. si (x, h) ∈ U × Rp est tel que le segment [x, x + h] soit inclus dans U , et
3. si f : U → Rq est une fonction (n + 1) fois différentiable telle que
alors n
X 1 k M
kf (x + h) − f (x) − d fx (h[k] )k ≤ khkn+1 .
k=1
k! (n + 1)!
w.
o
Si U est un ouvert de Rp et si f : U → Rq est une fonction n fois différentiable en x ∈ U
y.c
alors n
X 1 k
kf (x + h) − f (x) − d fx (h[k] )k = o(khkn ).
k=1
k!
em
Remarque . Dans l’énoncé de ce théorème, la notation de Landau o signifie que le membre de
gauche divisé par khkn tend vers 0 lorsque h tend vers 0. Il s’agit donc d’un résultat local, qui
donne des renseignements sur le comportement de f au voisinage de x seulement.
77
m
6.7 Formule de Taylor-Young Formules de Taylor
o
y.c
em
c ad
oa
all
w.
ww
78
o m
y.c
Chapitre 7
Extrema
em
Ce chapitre est consacré à l’étude de l’existence de deux types d’extrema : les extrema libre
et les extrema liés. Les seconds correspondent au cas où les extrema sont justement “liés” à des
contraintes. Dans les deux cas, nous pourrons définir ce que l’on appelle extrema locaux (ou rela-
ad
tifs) et les extrema globaux (ou absolus). Il se pourra donc que des minima locaux par exemple ne
soit pas globaux si l’on étend le domaine de définition de la fonction f .
Nous ne nous intéresserons également qu’à l’étude de minima (pour simplifier le chapitre) étant
donné que les maxima des fonctions f peuvent être vus comme les minima des fonction −f .
Enfin, nous ne nous intéresserons qu’aux fonctions scalaires (autrement dit les fonctions f définies
c
sur Rp à valeurs dans R).
oa
Avant de commencer par l’étude des extrema libres, faisons quelques petits rappels d’algèbre.
q : Rp → R
x 7→ B(x, x).
o
Pour tous x, y ∈ Rp et pour tout λ ∈ R on a
y.c
1
B(x, y) = [q(x + y) − q(x) − q(y)],
2
et
q(λx) = B(λx, λx) = λ2 B(x, x) = λ2 q(x).
em
Définition 7.3 (FORME POSITIVE, NEGATIVE,...)
Remarque . On remarque qu’en dimension finie, q est elliptique si et seulement si q est définie
all
positive. Si on n’est pas en dimension finie (hors programme) on a juste l’‘èllipticité” qui implique
q définie positive mais pas la réciproque.
Etant donné que certains résultats d’existence d’extrema font intervenir les matrices Hessiennes
w.
(qui sont des matrices symétriques), rappelons ici quelques résultats pour les matrices.
Soit
ww
a1,1 · · · a1,p
.. .. ..
A= . . .
ap,1 · · · ap,p
une matrice carrée, A ∈ Mp (R). On dit que A est symétrique si ai,j = aj,i pour tout
i, j = 1, ..., p.
80
m
Extrema 7.1 Rappels d’algèbre
o
Soit A ∈ Mp (R) une matrice symétrique, l’application x ∈ Rp 7→ qA (x) = xT .A.x est
y.c
appelée forme quadratique associée à A.
em
matrice A est dite :
– SEMI-DEFINIE POSITIVE si qA (x) = xT .A.x ≥ 0 pour tout x ∈ Rp ,
– DEFINIE POSITIVE si qA (x) = xT .A.x > 0 pour tout x ∈ Rp \ {0Rp },
– SEMI-DEFINIE NEGATIVE si qA (x) = xT .A.x ≤ 0 pour tout x ∈ Rp .
– DEFINIE NEGATIVE si qA (x) = xT .A.x < 0 pour tout x ∈ Rp \ {0Rp }.
ad
Définition 7.7 (kième MINEUR DOMINANT)
ak,1 · · · ak,k
On peut prouver facilement si une matrice symétrique est définie positive grâce au résultat suivant.
Soit A ∈ Mp (R) une matrice symétrique, alorsA est DEFINIE POSITIVE si et seule-
ment si l’une des propriétés suivantes est satisfaite :
1. ∆k > 0 pour tout k = 1, ..., n,
2. A est diagonalisable et ses valeurs propres sont strictement positives.
ww
Remarque .
1) On remarque que si une matrice A ∈ Mp (R) une matrice symétrique est DEFINIE POSITIVE
on a les propriétés suivantes :
-tous les coefficients diagonaux de A sont des réels strictement positifs,
81
m
7.2 Extrema libres Extrema
-le déterminant de A est strictement positif (c’est à dire que A est inversible),
o
- il existe une constante α > 0 telle que xT .A.x ≥ αkxk2 , pour n’importe quelle norme k.k,
2) Une matrice symétrique réelle est dite définie négative si son opposée (symétrique elle aussi)
y.c
est définie positive.
em
Si f est une fonction définie sur une partie U de Rp et à valeurs réelles, un point a ∈ U
est un minimum local (ou relatif) de f s’il existe un voisinage Va de a ouvert dans U tel
que
f (x) ≥ f (a) pour tout x ∈ Va .
On dira que a est un minimum global (ou absolu) de f si
ad
f (x) ≥ f (a) pour tout x ∈ U.
Un minimum est dit strict si l’inégalité est stricte, c’est à dire f (x) > f (a), pour tout
x 6= a (que ce soit local ou global).
c
oa
Remarque .
1. Noter que si f : I ⊂ R → R, a ∈ U est un point critique de f si f 0 a) = 0.
2. Nous allons voir dans la proposition suivant qu’un extremum est un point critique, mais at-
w.
tention, la réciproque est fausse. Ce n’est pas parce que l’on a un point critique que c’est un
extremum. Par exemple, 0 est un point critique de f : x 7→ x3 et pourtant ce n’est pas un extremum
sur R.
Dans toute la suite, nous allons donner des critères nécessaires (et on l’espère quelques fois suf-
ww
fisants) pour trouver l’existence de ces extrema locaux selon le degré de différentiabilité de la
fonction f .
o
Soit I un intervalle ouvert non vide de R. Si f : I ⊂ R → R dérivable en a ∈ I et si f
admet un extremum local en a alors f 0 (a) = 0.
y.c
Si l’on passe maintenant dans un cadre plus général des fonctions de RP → R. Nous obtenons le
résultat suivant.
em
Proposition 7.12 (REGLE DE FERMAT)
Remarque . Attention :
c
1. La condition précédente n’est pas suffisante car a peut être un point critique de f sans pour
autant que f possède d’extremum local.
oa
2. La condition U ouvert est importante. En effet, il se peut que f admette un extremum sur un
domaine U inclus dans Rp alors que ses dérivées partielles ne s’annuleront pas sur U . Ce
qui nous ramène au rappel suivant (voir la remarque de la section 1.7).
all
o
Soit I un intervalle ouvert non vide de R. Si f : I ⊂ R → R dérivable en a ∈ I et
si f admet un MINIMUM local en a alors f 0 (a) = 0 (comme on l’a vu dans la section
y.c
suivante), mais si de plus f est deux fois dérivable en a alors f 00 (a) ≥ 0.
Inversement : Si b ∈ I est tel que f 0 (b) = 0 et f 00 (b) > 0 alors b est un minimum local
de f .
em
Preuve. Pas faite en cours.
Remarque . Attention !
1. Les conditions f 0 (a) = 0 et f 00 (a) ≥ 0 ne sont pas suffisantes ! On a besoin d’avoir f 00 (a) > 0.
ad
On pourrait par exemple le voir avec f : x 7→ x3 en x = 0.
2. D’autre part, la condition f 00 (a) > 0 n’est pas nécessaire (autrement dit on peut avoir f 00 (a) ≥
0. On pourrait par exemple le voir avec f : x 7→ x4 en x = 0.
de fermat) mais si de plus f est deux fois différentiable en a alors d2 f( a)(h, h) ≥ 0 pour
tout h ∈ Rp .
Inversement, si b ∈ U est telle que dfb = 0 et s’il existe C > 0 tel que d2 fb (h, h) ≥
Ckhk2 , pour tout h ∈ Rp alors b est un minimum local de f
w.
Remarque .
1. On retrouve ici la notion de coercivité donnée dans le rappel tout au début de ce chapitre puisque
ww
o
Théorème 7.16 (HESSIENNE ET EXTREMA LOCAUX )
y.c
Soient f : U ⊂ Rp → R une fonction deux fois différentiable sur U ouvert de Rp , et
a ∈ U un point critique de f . Alors la Hessienne de f , Hess(f ) ∈ Mn (R) est une
matrice symétrique et
1. si Hessfa est DEFINIE POSITIVE alors a est un minimum local strict de f sur U ,
2. si Hessfa est SEMI-DEFINIE POSITIVE alors a est un minimum local de f sur U ,
3. si Hessfa est DEFINIE NEGATIVE alors a est un maximum local strict de f sur U ,
em
4. si Hessfa est SEMI-DEFINIE POSITIVE alors a est un maximum local de f sur U ,
5. S’il existe un l tel que ∆2l < 0, ou s’il existe m tel que ∆1 .∆2.m < 0, alors A est
indéfinie.
3. Si les valeurs propres de Hess fa sont non nulles mais de signes différents, on dit que a est
un point col (ou un point selle).
Nous pouvons également donner des résultats sur les extrema globaux :
pour tout x ∈ U , alors a est un minimum global de f sur U (resp. maximum global), et
si les inégalités sont strictes les extrema sont stricts.
ww
o
Soient f : U ⊂ R2 → R une fonction deux fois différentiable sur U ouvert de R2 , et
y.c
(a, b) ∈ U un point critique de f . On pose
∂ 2f ∂ 2f ∂ 2f
r= (a, b), s = (a, b), et t = (a, b).
∂x2 ∂x∂y ∂y 2
Alors
1. si rt − s2 > 0 et r > 0, (a, b) est un minimum local de f sur U ,
em
2. si rt − s2 > 0 et r < 0, (a, b) est un maximum local de f sur U ,
3. si rt − s2 < 0 la fonction n’admet pas d’extremum local, on dit alors que (a, b) est un
point SELLE ou COL.
7.3.1 Contraintes
all
f (x) ≥ f (a)
Commençons par les fonctions d’un espace R2 avec une seule contrainte :
86
m
Extrema 7.3 Extrema liés
o
Soient f, g : U ∈ R2 → R de classe C 1 , sur un ouvert U de R2 , soit (a, b) ∈ U tels que
y.c
1. f soumise à la contrainte g(x, y) = 0 admette un extremum au point (a, b),
2. ∇g(a, b) 6= 0, alors il existe un nombre réel λ 6= 0 tel que ∇f (a, b) = λ∇g(a, b).
Autrement dit, on a
∂f ∂g
∂x (a, b) − λ ∂x = 0,
∂f ∂g
(a, b) − λ = 0,
∂y ∂y
em
g(a, b) = 0.
7.3.3
ad
Extrema liés avec plusieurs contraintes
En généralisant le cas précédent, on peut donner les résultats sous les formes suivantes pour k
contraintes.
régulier (ou encore qu’il satisfait à la condition de qualification non dégénérée) si pour
tout a ∈ Γ, dga : Rp → Rk est surjective.
df a + λdga = 0.
ww
o
Soient f : U ∈ Rp → R de classe C 1 , g : U ∈ Rp → Rk , et Γ = g −1 ({0}) régulière. Si
y.c
a ∈ Γ est un extremum local de f|Γ , alors il existe un unique λ = (λ1 , ..., λk ) ∈ Rk tel
que
p
X
df a + λi (dgi )a = 0.
i=1
em
Si jamais on est mal à l’aise avec la notion de Γ régulière, il suffit juste de voir le résultat précédent
de la façon suivante :
1. on suppose que les fonctions f et g1 ,...,gk définies de Rp → R sont continûment différentiables.
2. on dit que les contraintes g1 ,...,gk sont indépendantes au point a ∈ U si la famille de formes
linéaires continues {(dg1 )a , ..., (dgk )a } est libre (ce qui revient exactement à dire que g est Γ régu-
ad
lière. Alors on a le résultat suivant équivalement au théorème précédent :
Soient f et g1 ,...,gk sont des fonctions de classe C 1 définies sur un ouvert U ⊂ Rp d’un à
c
valeurs dans R. Soit a ∈ U tel que g1 (a) = 0,...,gk (a) = 0 et les contraintes g1 ,...,gk sont
indépendantes au point a. Si a est un minimum local de f sous les contraintes g1 ,...,gk ,
oa
sur des ouverts : et il est à noter que les conditions nécessaires d’extremum local sont fausses
lorsque U n’est pas un ouvert.
Nous allons dans la section suivante considérer des problèmes d’extremum sur des sous-ensemble
convexes de E.
ww
o
Un sous-ensemble C d’un R-espace vectoriel E est dit convexe si pour tous x, y ∈ C,
pour tout θ ∈ [0, 1], θx + (1 − θ)y ∈ C. Une fonction f est définie sur un convexe C à
y.c
valeurs dans R est dite convexe, si pour tous x, y ∈ C, pour tout θ ∈ [0, 1],
Elle est dite strictement convexe si l’inégalité ci-dessus est stricte lorsque x 6= y et
θ ∈]0, 1[.
em
Théorème 7.26 (FONCTION CONVEXE)
Elle est strictement convexe si l’inégalité ci-dessus est stricte pour x 6= y. En supposant
en outre que f est deux fois différentiable, f|C est convexe si et seulement si, pour tous
x, y ∈ C
c
d2 fx (y − x, y − x) ≥ 0.
oa
2. Si f|C est strictement convexe alors elle admet au plus un minimum, et c’est un mini-
mum strict.
3. Si f est différentiable, une condition nécessaire pour qu’un point a ∈ C soit un
minimum de f|C est
dfa (y − a) ≥ 0,
ww
pour tout y ∈ C. Si de plus f|C est convexe, cette condition est également suffisante.
89