Calcdif 2
Calcdif 2
fr
Vous avez toute liberté pour télécharger, imprimer, photocopier ce cours et le diffuser gratuitement. Toute diffusion à
titre onéreux ou utilisation commerciale est interdite sans accord de l'auteur.
Si vous êtes le gestionnaire d'un site sur Internet, vous avez le droit de créer un lien de votre site vers mon site, à
condition que ce lien soit accessible librement et gratuitement. Vous ne pouvez pas télécharger les fichiers de mon site
pour les installer sur le vôtre.
CALCUL DIFFERENTIEL 2
Plan
I : Fonctions différentiables
1) Définition
2) Lien entre les deux notions
3) Différentiation d'une fonction composée
II : Propriétés
1) Gradient
2) Inégalité des accroissements finis
3) Difféomorphismes, inversion locale
4) L'équation des ondes
5) Le théorème des fonctions implicites
III : Intégrales curvilignes
1) Formes différentielles
2) Représentation graphique
3) Intégrales curvilignes
Annexe I : Le théorème de Fubini et théorème de Schwarz
Annexe II : Le théorème de Poincaré
Annexe III : La relativité, une histoire de changement de variables
Annexe IV : Les multiplicateurs de Lagrange
Annexe V : Une démonstration du théorème d'inversion locale
1) Introduction d'une application contractante
2) Existence d'une boule de centre a stable par
3) Définition des ouverts V et W
4) Continuité de f–1
5) Différentiabilité de f–1
6) Caractère C1 de f–1
Exercices
1) Enoncés
2) Solutions
Ce chapitre approfondit les notions déjà rencontrées dans le premier chapitre de calcul différentiel
L1/CALCDIF1.PDF. Un dernier complément se trouve dans le chapitre L2/GRADIVRT.PDF.
La lecture du chapitre sur les espaces normés L2/EVNORME.PDF est conseillée, et même
indispensable pour la compréhension de certaines passages du présent chapitre.
I : Fonctions différentiables
1- Définition
Pour f de R dans R, f est dérivable en a s'il existe une constante notée f '(a) telle que :
-1-
f(a + h) – f(a)
lim = f '(a)
h0 h
ou, de manière équivalente, si :
f(a + h) = f(a) + hf '(a) + o(h)
au voisinage de 0.
Ces deux égalités se généralise aux fonctions de Rn dans Rp, ou plus généralement d'un espace
vectoriel E dans un espace vectoriel F, tous deux de dimension finie, sous deux formes possibles.
On note que la fonction est bien définie dans un voisinage de 0, pour t assez petit. Dvf(a) donne le
taux de variation de f le long de la droite affine passant par a et de vecteur directeur v.
REMARQUE :
Dans la définition ci-dessus, on a parlé de point a et de vecteur v, tous deux éléments de E. Cela
signifie en fait que E est vu sous deux formes, celle d'un espace affine dont les éléments sont des
points, et celle d'un espace vectoriel dont les éléments sont des vecteurs. Si l'on souhaite distinguer
clairement les deux formes, la définition prendra la forme suivante :
Soit (A) un espace affine de direction vectorielle E, soit (B) un espace affine de direction vectorielle
F. Soit f une application d'un ouvert U de (A) dans (B) et a un point de U. f est dérivable en a
selon un vecteur v de E si l'application de R dans (B) définie par t f(a + tv) est dérivable en
t = 0. On pose :
f(a + hv) – f(a)
Dvf(a) = '(0) = lim
h0 h
Ici, a + hv est le translaté du point a par le vecteur hv, et f(a + hv) – f(a) égal au vecteur reliant le
point f(a) au point f(a + hv).
La même distinction peut s'effectuer dans l'ensemble du chapitre, en particulier un peu plus loin
avec la notion de différentielle, la fonction f s'appliquant sur des points et sa différentielle df sur des
vecteurs. Néanmoins, pour ne pas multiplier les noms d'espaces considérés, nous utiliserons le
même espace E soit comme espace affine, soit comme espace vectoriel, en notant le plus souvent
par a, b, ... les éléments de E vus comme des points, et par u, v, ... les éléments de E vus comme des
vecteurs.
EXEMPLE :
2
x xy – x 1 –1
Soit f : y R2 2x2y . Prenons a = 2 et v = 3 . On a alors :
2
(1 – t)(2 + 3t) – 1 + t
(t) = f(a + tv) = 2(1 – t)2(2 + 3t)
9
et Dvf(a) = '(0) = –2
-2-
Si E = Rn de base canonique (e1, ..., en), la dérivée Di selon le vecteur ei n'est autre que la dérivée
f f
partielle usuelle. En effet, si a = (a1, ..., an), (a) est la dérivée en ai de la fonction :
xi xi
xi f(a1, ..., xi, ..., an) = f(a + (xi – ai)ei) = (xi – ai)
f
avec v = ei. (a) est bien égal à '(0) = Dif(a). Ainsi, l'opérateur Di est l'opérateur de dérivation par
xi
rapport à la ième composante. Si f est de classe C2 (i.e. f admet des dérivées partielles secondes, et f et
toutes ses dérivées sont continues), l'ordre de dérivation de ces dérivées partielles secondes
n'intervient pas (théorème de Schwarz), ce qui signifie que Di o Dj = Dj o Di. Une démonstration est
donnée dans le chapitre L1/CALCDIF1.PDF, et une autre est donnée en annexe I du présent
chapitre.
Fonction différentiable
Dans R, La fonction h hf '(a) est la meilleure approximation linéaire de f(a + h) – f(a). On
l'appelle parfois application linéaire tangente. On généralise cette propriété pour une fonction f de E
dans F (ou d'un ouvert U de E dans F) de la façon suivante.
DÉFINITION
Soit f une application d'un ouvert U de E dans F. On dit que f est différentiable en un point a de U
s'il existe une application linéaire L de E dans F telle que, quand h tend vers 0 :
f(a + h) = f(a) + L(h) + o(|| h ||)
L, si elle est existe, est unique. En effet, si vérifie la même définition, on aura pour tout h non nul,
quand t tend vers 0, en utilisant la linéarité de L et :
f(a + th) = f(a) + tL(h) + o(t) = f(a) + t(h) + o(t)
donc L(h) + o(1) = (h) + o(1) après simplification par t
et donc L(h) = (h) en passant à la limite
donc L=
EXEMPLE :
2
x xy – x 1
Soit f : y R2 2x2y . Prenons a = 2 . On a alors :
2 2
1 + h 3 + 3h + 4k + k + 4hk + hk
f 2 + k = 4 + 8h + 2k + 4hk + 4h2 + 2h2k
2 2
3 3h + 4k k + 4hk + hk
= 4 + 8h + 2k + 4hk + 4h2 + 2h2k
3 3h + 4k 3 4 h 3 4
Le vecteur 4 n'est autre que f(a). La partie 8h + 2k = 8 2 k est linéaire, de matrice 8 2 .
2 2
k + 4hk + hk
Le reste 4hk + 4h2 + 2h2k est un o(|| (h, k) ||). En effet, si on prend par exemple
-3-
|| (h, k) || = max( h , k ) (mais n'importe quelle autre norme ferait l'affaire, en vertu de l'équivalence
des normes en dimension finie, voir L2/EVNORME.PDF), on a :
k2
0 k qui tend vers 0 quand (h, k) tend vers 0
|| (h, k) ||
et de même pour les autres termes. f est donc différentiable en a et sa différentielle admet pour
3 4 f f
matrice 8 2 , dont on remarquera que les deux colonnes sont respectivement (a) et (a). En
x y
2
f y – 1 f 2xy
effet, = 4xy et = 2x2 . Ainsi, dans cet exemple :
x y
h 3 4 h f f
dfa k = 8 2 k = (a)h + (a)k
x y
ce qu'on note également (notation différentielle) :
f f
dfa = (a) dx + (a) dy
x y
dx (respectivement dy) représentant respectivement la variation relative à x (respectivement à y),
h h
autrement dit, l'application k h (respectivement k k).
REPRÉSENTATION GRAPHIQUE :
On représente ci-dessous la fonction f au voisinage de a en dessinant ce que devient l'image d'un
quadrillage régulier par f. Les courbes en bleu sont les images des droites parallèles à Ox, les
courbes en rouge sont les images des droites parallèles à Oy. Le point a est au centre de l'image de
gauche et f(a) est au centre de l'image de droite.
f
x 3 3 4 x
Si on remplace la fonction f par l'application y 4 + 8 2 y , autrement dit par son
approximation au premier ordre (terme constant + différentielle) au voisinage de a, on obtient la
figure suivante :
-4-
L'image ressemble à celle de f, mais toute courbure a disparu, de même que, si on applique le même
procédé pour une fonction de R dans R, la courbe est remplacée par sa tangente. Si on superpose
les deux images, on visualise les écarts entre f et son approximation au premier ordre, celle-ci étant
d'autant meilleure qu'on se rapproche du centre de la figure f(a).
Par contre, si f est dérivable en a selon un vecteur, et même selon tout vecteur, on ne peut conclure
sur la continuité de f en a. En effet, le fait que f soit dérivable selon un vecteur donne une propriété
de f selon les droites passant par a, mais ne suffit pas à définir un comportement local complet de f.
-5-
EXEMPLE :
Considérons la fonction f suivante :
R2 R
2
y si x 0
(x, y) x
0 si x = 0
Prenons a = (0, 0). f n'est pas continue en a puisque lim f(h, h) = lim h = 0 alors que
h0 h0
2
lim f(h , h) = 1. Cependant f admet une dérivée en a selon n'importe quel vecteur v. En effet, si
h0
0 0
v = 1 (ou plus généralement v = s ), alors f(a + tv) = 0 pour tout t donc est de dérivée nulle, et si
r ts2 s2
v = s avec r 0, alors f(a + tv) = de dérivée .
r r
Ci-dessous, une représentation de la surface z = f(x, y). f est continue selon chaque droite issue de
l'origine, mais n'est pas globalement continue en l'origine.
y2
ou zx = y2 est un cône. Voir le paragraphe traitant
On pourra vérifier que la surface d'équation z =
x
des quadriques dans le chapitre L2/CONIQUES.PDF
PROPOSITION
Si f : U E F est différentiable en a, alors f est dérivable en a selon n'importe quel vecteur v, et
on a :
Dvf(a) = dfa(v)
Démonstration :
f étant différentiable en a, on a, au voisinage de 0 :
f(a + h) = f(a) + dfa(h) + o(|| h ||)
(t) = f(a + tv) = f(a) + dfa(tv) + o(|| tv ||)
= f(a) + t dfa(v) + o(t)
donc est dérivable en 0 et '(0) = Dvf(a) = dfa(v).
-6-
Réciproquement, si f admet des dérivées selon n'importe quel vecteur, et si (e1, ..., en) est une base
de E, alors on peut considérer en particuler les dérivées partielles Dif(a) de f selon les vecteurs de
cette base. Mais on a vu précédemment que l'existence de ces dérivées partielles ne suffisait pas à
impliquer la continuité de f et encore moins sa différentiabilité. Il convient de renforcer les
hypothèses pour conclure.
Si f et toutes ces dérivées partielles sont continues sur U, f est dite C1 sur U. Montrons alors que f
est différentiable.
PROPOSITION
Si f est C1 sur U, alors f différentiable en tout point de U.
Démonstration :
La proposition est équivalente à dire que, si f est C1, alors f admet un développement limité à
l'ordre 1 en tout point de U. Cette propriété a été montrée dans le chapitre L1/CALCDIF1.PDF.
Enfin, la notion d'être C1 ne dépend pas de la base choisie, car si f est C1 dans une base, alors f est
différentiable, la fonction a U dfa L(E, F) est continue, puisque les coefficients de sa matrice
s'expriment avec les dérivées partielles de f, donc sont des fonctions continues de a, donc, pour tout
v, la dérivée selon v est une fonction continue de a :
a Dvf(a) = dfa(v)
f admettra donc des dérivées partielles continues dans toute base.
EXEMPLES :
2
xy si (x, y) (0, 0)
Soit f(x, y) = x + y
2 2
. On a montré dans les exercices du chapitre
0 si (x, y) = (0, 0)
L1/CALCDIF1.PDF que f est continue sur R2, et admet les dérivées partielles suivantes :
2 2 2
y (y – x ) si (x, y) (0, 0)
f
(x, y) = (x + y )
2 2 2
x 0 si (x, y) = (0, 0)
3
2x y si (x, y) (0, 0)
f
(x, y) = (x + y )
2 2 2
y 0 si (x, y) = (0, 0)
Aucune des deux dérivées partielles n'est continue en (0, 0). Donc f n'est pas C1.
f n'est pas différentiable en (0, 0). En effet, si elle l'était, on aurait :
f f
f(x, y) = f(0, 0) + (0, 0)x + (0, 0)y + o(|| (x, y) ||)
x y
= o(|| (x, y) ||)
Si on prend par exemple la norme euclidienne, on devrait donc avoir
f(x, y) xy2
0= lim = lim 2 2 3/2
(x,y)(0,0) || (x, y) || (x,y)(0,0) (x + y )
mais ce n'est pas le cas, comme on le voit en prenant x = y = t et en faisant tendre t vers 0.
Cependant, f peut ne pas être C1 mais être néanmoins différentiable en tout point. Considérons la
fonction :
-7-
y2 sin(x) si y 0
f(x, y) = y
0 si y = 0
f est continue en tout (x, y), y 0, comme produit et composée des conposantes x et y.
x
f est continue en (x0, 0) car y2 sin( ) y2 de limite nulle quand (x, y) tend vers (x0, 0).
y
Pour y 0 :
f x
(x, y) = ycos( ), qui admet une limite nulle en (x0, 0) comme ci-dessus.
x y
f x x
(x, y) = 2ysin( ) – cos( ). Cette fonction n'admet pas de limite en (x0, 0), même si x0 = 0
y y y
f f
(dans ce dernier cas, considérer les limites quand t tend vers 0 de (0, t) et (t, t)).
y y
Cherchons les dérivées partielles en (x0, 0).
f
(x0, 0) est la dérivée en h = 0 de la fonction h f(x0 + h, 0) = 0. Elle est donc nulle.
x
f
On a donc continue sur R2.
x
f
(x0, 0) est la dérivée en h = 0 de la fonction h f(x0, h). Pour x0 = 0, f(x0, h) = 0 et sa
y
f(x , h) – f(x0, 0) f(x0, h) x
dérivée aussi. Si x0 0, 0 = = hsin( 0) est de limite nulle. Donc on a aussi
h h h
f f
(0, 0) = 0, mais n'est pas continue en (x0, 0).
y y
f n'est donc pas C1 sur R2. Elle est C1 sur R2 \ R {0}.
Etant C1 sur R2 \ R {0}, f est différentiable en tout point de cet ensemble.
Bien que n'étant pas C1 sur R2, f admet quand même une différentielle en tout point (x0, 0). En
effet :
x +h
f(x0 + h, k) = k2 sin( 0 ) = O(k2) = o(|| (h, k) ||)
k
f f
= f(x0, 0) + h (x0, 0) + k (x0, 0) + o(|| (h, k) ||)
x y
f est un exemple de fonction différentiable en tout point bien que non C1.
-8-
h1
f(x1 + h1, ..., xn + hn) = f(x1, ..., xn) + M ... + o(|| h ||)
hn
f
où M est la matrice de terme général i . M est la matrice de l'application linéaire df. M s'appelle la
xj
matrice jacobienne de l'application f. Si la matrice est carrée, son déterminant est appelé jacobien
de f.
Plus généralement, pour f : E F, la matrice de dfa dans une base (e1, ..., en) donnée de E et une
base donnée de F est formée des dérivées partielles de f selon les composantes de x relatives à ces
f
bases. La j-ème colonne de la matrice de dfa est en effet dfa(ej) = Dejf(a) = (a).
xj
Un cas particulier est celui où f elle-même est linéaire, auquel cas elle est évidemment égale à
son approximation linéaire !
f(a + h) = f(a) + f(h)
dfa(h) = f(h) pour tout h
dfa = f
Soit f : R F. Si f est dérivable en a au sens des applications d'une variable réelle, on a, comme
pour les applications de R dans R :
f(a + h) = f(a) + hf '(a) + o(h)
dfa est alors l'application linéaire h R hf '(a) F.
Démonstration :
On a :
f(a + h) = f(a) + dfa(h) + o(|| h ||)
g(f(a + h)) = g(f(a) + dfa(h) + o(|| h ||))
= g(b) + dgb(dfa(h) + o(|| h ||)) + o(dfa(h) + o(|| h ||))
Pour conclure, on utilise le fait qu'une application linéaire u sur un espace vectoriel de dimension
finie est lipschitzienne. Son plus petit rapport de Lipschitz, une fois choisies les normes sur son
espace de départ et d'arrivée, est noté ||| u ||| (voir L2/EVNORME.PDF). Donc :
|| o(dfa(h) + o(|| h ||) || || dfa(h) + o(|| h ||) || (h) avec lim (h) = 0
h0
||| dfa ||| || h || (h) + o(|| h ||)
||| dfa ||| o(|| h ||) + o(|| h ||) = o(|| h ||)
On traite de même dgb(o(|| h ||)). Donc :
g(f(a + h)) = g(b) + dgb(dfa(h)) + o(|| h ||)
-9-
EXEMPLES :
Supposons que l'on ait f : Rn Rp et g : Rp Rq
x1 y1 y1 z1
... ... ... ...
xn yp yp zq
fi
Si la matrice jacobienne de f en a est M de terme général et si la matrice jacobienne de g en
xj
gi
b = f(a) est N de terme général , alors la matrice jacobienne de g o f est N M de terme général :
yj
(g o f)i p gi fk
=
xj k=1 yk xj
Si on a :
f g
E=R F R=G
y1 f1(x) y1
x ... = ... z = g ...
yp fp(x) yp
(autrement dit, g est une fonction de plusieurs variables, dépendant toutes au moyen de f, d'un même
paramètre réel x), alors la formule précédente se réduit à :
p
g
(g o f)' = fk'
k=1 yk
Si on a :
f g
E=R FG
Alors d(g o f)a est l'application linéaire h R (g o f)'(a)h.
Comme d(g o f)a(h) = dgb(dfa(h)) = dgb(f '(a)h) = dgb(f '(a))h, avec b = f(a), on en déduit que :
(g o f)'(a) = dgb(f '(a))
ou encore :
(g o f)'(a) = (dgb o f ')(a)
- 10 -
II : Propriétés
1- Gradient
Pour f de U inclus dans un espace vectoriel euclidien E à valeurs R, dfa est une forme linéaire. Or
toute forme linéaire définie sur un espace vectoriel euclidien provient du produit scalaire. Il existe
un vecteur, appelé gradient de f en a, tel que :
h, dfa(h) = <h, grad(f)(a)>
ou, pour abréger :
df(h) = <h, grad(f)>
Reprenons le même exemple que ci-dessus, mais en nous intéressant cette fois à la résultante des
forces appliquées sur le dipôle :
Méthode 1 : Ecrivons directement que cette résultante vaut :
F = qE(B) – qE(A)
Un développement comparable à celui fait précédemment conduit à :
F = dE(O)(p) + o(a) approximé en dE(O)(p)
Mais cette fois E est une fonction de R3 dans R3. Si on introduit la matrice jacobienne de E,
relativement à une base (i, j, k), on aura F de composantes :
- 11 -
Ex Ex Ex Ex E E
x y z x
+ py x + pz x
px
y z
Ey Ey
px
Ey
p = px Ey + py Ey + pz Ey
x
Ez
y
Ez
y
z
pz
Ez x
E
y
E
z
E
x y z
px z + py z + pz z
x y z
Ex
= (px + py + pz ) Ey
x y z Ez
ce qu'on note sous la forme symbolique suivante :
F = <p, grad> E
Méthode 2 :
On a vu que l'énergie potentielle du dipôle était Ep = – <E, p>, de sorte que :
F = – grad(Ep) = grad(<E, p>) = grad(Expx + Eypy + Ezpz) avec seulement Ex, Ey, Ez
fonctions de x, y et z. F a donc pour composantes :
E E E
px x + py y + pz z
x x x
E E
px x + py y + pz z
E
y
E
y
E
y
E
px x + py y + pz z
z z z
Ey Ex Ez Ex Ey Ez
On retrouve le résultat précédent si on montre que = , = et = . Or ces
x y x z z y
Ez Ey
–
y z
relations expriment que
Ex Ez
–
= 0. Le vecteur dans le membre de gauche s'appelle le
z x
Ey Ex
–
x y
rotationnel de E, noté Rot(E) (ou E pour les physiciens). L'égalité avec 0 est vraie car E dérive
d'un gradient et on vérifiera que Rot o grad est identiquement nul (voir le chapitre
L2/GRADIVRT.PDF).
Démonstration :
Si f admet un extremum en a, il en est de même, pour tout vecteur h, de la fonction d'une variable
réelle (t) = f(a + th) qui admet un extremum en t = 0. Si la fonction f est différentiable, est
dérivable et on a nécessairement '(0) = 0. Puisque '(0) = dfa(h) = <h, grad f(a)>, on a pour tout h,
<h, grad f(a)> = 0, donc grad(f)(a) = 0.
- 12 -
2- Inégalité des accroissements finis
PROPOSITION (Inégalité des accroissements finis)
(a) Soit f différentiable sur un ouvert U convexe d'un espace euclidien E à valeurs réelles.
Alors :
(a.i) k R, x U, || grad(f)(x) || k (a, b) U2, f(b) – f(a) k || b – a ||
où || || est la norme euclidienne.
(a.ii) f est constante sur U grad(f) = 0 sur U.
(b) Soit f différentiable sur un ouvert U convexe de E dans F.
(b.i) On suppose qu'il existe un réel k tel qu'en tout point x de U, la différentielle dfx
soit lipschitzienne de rapport k. Alors :
(a, b) U2, || f(b) – f(a) || k || b – a ||
(b.ii) f est constante df est identiquement nulle.
Démonstration :
(a.i) : Le fait que U soit convexe permet de se ramener au cas d'une fonction d'une variable réelle.
g f
Posons u = b – a et considérons (t) = f(a + tu), fonction composée t a + tu f(a + tu) = (t). f
et g sont différentiables.
La différentielle de f en a + tu est l'application linéaire :
dfa+tu : v E <v, grad(f)(a + tu)>
La différentielle de g en t, fonction dérivable, est simplement le produit par la dérivée :
dgt : h R hg'(t) = hu
Donc est différentiable en t et sa différentielle est la composée des différentielles ci-dessus :
dt : h R hu <hu, grad(f)(a + tu)> = h<u, grad f(a + tu)>
étant une fonction d'une variable réelle, cela prouve que est dérivable en t et que sa dérivée vaut
<u, grad(f)(a + tu)>. On a alors :
'(t) = <u, grad(f)(a + tu)>
'(t) || u || || grad(f)(a + tu) || d'après l'inégalité de Cauchy-Schwarz
'(t) k || u || d'après l'hypothèse sur le gradient de f
(1) – (0) k || u || d'après l'inégalité des accroissements finis appliquée à
la fonction d'une variable réelle entre 0 et 1
f(b) – f(a) k || b – a ||
(a.ii) : Si f est constante, sa différentielle est nulle, donc son gradient aussi.
Réciproquement, si son gradient est identiquement nul, on prend k = 0 dans (a.i) et on obtient que,
pour tout a et b dans U, f(b) = f(a). Donc f est constante.
(b.i) Cas 1 : Si E et F sont tous deux euclidiens, on se ramène au (a.i) de la façon suivante. Soit v
un vecteur unitaire de F, colinéaire et de même sens que le vecteur f(b) – f(a). De la sorte :
|| f(b) – f(a) || = <f(b) – f(a), v>
- 13 -
~ ~ ~
Considérons alors la fonction f de E dans R définie par : x U f (x) = <f(x), v>. f est la
f <., v>
composée des deux fonctions x f(x) <f(x), v>. La première est différentiable de
différentielle dfx. La deuxième est le produit scalaire à droite par v, donc est linéaire, donc est égale
~
à sa différentielle. f est donc différentiable et sa différentielle est l'application linéaire :
u E <dfx(u), v> = <u, (dfx)*(v)>
où l'application linéaire (dfx)* : F E est l'adjoint de l'application linéaire dfx : E F (voir le
chapitre L2/PREHILB.PDF pour la notion d'adjoint, qui n'est autre que de vérifier l'égalité ci-
dessus). Donc :
~ ~
<u, grad( f )(x)> = d f x(u) = <u, (dfx)*(v)>
Cette égalité étant vraie pour tout u, on a :
~
grad( f )(x) = (dfx)*(v)
Vérifions que, si dfx est lipschitzienne de rapport k, alors (dfx)* aussi. Soit w un vecteur quelconque
de F, et z un vecteur unitaire de E, colinéaire et de même sens de (dfx)*(w). On a :
|| (dfx)*(w) || = <(dfx)*(w), z>
= <w, dfx(z)> par définition de l'adjoint
|| w || || dfx(z) || d'après l'inégalité de Cauchy-Schwarz
k || w || || z || car dfx est k-lipschitzienne
k || w || car z est unitaire
On a donc :
~
|| grad( f )(x) || = || (dfx)*(v) ||
k || v || = k car v est unitaire
~
On peut donc appliquer (a.i) à la fonction f et on obtient :
~ ~
f (b) – f (a) k || b – a ||
~
<f(b), v> – <f(a), v> k || b – a || par définition de f
<f(b) – f(a), v> k || b – a ||
|| f(b) – f(a) || k || b – a || par définition de v
- 14 -
k || b – a ||
Le point délicat est la première inégalité. Elle repose sur la propriété que la norme d'une intégrale
d'une fonction d'une variable réelle à valeurs vectorielles est inférieure ou égale à l'intégrale de la
norme de cette fonction. Pour une fonction en escalier à valeurs vectorielles, c'est simplement
l'inégalité triangulaire vérifiée par la norme d'une somme finie. Le cas d'une fonction continue se
prouve par passage à la limite en approximant uniformément la fonction continue par une suite de
fonctions en escalier.
Les conclusions du (a.ii) et du (b.ii) s'étendent à des ouverts U plus généraux que des ouverts
convexes, à savoir les ouverts connexes (voir leur définition dans le chapitre L3/TOPOLOG.PDF).
En effet, (a.ii) et (b.ii) montrent qu'une fonction f dont le gradient ou la différentielle est
identiquement nulle est constante sur toute boule de U (puisqu'une boule est convexe). f est alors
dite localement constante. On montre ensuite que, dans un ouvert connexe, une fonction
localement constante est constante. On voit un exemple de ce type de démonstration dans le chapitre
L3/HOLOMRPH.PDF.
EXEMPLE :
Soit f définie sur un ouvert convexe tel que df soit égale en tout point à une même application
linéaire L. Alors f = L + Cte.
En effet, f – L a une différentielle nulle en tout point sur un ouvert convexe, donc est constante.
Il ne suffit pas que f soit bijective et C1 pour que la réciproque soit C1. C'est déjà faux pour les
fonctions de R dans R (prendre x x3).
Il peut être difficile d'expliciter f–1 et donc de prouver que f est un difféomorphisme. Pour ce faire,
nous disposons des résultats suivants :
- 15 -
Soit f une fonction d'un ouvert U de E dans F, de classe C1, et soit a un point de U. On suppose que
df(a) est inversible. Alors il existe un voisinage U' de a inclus dans U et un voisinage W de f(a) tels
que f soit un difféomorphisme de U' sur W.
EXEMPLE :
rcos()sin()
Soit f : R R définie par f(r, , ) = rsin()sin() . Le jacobien de f est :
3 3
rcos()
cos()sin() rcos()cos() – rsin()sin()
sin()sin() rsin()cos() rcos()sin() = r2sin()
cos() – rsin() 0
f correspond au changement de variables en coordonnées sphériques. f est localement bijective sauf
si r = 0, et f–1 est C1.
PROPOSITION
Soient E et F deux espaces vectoriels de même dimension et soit f : U E V F une fonction
bijective, C1 et telle que son jacobien ne s'annule pas sur U. Alors f est un difféomorphisme.
Autrement dit, pour f bijective et C1, on saura que f–1 est C1 en se contentant de calculer le jacobien
de f et en vérifiant qu'il ne s'annule pas sur U. On n'a pas besoin d'expliciter f–1. Cependant, il peut
être difficile de montrer que f est bijective. Pour y parvenir, on est souvent contraint de diminuer la
taille de U et de V.
Pour une fonction de R dans R, on reconnaîtra le fait que, pour f bijective de classe C1, f–1 est C1 si
1
f ' ne s'annule pas. On sait en outre que, dans ce cas, (f–1)' = . Ce n'est que le cas particulier de
f '(f–1)
la formule vue précédemment : si g = f–1, dfx et dgf(x) sont réciproques l'un de l'autre. Ou encore, si
y = f(x) :
d(f–1)y = (dfx)–1 = (df f–1(y))–1
Démonstration :
Le théorème d'inversion locale permet de dire que, pour tout x de E, il existe un voisinage de x et
un voisinage de f(x) tels que f–1 est C1 depuis le voisinage de x sur le voisinage de f(x). f–1 étant C1
sur un voisinage de chaque élément de V, f–1 est C1 sur V et f est un difféomorphisme.
EXEMPLES :
Changement de coordonnées en polaire :
(r, ) (x, y) = (rcos(), rsin()) = f(r, ) est une fonction de classe C1.
- 16 -
x x
Sa matrice jacobienne est J =
r cos() –rsin()
= . Son jacobien est r. Il est non nul pour r
y y sin() rcos()
r
non nul. Cependant, f n'est pas bijective, même si on suppose r non nul. est en effet défini à 2
près. Par contre, si on restreint l'espace de départ à U = ]0, [ ]–, [ et celui d'arrivée à V égal à
R2 privé de la demi-droite {(x,y) | y = 0, x < 0}, alors f est bijective et C1, donc est un
difféomorphisme d'après la proposition. La matrice jacobienne de f–1 est donnée par :
r r
x x y
y = J–1 = 1 rcos() rsin() = x + y x + y2
2 2 2
r –sin() cos() – y x
x y x2 + y2 x2 + y2
r x r y
On a donc = 2 et = 2 , ce qu'on peut retrouver à partir de r = x2 + y2, mais on a
x x +y 2
y x +y 2
également = – 2
y = x sans qu'il soit nécessaire d'avoir une expression explicite de
2 et
x y x + y
2 2
x +y
en fonction de (x, y) sur tout le domaine considéré. Une telle expression peut être cependant
obtenue de la façon suivante. Soit M le point (x, y). Traçons le cercle de centre O = (0, 0) passant
par M. Ce cercle a pour rayon r. Soit A le point (–r, 0) et B le point (r, 0).
A O B
L'angle BOM vaut , et l'angle BAM vaut (voir angle inscrit dans L2/GEOMEUCL), de sorte que
2
tan() =
y
. On obtient donc :
2 x+r
y
(x, y) = 2 arctan( 2 )
x + y2 + x
On pourra alors vérifier les valeurs trouvées plus haut pour et
x y
Soit un arc paramétré de E, donné par le paramétrage t R (t) E. En un point régulier
de (i.e. où la dérivée de est non nulle), la tangente est dirigée par le vecteur '(t). Soit f un
difféomorphisme de E dans F. Alors t f((t)) défini un paramétrage de la courbe f() dans F. Si
tous les points de sont réguliers, il en est de même de ceux de f() puisque l'on a :
(f o )'(t) = df((t))('(t))
En effet, '(t) étant un vecteur non nul et df étant inversible en tout point, le vecteur ci-dessus est
non nul. Il s'agit du vecteur tangent en f((t)) à f().
- 17 -
4- L'équation des ondes
Les difféomorphismes permettent d'effectuer des changements de variables pouvant rendre des
problèmes plus facile à résoudre. On en voit des exemples dans les exercices du chapitre
L1/CALCDIF1.PDF portant sur la résolution d'équations aux dérivées partielles, même si le terme
difféomorphisme n'est pas utilisé dans ledit chapitre. Traitons ici le cas de l'équation des ondes, qui a
pour expression :
2f 1 2f
– 2 =0
x2 c t2
où c est une constante strictement positive. f est supposée C2. En physique, x représente une
abscisse, t le temps, c une vitesse, f l'amplitude d'une onde qui se propage. On expliquera plus bas
pourquoi on obtient une telle modélisation d'une onde.
EXEMPLES :
- 18 -
Résoudre l'équation des ondes vérifiant les deux conditions :
x, f(x, 0) = sin(x)
t, f(0, t) = sin(t)
Si f(x, t) représente l'ordonnée à l'instant t d'un point d'une corde vibrante situé à l'abscisse x (on voit
un peu plus loin pourquoi une modélisation d'une telle corde vérifie l'équation des ondes), la
première égalité donne la position initiale de la corde, et la deuxième décrit le mouvement du point
d'abscisse nulle.
On a vu qu'il existe et telles que : x, t, f(x, t) = (x – ct) + (x + ct). On veut donc que :
x, sin(x) = (x) + (x)
t, sin(t) = (– ct) + (ct)
x x
On peut écrire la deuxième égalité sous la forme : x, (– x) + (x) = sin( ) en posant t = . Si l'on
c c
décompose les fonctions = p + i et = p + i avec p et p paires, i et i impaires (voir
le chapitre L1/ESPVECT.PDF pour la preuve de l'existence et de l'unicité d'une telle
décomposition), on obtient les équations :
i(x) + i(x) = sin(x)
p(x) + p(x) = 0
– i(x) + i(x) = sin(x)
c
ce qui permet de déterminer i et i, à savoir :
i(x) = 12 sin(x) – 12 sin(xc)
i(x) = 1 sin(x) + 1 sin(x)
2 2 c
Les parties paires vérifient p = – p = h fonction arbitraire paire. Les solutions sont donc :
1 1 x 1 1 x
f(x, t) = sin(x – ct) – sin( – t) + sin(x + ct) + sin( + t) + h(x – ct) – h(x + ct)
2 2 c 2 2 c
Il ne suffit pas de connaître la position initiale d'une corde vibrante et le mouvement d'un de ses
points pour que le mouvement global de la corde soit connu.
g et h étant deux fonctions données (respectivement C2 et C1), résoudre l'équation des ondes
vérifiant les deux conditions :
x, f(x, 0) = g(x)
f
x, (x, 0) = h(x)
t
Si f(x, t) représente l'ordonnée à l'instant t d'un point d'une corde vibrante situé à l'abscisse x, la
première égalité donne la position initiale de la corde, et la deuxième donne la vitesse initiale de
chacun de ses points.
On a vu qu'il existe et telles que : x, t, f(x, t) = (x – ct) + (x + ct). On veut donc que :
x, (x) + (x) = g(x)
x, – c'(x) + c'(x) = h(x)
Si on dérive la première égalité, on obtient '(x) + '(x) = g'(x), donc :
'(x) = cg'(x)2c– h(x)
'(x) = cg'(x) + h(x)
2c
- 19 -
Donc il existe des constantes et telles que :
g(x) 1 x
(x) = – h(z) dz +
2 2c
0
(x) =
g(x) 1 x
+ h(z) dz +
2 2c
0
On en déduit que, nécessairement :
g(x – ct) + g(x + ct) 1 x+ct
f(x, t) = + h(z) dz + +
2 2c
x–ct
La condition f(x, 0) = g(x) impose alors que + = 0. On obtient donc la solution unique :
g(x – ct) + g(x + ct) 1 x+ct
f(x, t) = + h(z) dz
2 2c
x–ct
f
On pourra vérifier que la deuxième équation (x, 0) = h(x) est bien satisfaite.
t
Ainsi, si on se donne la position initiale de la corde et la vitesse initiale de chacun de ses points, le
mouvement de la corde est défini de manière unique.
Pour une onde se propageant dans l'espace de dimension 3, l'équation des ondes s'écrit :
2f 2f 2f 1 2f
+ + – 2 =0
x2 y2 z2 c t2
2f 2f 2f
La quantité 2 + 2 + 2 s'appelle laplacien de f et se note usuellement f.
x y z
Résolvons cette équation dans le cas d'une onde sphérique, c'est-à-dire telle que f ne dépende que de
la distance r de (x, y, z) à un point O = (0, 0, 0). Dans les exercices du chapitre L1/CALCDIF1.
PDF, on a exprimé le laplacien d'une fonction f qui ne dépend que de (r, t). On trouve aussi cette
expression dans le chapitre L2/GRADIVRT.PDF :
2 f 2f
f = +
r r r2
On doit donc résoudre :
2 f 2f 1 2f
+ – =0
r r r2 c2 t2
g
Soit g une fonction de (r, t) telle que f = . On a :
r
2f 1 2g
=
t2 r t2
f g 1 g
=– 2+
r r r r
f 2g 2 g 1 2g
2
= 3– 2 +
r2 r r r r r2
L'équation des ondes devient :
2g 2 g 2g 2 g 1 2g 1 1 2g
– 3+ 2 + 3– 2 + – =0
r r r r r r r r2 c2 r t2
2g 1 2g
– 2 =0
r2 c t2
- 20 -
On obtient une équation des ondes ordinaire sur g, dont les solutions sont (r – ct) + (r + ct). On
obtient donc, pour solutions f :
1 1
f(r, t) = (r – ct) + (r + ct)
r r
superposition de deux ondes, la première issue de O, la seconde se dirigeant vers O, et dont
l'amplitude tend vers 0 quand r tend vers +.
EXEMPLES DE MODÉLISATION :
L'équation des ondes intervient dans de très nombreux domaines en physique. Nous en donnons
trois exemples.
Equation des ondes en électromagnétisme. Les équations de Maxwell dans le vide sont :
div(E) = 0
div(B) = 0
Rot(E) = – B
t
Rot(B) = 0 E
1
0 t
où E et B désignent le champ électrique et magnétique, fonction de la position et du temps. 0 et 0
Ex Ey Ez
sont deux constantes. div(E), appelée divergence, désigne la fonction + + , où
x y z
(Ex, Ey, Ez) sont les composantes de E dans une base donnée (voir le chapitre L2/GRADIVRT.PDF).
On suppose les fonctions E et B au moins de classe C2. On en déduit :
2E 1
2 = (Rot(B)) en dérivant la quatrième équation de Maxwell par
t 00 t
rapport à t
Rot(B)
1
= en utilisant le théorème de Schwarz
00 t
1
=– Rot(Rot(E)) en utilisant la troisième équation de Maxwell.
00
Or, on pourra vérifier que Rot(Rot(E)) = grad(div(E)) – E où = div o grad est le laplacien,
appliqué à chaque composante de E. Comme div(E) = 0, on obtient :
2E 1
2 = E
t 00
On obtient une équation identique pour B. Si on se limite à la propagation de l'onde
électromagnétique dans une seule direction (onde plane), par exemple selon Ox, et si on suppose E
fonction uniquement de x et t, l'équation se réduit à :
2E 1 2E
=
t2 00 x2
1
L'onde se propage à la vitesse c telle que c2 = .
00
L iL
La longueur séparant chaque masse est l = , longueur au repos des ressorts. Notons xi = la
n n
position au repos de la ième masse. Notons ui le déplacement de la masse i le long de la tige, de sorte
que ui(t) = u(xi, t). La loi fondamentale de la mécanique appliquée à la ième masse (en dehors des
deux extrémités) donne :
d2u
m 2i = k(ui+1 – ui) – k(ui – ui–1) = k(ui+1 – 2ui + ui–1)
dt
2
d ui u2
n'est autre que 2 calculé en xi. Par ailleurs, si n tend vers +, l tend vers 0 et l'on peut
dt2 t
effectuer un développement limité de ui+1 et de ui–1 sous la forme :
u l2 2u 2 u l2 2u 2
ui+1(t) = u(xi+1, t) = u(xi + l, t) = u(xi, t) + l + + o(l ) = u i + l + 2 + o(l )
x 2 x2
x 2 x
u u 2
les dérivées et 2 étant calculées en xi et à l'instant t
x x
De même :
u l2 2u 2 u l2 2u
ui–1(t) = u(xi–1, t) = u(xi – l, t) = u(xi, t) – l + + o(l ) = u i – l + + o(l2)
x 2 x2 x 2 x2
L'équation devient :
2u 2u
m 2 = kl2 2 + o(l2)
t x
m
Relions les quantités m et k à des grandeurs macroscopiques liées à la tige. n'est autre que la
l
masse linéique . Par ailleurs, on définit le module d'élasticité d'Young, noté E (en Nm–2), comme le
coefficient vérifiant :
dL f
=
L E
où f est une force par unité de surface exercée à une extrémité de la tige pour l'allonger de dL. Si S
est la section de la tige, la force totale exercée est F = fS, et l'allongement de chaque ressort sera de
F nF dL f nF F nSE SE
. L'allongement total sera = dL. La relation = s'écrit donc = , d'où k = = .
k k L E kL SE L l
u
2
u
2
L'équation m 2 = kl2 2 + o(l2) devient alors :
t x
2u 2u
2 = SE 2 + o(l)
t x
Si on fait tendre n vers + et donc l vers 0, on obtient à la limite :
2u 2u
2 = SE 2
t x
u u
2 2
– =0
x2 SE t2
2u 2u
– =0
x2 E t2
- 22 -
E
On reconnaît une équation des ondes, avec une vitesse de propagation c = .
- 23 -
THEOREME DES FONCTIONS IMPLICITES
Avec les notations précédentes, soit a un point de S. On suppose que le déterminant
f
det(( i )1ip, n–p+1jn) est non nul au point a. On note le projecteur suivant :
xj
: (x1, ..., xn–p, xn–p+1, ..., xn) Rn (x1, ..., xn–p) Rn–p
Alors :
(i) Il existe un voisinage V de a et un voisinage V' de (a) satisfaisant les propriétés
suivantes :
pour tout x élément de S V, (x) est élément de V',
et pour tout (x1, ..., xn–p) élément de V', il existe un unique p-uplet (xn–p+1, ..., xn) tel que
x = (x1, ..., xn) soit élément de S V.
(ii) L'unicité précédente permet de définir une relation fonctionnelle :
: (x1, ..., xn–p) V' (xn–p+1, ..., xn) Rp
Cette fonction est C1.
L'hypothèse demandée sur le déterminant exprime que les p différentielles df1(a) ..., dfp(a) forment
un système de p formes linéaires qui est de rang p, donc qui sont linéairement indépendantes, ou
encore que les p gradients grad(f1)(a), ..., grad(fp)(a) sont des vecteurs linéairement indépendants.
Démonstration :
...
x1
x 1
x
(i) : On applique le théorème d'inversion locale en a à la fonction F : ... f (x , ..., x ) . F
n–p
x ... 1 1 n
f (x , ..., x )
n
p 1 n
In–p O
est C1 et sa matrice jacobienne est de la forme A B , où le bloc B est précisément formé des
f
coefficients i , 1 i p, n – p + 1 j n. Or on a supposé que det(B) 0. Par conséquent, cette
xj
In–p O
matrice jacobienne A B est inversible, et dF(a) aussi. On peut donc inverser localement F. F est
- 24 -
a1
car a
...
an–p
un difféomorphisme d'un voisinage V de a sur un voisinage W de F(a), avec F(a) =
0
...
0
est supposé appartenir à S :
... y
x1
x1
x = ... = F–1
x 1
(y) V F(x) = f (x , ..., x ) = ... = y W
n–p
xn ... y
1 1 n
f (x , ..., x )
n
p 1 n
Appliquons cette correspondance lorsque x est dans S V. Puisque f1(x) = ... = fp(x) = 0 dans ce
cas, la correspondance est :
x1 y1
... ...
x1
x = ... = F–1(y) S V F(x) =
xn–p yn–p
= =yWH
xn
0
0
...
0 ...
0
où H est le sous-espace vectoriel de R d'équations yn–p+1 = ... = yn = 0.
n
Posons V' = (W H) et vérifions que V' est un voisinage de (a). Munissons par exemple Rn de
la norme :
|| (x1, ..., xn) || = Max { xi , 1 i n}
W étant un voisinage de F(a), il contient une boule B(F(a), R) de centre F(a) et de rayon R > 0 :
B(F(a), R) = {y Rn, || y – F(a) || < R}
= {(y1, ..., yn) | i [[ 1, n – p ]] , yi – ai < R et i [[ n – p + 1, n ]] , yi < R}
W H contient B(F(a), R) H = {(y1, ..., yn–p, 0, ..., 0) | i [[ 1, n – p ]] , yi – ai < R}
V' = (W H) contient (B(F(a), R) H) = {(y1, ..., yn–p) | i [[ 1, n – p ]] , yi – ai < R} qui est
la boule de centre (a) et de rayon R. V' est donc bien un voisinage de (a).
Si x est élément de S V, y = F(x) est élément de W H et :
x1 y1
(x) = ... = ... = (y) (W H) = V'
xn–p yn–p
x1
Réciproquement, soit ... élément de V' = (W H), donc image par d'un élément y de
xn–p
x1
...
xn–p
W H. y n'est autre que 0 . y est élément de W donc il existe un élément x de V tel que
...
0
F(x) = y. y est aussi élément de H donc l'élément x trouvé vérifie :
- 25 -
i [[ 1, p ]] , fi(x) = yn–p+i = 0
donc x appartient aussi à S.
x1 xn–p+1 x1
On a donc montré que pour tout ... élément de V', il existe ... tel que x = ... soit
xn–p xn xn
x1
...
xn–p
élément de S V. Il suffit de prendre x = F–1 0 .
...
0
x1
Cette solution x est la seule possible, car si x est un élément de S V vérifiant (x) = ... , alors
xn–p
x1
...
xn–p
nécessairement, F(x) = et F est bijective.
0
...
0
(ii) : La fonction cherchée est constituée des p dernières composantes de F–1 appliquée sur
x1
...
xn–p –1
0 . Puisque F est un difféomorphisme, F est C , donc également.
1
...
0
Montrons comment calculer la différentielle de . Pour tout x = (x1, ..., xn) de S V, notons
= (x1, ..., xn–p), de sorte que x = (, ()). On a donc f(, ()) = f(x) = 0 pour tout de V'.
f
Différentions la fonction composée x = f(x) = f(, ()). Comme f o = 0, on a
()
également :
dfx o d = 0
Notons J(f) la matrice de dfx (matrice jacobienne de f en x), élément de Mpn(R). En reprenant les
notations de la première partie de la démonstration, on a J(f) = (A B), A élément de Mp,n–p(R), B
élément de Mp,p(R). On rappelle que det(B) 0.
Notons J() la matrice de d, élément de Mp,n–p(R), et J() celle de d, élément de Mn,n–p(R).
In–p
On a J() = .
J()
La relation 0 = dfx o d s'écrit matriciellement sous la forme :
In–p
(A B) =0
J()
A + BJ() = 0
- 26 -
J() = – B–1A
Notons n–p+1, ..., n les p composantes de qui donnent les valeurs de xn–p+1, ..., xn. L'égalité
précédente s'écrit, en ce qui concerne la k-ème colonne, 1 k n – p :
n–p+1 f1
xk
()
xk
(x)
n
... = – B–1 ...
fp
xk
()
xk
(x)
EXEMPLES :
Pour n = 2 et p = 1, S = {(x, y), f(x, y) = 0}, définissant une courbe du plan. On peut écrire
f
localement y = (x) si 0 au point considéré. Cela signifie que le gradient n'est pas colinéaire à
y
Ox et donc que la tangente à la courbe n'est pas parallèle à Oy.
f
La matrice B se réduit au seul terme ( ). La dérivée de vaut :
y
f
(x, (x))
x
'(x) = –
f
(x, (x))
y
expression déjà rencontrée dans le chapitre L1/CALCDIF1.PDF dans la partie traitement des
courbes définies par une équation dans le plan.
f
Par exemple, dans le cas du cercle unité d'équation x2 + y2 – 1 = 0, on a 0 en tout point sauf les
y
deux points ( 1, 0). Au voisinage de tout point a du cercle en dehors de ces deux points, il est
possible d'exprimer y en fonction de x, à savoir y = 1 – x2 ou y = – 1 – x2. Pour avoir unicité de
la solution, il convient de prendre le voisinage de a suffisamment petit, inclus soit dans R ]0, +[,
soit dans R ]–, 0[ selon le signe de l'ordonnée de a.
(x2 + y2 – 1)
dy x x x
Pour y > 0 par exemple, = – qui est bien égal à – =– .
dx 1–x 2
y
(x2 + y2 – 1)
y
f
(x, (x))
x
Dans le cas prédédent, la relation '(x) = – permet de voir par récurrence sur k que, si f
f
(x, (x))
y
est Ck, alors également. En effet, si la propriété est prouvée jusqu'au rang k, et que f est Ck+1, alors
f f
et sont Ck, comme , donc le second membre est Ck, donc ' est Ck, donc est Ck+1.
x y
- 27 -
f f
au voisinage de (0, 0). On a = exp(x + y) + 2, donc (0, 0) 0, donc localement, on peut
y y
théoriquement exprimer y en fonction de x, mais il n'en existe pas d'expression explicite sous forme
de fonctions classiques. Cependant, il existe un paramétrage de la courbe sous la forme suivante.
Prenons comme paramètre t tel que t = x + y. (x, y) est élément de S si et seulement si :
x+y=t
x + 2y = 1 – e
t
t
x = 2t – 1 + e
y=1–t–e
t
Pour n = 3 et p = 1, S = {(x, y, z), f(x, y, z) = 0} définissant une surface. On peut écrire localement
f
z = (x, y) si 0 au point considéré. Cela signifie que le gradient n'est pas parallèle au plan Oxy
z
et donc que le plan tangent à la surface ne contient pas Oz.
f
La matrice B se réduit au seul terme ( ). Les dérivées partielles de sont :
z
f f
= – x = – y
et
x f y f
z z
f
Par exemple, dans le cas de la sphère unité d'équation x2 + y2 + z2 – 1 = 0, on a 0 en tout point
z
sauf ceux du cercle unité contenu dans le plan z = 0. Au voisinage de tout point de la sphère en
dehors de ceux de ce cercle, il est possible d'exprimer z en fonction de (x, y), à savoir
z = 1 – x2 – y2 ou z = – 1 – x2 – y2.
z x z y
Pour z > 0, = – et = – , qu'on retrouve également avec les
x 1–x –y2 2
y 1 – x2 – y2
expressions respectives suivantes :
f (x2 + y2 + z2 – 1)
x x x
– =– =–
f (x2 + y2 + z2 – 1) z
z z
f (x2 + y2 + z2 – 1)
y y y
et – =– =–
f (x2 + y2 + z2 – 1) z
z z
On procèdera à une vérification analogue pour z < 0.
f1(x, y, z) = 0
Pour n = 3 et p = 2, S est une courbe donnée par un système f (x, y, z) = 0 , intersection de la
2
surface 1 d'équation f1(x, y, z) = 0 et de la surface 2 d'équation f2(x, y, z) = 0. On peut trouver
- 28 -
fx1 fy1
x = 1(z)
deux fonctions 1 et 2 telle que au voisinage d'un point M donné si
0 au
y = 2(z) f 2 f 2
x y
point M. Cela signifie que le produit vectoriel grad(f1)(M) grad2(M) possède une composante non
nulle suivant l'axe z. Or grad(f1)(M) est orthogonal au plan tangent en M à 1 et grad(f2)(M) est
orthogonal au plan tangent en M à 2. grad(f1)(M) grad(f2)(M) étant non nul, ces deux plans sont
distincts et se coupent suivant une droite, la tangente en M à S, qui est dirigée précisément par
grad(f1)(M) grad(f2)(M), vecteur commun aux deux plans. Si sa composante suivant l'axe z est
non nulle, cela signifie que cette tangente à S est n'est pas contenue dans le plan Oxy.
Les dérivées de 1 et 2 se calculent comme suit :
f1 f1 f
–1 1
1'
=–
x y z
2' f2 f2 f2
x y z
f f f f
– 2 1+ 1 2
1' =
y z y z
f1 f2 f1 f2
donc
–
x y y x
2
- 29 -
On vérifie qu'on a bien :
f2 f1 f1 f2
– +
dx y z y z – 4yz
= – z = 1'(x) = = =–z
dz f1 f2 f1 f2 4xy – 4y(x – 1)
–
x y y x
f2 f1 f1 f2
–
dy –z–z 3
x z x z 4(x – 1)z (x – 1)z
= = 2' = = =
dz 2
3 – 2z – z 4
f f f f 4xy – 4y(x – 1) y
1 2
– 1 2
x y y x
1- Formes différentielles
h1
Une forme linéaire sur R est une application de la forme ... a1h1 + ... + anhn, où les ai sont
n
hn
des constantes. Une forme différentielle est du même type, mais où on remplace les constantes ai
par des fonctions de variables (x1, ..., xn).
DEFINITION
On appelle forme différentielle de degré 1 sur un ouvert U de Rn une quantité notée :
= P1dx1 + ... + Pndxn
où les Pi sont des fonctions de U dans R.
Elle est de classe C1 si, pour tout i, Pi est de classe C1.
Cette notation signifie la chose suivante. Pour tout x = (x1, ..., xn), on peut définir en ce point la
fonction linéaire :
(h1, h2, ..., hn) P1(x)h1 + ... + Pn(x)hn
- 30 -
Les premiers exemples de formes différentielle sont évidemment les différentielles df de fonctions f
f
à valeurs réelles, où Pi = . On se pose alors le problème réciproque. Etant donné une forme
xi
différentielle , existe-t-il une fonction f telle que = df ? Si tel est le cas, f est une primitive de .
Ce problème peut se poser également sous la forme suivante : étant donné un champ de vecteurs
P1 P1
... (i.e. une fonction de Rn dans Rn) existe-t-il une fonction f telle que grad(f) = ... ?
Pn Pn
Si c'est le cas, on dit que la forme différentielle est exacte, ou que le champ de vecteurs dérive d'un
potentiel. Dans le cas où les fonctions Pi sont de classe C1, il est nécessaire, d'après le théorème de
P P 2f
Schwarz que i = j pour tout i différent de j, puisque chaque membre devra être égal à ,
xj xi xixj
avec f primitive de , de classe C2. Pour une forme différentielle Pdx + Qdy + Rdz de R3, cela
s'exprime sous la forme suivante :
R Q
– =0
y z
P R
– =0
z x
Q P
– = 0 (seule relation à utiliser pour la forme Pdx + Qdy en dimension 2)
x y
R Q
–
y z
On reconnaît dans le vecteur
P R
– P
le rotationnel de Q . Ainsi, pour que (P, Q, R) dérive
z x
Q P R
–
x y
d'un gradient, il est nécessaire que son rotationnel soit nul.
Malheureusement, ces conditions ne sont pas toujours suffisantes. Une forme différentielle vérifiant
P P
les conditions i = j est dite fermée. Elle n'admet donc pas nécessairement de primitive. Nous
xj xi
admettrons cependant que la condition donnée est suffisante localement sur les boules, ou les
convexes, ou les ouverts dits étoilés :
DEFINITION
On dit que U est un ouvert étoilé de pôle M si, pour tout point N de U, le segment [MN] est
contenu dans U.
- 31 -
M N
EXEMPLES :
Un ouvert convexe est étoilé. Tout point peut servir de pôle.
R2 \ {(x, 0), x 0} est étoilé, de pôle tout point M = (x, 0), avec x > 0.
R2 \ {(0, 0)} n'est pas étoilé.
Pi Pj
(i) Si est exacte, alors est nécessairement fermée, i.e. : i, j,
= .
xj xi
(ii) Réciproquement, si est fermée et si U est un ouvert étoilé, alors est exacte
(Théorème de Poincaré).
Démonstration :
Comme on l'a vu, le (i) est une conséquence directe du théorème de Schwarz.
Le (ii) est démontré pour n = 3 dans l'annexe II, première partie du théorème.
EXEMPLES :
y x y
Soit = – dx + 2 dy, définie sur R2 privé de l'origine. On a P = – et
x2 + y2 x + y2 x2 + y2
x
Q= et :
x + y2
2
P x2 – y2 Q
=– 2 =
y (x + y2)2 x
Donc est une forme fermée. Mais le domaine sur lequel elle est définie n'est pas un ouvert étoilé.
On ne peut donc affirmer que est exacte. Par contre, si on se limite, comme dans le changement
en polaire à :
U = R2 \ {(x, 0), x 0}
qui est un ouvert étoilé, alors on est sûr qu'une primitive de existe. On pourra vérifier par exemple
y
que est la différentielle exacte de f(x, y) = 2 arctan( 2 ). Si O = (0, 0) et M = (x, y), f n'est
x + y2 + x
autre que l'angle compris entre – et de l'axe Ox avec OM, comme on l'a vu plus haut. f ne peut
se prolonger à R2 – {(0, 0)}. En effet, f tend vers d'un côté de l'axe {(x, 0) | x < 0} et vers – de
l'autre côté. Il n'y a pas de primitive de sur R2 \ {(0, 0)}.
- 32 -
x y
Par contre, 2 2 dx + dy est une forme exacte sur R2 \ {(0, 0)}, différentielle de
x +y x + y2
2
1
ln(x2 + y2).
2
y
On considère (x, y) = arctan( ) dx + ln( x2 + y2) dy, définie sur le demi-plan x > 0. est-elle
x
une forme différentielle exacte ? Si oui, déterminer f telle que = df.
y 1
Posons P = arctan( ) et Q = ln( x2 + y2) = Q = ln(x2 + y2). On a :
x 2
P x Q
= 2 2=
y x + y x
Donc est fermé. Le demi-plan étant convexe (donc étoilé), est une forme exacte. f existe donc. f
doit vérifier :
f
x y
= arctan( )
x
f = ln( x2 + y2)
y
Si on intègre la deuxième équation, x étant fixé strictement positif quelconque :
f(x, y) =
1
ln(x2 + y2) dy qu'on intègre par parties
2
y ln(x2 + y2) y2
= – 2 dy
2 x + y2
2 2
y ln(x + y ) x2
= – 1– 2 dy
2 x + y2
y ln(x2 + y2) x2
= – y +
2 x2 + y2 dy
2 2
y ln(x + y ) y
= – y + x arctan( ) + (x)
2 x
Noter la présence de (x) dans le résultat final, "constante" d'intégration relativement à y, mais
dépendant a priori de x puisque le calcul précédent dépend de la valeur de x que l'on s'est donnée.
On réinjecte dans la première équation et on obtient :
y f xy y xy y
arctan( ) = = 2 2 + arctan( ) – 2 2 + '(x) = arctan( ) + '(x)
x x x + y x x +y x
donc '(x) = 0 pour tout x et est réellement constante.
y ln(x2 + y2) y
Les primitives de sont – y + x arctan( ) + Cte.
2 x
Résolution générale de df = Pdx + Qdy, supposée être une forme exacte, avec P et Q de classe C1.
Cette forme est donc a fortiori fermée, et on suppose donc que P et Q sont C1 et vérifie la condition
P Q
= . On se place au voisinage d'un point (x0, y0) du domaine où P et Q sont définies. L'équation
y x
à résoudre équivaut à :
- 33 -
f f
= P et = Q
x y
Si on considère la deuxième équation, x étant fixé, on a :
f y
= Q f(x, y) = f(x, y0) +
y Q(x, s) ds
y
0
(Le terme f(x, y0) joue le rôle du terme (x) de l'exemple précédent).
On reporte dans la première équation, en admettant qu'on puisse permuter le symbole de dérivation
par rapport à x et celui d'intégration par rapport à y (ce type de question est l'objet du chapitre
L2/SUITESF.PDF)1 :
f f y
Q
= P (x, y0) +
x x x (x, s) ds = P(x, y)
y
0
f y
Q P(x, s) ds
y
(x, y0) = P(x, y) – (x, s) ds = P(x, y) –
x x y
y y
0 0
f s=y
(x, y0) = P(x, y) – [P(x, s)] = P(x, y) – (P(x, y) – P(x, y0))
x s=y0
f
(x, y0) = P(x, y0)
x
x
f(x, y0) =
P(t, y0) dt + f(x0, y0).
x
0
x y
Ainsi, la solution est f(x, y) =
P(t, y0) dt + Q(x, s) ds + f(x0, y0), ce qu'on peut écrire
x y
0 0
également sous la forme :
x y
f(x, y) – f(x0, y0) =
P(t, y0) dt + Q(x, s) ds
x y
0 0
Le membre de droite est une intégrale curviligne, qu'on étudie dans le paragraphe III-3 qui suit.
Plus précisément, lorsque t varie de x0 à x, (t, y0) décrit le segment parallèle à Ox joignant les points
x
A = (x0, y0) à B = (x, y0). Sur ce segment, y est constant, donc dy y est nul, et P(t, y0) dt s'écrit
x
0
aussi
Pdx + Qdy (où on a repris la notation x en lieu et place de t).
AB
De même, lorsque s varie de y0 à y, (x, s) décrit le segment parallèle à Oy joignant B au point
y
C = (x, y). Sur ce segment, dx y est nul et
Q(x, s) ds s'écrit Pdx + Qdy (où on a repris la
y BC
0
notation y en lieu et place de s). Ainsi, en notant la réunion des deux segments [AB] et [BC] :
1
Appliquer le théorème de dérivation d'une intégrale dépendant d'un paramètre de la façon suivante. On se place sur une
partie fermée bornée du domaine de définition de la fonction de deux variables dont on prend l'intégrale, et contenant en
son intérieur le point où l'on dérive. La fonction de deux variables étant supposée C 1, sa dérivée partielle est continue,
donc bornée sur la partie fermée choisie. On peut ainsi satisfaire une hypothèse de domination portant sur la dérivée
partielle en majorant sa valeur absolue par une constante. Voir le chapitre L2/SUITESF.PDF pour plus de détails.
- 34 -
f(x, y) – f(x0, y0) =
Pdx + Qdy = df
y C
A
y0 B
x0 x
Bien évidemment, on aurait pu choisir le chemin reliant les points (x0, y0), (x0, y) et (x, y). Cela
aurait correspondu au fait de résoudre l'équation en commençant par intégrer la première équation
f
= P avant la seconde.
x
On peut aussi définir f par la relation f(x, y) – f(x0, y0) = Pdx + Qdy où est un autre chemin
reliant (x0, y0) à (x, y), par exemple directement le segment de droite reliant ces deux points si ce
segment est inclus dans le domaine où sont définis P et Q (on utilise ce type de calcul dans l'annexe
II en fin de chapitre). Nous justifions plus bas dans le chapitre que, si la forme Pdx + Qdy est exacte,
le résultat ne dépend que de (x0, y0) et (x, y), mais pas du chemin suivi.
Lorsqu'une forme différentielle n'est pas exacte, on essaie parfois de trouver une fonction g telle
que g soit exacte. Si on trouve une telle fonction g, on dit que g est un facteur intégrant de . Il
se peut qu'aucun facteur intégrant n'existe, ou au contraire qu'il en existe plusieurs.
EXEMPLES :
Soit = 2x(y – 1)dx – (x2 – 1)dy. n'est pas fermée car, sauf pour x = 0 :
(2x(y – 1)) = 2x – 2x = (– x2 + 1)
y x
Donc a fortiori, n'est pas exacte et n'admet pas de primitive. Cherchons un facteur intégrant g
fonction de x. On a alors :
g = 2x(y – 1)g(x) dx – (x2 – 1)g(x) dy
On souhaite que :
(2x(y – 1)g(x)) = (– (x2 – 1)g(x))
y x
2xg(x) = – 2xg(x) – (x2 – 1)g'(x)
(x2 – 1)g'(x) = – 4xg(x)
Plaçons sur un intervalle I = ]–, –1[ ou bien sur I = ]–1, 1[ ou bien sur I = ]1, +[. Sur chacun de
1
ces intervalles, une solution g à l'équation différentielle précédente est g(x) = 2 .
(x – 1)2
Plaçons-nous sur le domaine U = I R qui est convexe, donc ouvert étoilé. g étant choisie de façon
que g soit fermée, on est sûr que est exacte sur U, donc qu'il existe f telle que df = g. On a
alors :
- 35 -
f 2x(y – 1)
x = 2
(x – 1)2
f = – 2 1
y x – 1
f 2x(y – 1)
x = 2
(x – 1)2
en ayant intégré la deuxième équation
f = 2– y + (x)
x –1
f 2x(y – 1)
x = 2 2 =
2xy
+ '(x)
(x – 1) (x 2
– 1)2
en ayant reporté f dans la première équation
f = 2– y + (x)
x –1
'(x) = – (x2 2x
– 1)2
f = 2– y + (x)
x –1
(x) = x2 1– 1 + Cte
f = 2– y + (x)
x –1
1–y
f= + Cte
x2 – 1
Une application du résultat précédent est le suivant. Soit à résoudre l'équation différentielle :
2x(y – 1)
y' = 2
x –1
sur l'intervalle I = ]–, –1[ ou bien sur I = ]–1, 1[ ou bien sur I = ]1, +[.
Un vecteur tangent en un point quelconque d'une courbe intégrale de cette équation différentielle a
2
1 x –1
pour vecteur directeur y' ou encore T = 2x(y – 1) . Puisque dx (respectivement dy) est la forme
linéaire qui, à un vecteur, associe sa première (respectivement sa deuxième) composante, on a :
2
dx(T) = x – 1
dy(T) = 2x(y – 1)
donc (T) = (2x(y – 1)dx – (x2 – 1)dy)(T) = 0
A fortiori, g(T) = 0 = df(T). Si l'on a un paramétrage t M(t) de la courbe intégrale tel que
dM = T, on en déduit que df(dM) = 0. Or df(dM) est la dérivée de la fonction composée
dt dt dt
t M(t) f(M(t)). On a donc f(M) = Cte le long de la courbe intégrale. Les courbes intégrales
1–y
vérifient donc l'équation 2 = Cte, ou encore y = 1 – Cte (x2 – 1). Ce sont des paraboles (ainsi
x –1
que la droite y = 1 si on prend Cte = 0).
Dans le chapitre L2/EQDIFF2.PDF, on aurait résolu directement cette équation différentielle
comme suit. Le théorème de Cauchy-Lipschitz permet de dire que, si y prend la valeur 1 en un
point, alors y est égale à la constante 1. Dans le cas contraire, y ne prend pas la valeur 1, et on écrit
l'équation différentielle sous la forme :
- 36 -
y' 2x
= 2
y–1 x –1
ln( y – 1 ) = ln( x2 – 1 ) + Cte en intégrant les deux membres par rapport à x
y – 1 = eCte x2 – 1
y – 1 = (x2 – 1)
avec constante quelconque, positive si y – 1 et x2 – 1 sont de même signe, négative s'ils sont de
signe contraire, ou même nulle pour retrouver la solution constante 1.
On retrouve bien les mêmes solutions que précédemment.
Plus généralement, soit à résoudre une équation différentielle de la forme y' = (x, y) au moyen
d'une forme différentielle. On se place sur un ouvert étoilé U sur lequel est définie, et on
considère la forme différentielle = (x, y)dx – dy. Cette forme différentielle n'est en générale pas
exacte. Supposons qu'on réussisse à trouver un facteur intégrant continu g(x, y) de (toute la
difficulté est là), et soit f une primitive de g. Alors les courbes intégrales de l'équation
différentielle sont incluses dans les courbes de niveau de f, i.e. dans les courbes d'équation
f(x, y) = Cte. En effet, soit x y(x) une fonction de classe C1 définie sur un intervalle I, solution de
l'équation différentielle. On a :
x I, (x, y(x)) – y'(x) = 0
1
x I, ( y'(x) ) = 0 d'après la définition de
1
x I, g( y'(x) ) = 0 g étant calculé au point (x, y(x))
1
x I, df( y'(x) ) = 0 car g = df
x I, 1f(x, y(x)) + y'(x) 2f(x, y(x)) = 0 en notant df = 1f dx + 2f dy
d
x I, f(x, y(x)) = 0 par dérivation d'une fonction composée
dx
x f(x, y(x)) est une fonction constante sur I
Ainsi est incluse dans une courbe de niveau de f.
Réciproquement, soit (x0, y0) un point d'une courbe de niveau de f d'équation f(x, y) = . Supposons
que 2f(x0, y0) 0. On peut alors appliquer le théorème des fonctions implicites. Il existe un
voisinage de (x0, y0) tel que, pour tout (x, y) de ce voisinage, la relation f(x, y) = soit équivalente à
une relation fonctionnelle x y(x). Pour x dans un voisinage I de x0 on a alors :
x I, f(x, y(x)) =
On peut alors remonter le calcul précédent jusqu'à :
1
x I, g( y'(x) ) = 0
i.e. x I, g(x, y(x)) (x, y(x)) – g(x, y(x)) y'(x) = 0
Comme on a supposé que 2f(x0, y0) 0 et que 2f(x0, y0) = – g(x0, y0), on a g(x0, y0) 0, et g étant
continue, on aura encore g(x, y(x)) 0 au voisinage de x0 (quitte à réduire l'intervalle I). On peut
donc simplifier par g(x, y(x)), de sorte que la fonction x y(x) est bien solution de l'équation
différentielle (x, y(x)) – y'(x) = 0 initiale au voisinage de x0.
Ainsi, la courbe de niveau complète est la réunion de courbes intégrales, éventuellement séparée par
des points en lesquels 2f s'annule. Ces points peuvent par exemple correspondre à des points
- 37 -
limites des courbes intégrales où la tangente à la courbe devient parallèle à Oy. Il peut aussi s'agir de
points multiples de la courbe de niveau, en lequel il est impossible de définir une fonction x y(x).
2- Représentation graphique
Nous proposons dans ce paragraphe une interprétation graphique des formes différentielles de deux
variables. Donnons-nous un pas h selon l'axe des x et k selon l'axe des y (le physicien assimilera dx à
h et dy à k). On considère dans l'espace de dimension 3 des tuiles en forme de parallélogramme de
sommets :
S = (x, y, 0) avec x multiple entier de h et y multiple entier de k
SX = (x + h, y, P(x, y)h)
SXY = (x + h, y + k, P(x, y)h + Q(x, y)k)
SY = (x, y + k, Q(x, y)k)
Si, dans le plan Oxy, Ox est dirigé vers la droite et Oy vers le haut, les sommets sont ainsi disposés
dans une tuile vue depuis Oz :
- 38 -
SY SXY
S SX
On dispose ces tuiles côte à côte. La forme différentielle sera fermée si, localement, on peut
translater les tuiles parallèlement à Oz de façon à former une surface (aux approximations près
d'ordre 2), les tuiles s'attachant les unes aux autres par leurs sommets, chaque tuile étant une partie
du plan tangent à la surface au point où le sommet S a été déplacé. La forme sera exacte si ce
"tuilage" est possible sur l'ensemble de définition de P et Q. Voici ci-dessous le "tuilage" de la
forme exacte ydx + xdy, ainsi que le "tuilage" après déplacement des tuiles, donnant la surface
z = xy.
TGH TH TDH
T TD
TDB
Pour attacher la tuile TDH par son sommet S à la fois au sommet SX de TH et au sommet SY de
TD, il faut et il suffit que ces deux sommets soient identiques, donc se trouvent à la même hauteur.
- 39 -
Numériquement, cela se traduit comme suit. Soient (x, y) l'abscisse et l'ordonnée du sommet S de T.
Les abscisse et ordonnée de TH sont (x, y + k) et celles de TD sont (x + h, y).
Le sommet SX de TH se trouve, après attachement à la tuile T par le sommet S de TH, à la hauteur :
z(SX de TH) = z(S de TH) + P(x, y + k)h
= z(SY de T) + P(x, y + k)h car z(S de TH) = z(SY de T)
= z(S de T) + Q(x, y)k + P(x, y + k)h
Le sommet SY de TD se trouve, après attachement à la tuile T par le sommet S de TD, à la hauteur :
z(SY de TD) = z(S de TD) + Q(x + h, y)k
= z(SX de T) + Q(x + h, y)k car z(S de TD) = z(SX de T)
= z(S de T) + P(x, y)h + Q(x + h, y)k
On veut que z(SX de TH) = z(SY de TD), et donc que :
Q(x, y)k + P(x, y + k)h = P(x, y)h + Q(x + h, y)k
ce qui, après développement au premier ordre en négligeant le reste, conduit à :
P Q
Q(x, y)k + P(x, y)h + hk (x, y) = P(x, y)h + Q(x, y)k + hk (x, y)
y x
et donc à :
P Q
(x, y) = (x, y)
y x
y x
Le dessin ci-dessous représente le tuilage de la forme fermée égale à – dx + 2 dy. Nous
x2 + y2 x + y2
P Q
avons vu précédemment que la condition = permet de déplacer localement les tuiles pour
y x
former une surface. Mais on voit ici que l'existence locale de cette surface ne permet pas d'obtenir
une existence globale, les tuiles formant un escalier à la Maurits Escher. Après avoir fait un tour
autour de l'origine, elles ne peuvent former une surface se refermant. La forme différentielle est
fermée, mais pas exacte.
- 40 -
Si la translation verticale des tuiles n'est pas possible localement, la forme n'est pas fermée . Voici
ci-dessous le "tuilage" de la forme non exacte ydx. Sur ce dessin, il paraît clair qu'aucun
déplacement de tuiles n'est possible pour disposer de façon compatible les tuiles côte à côte. La
première rangée devant rester horizontale, les tuiles de la deuxième rangée ne pourront s'y attacher
par leur sommet SX.
TDH
TH
TD
T
SX(TH) SY(TD)
3- Intégrales curvilignes
DEFINITION
n
Soit = Pidxi une forme différentielle définie sur un ouvert U de Rn, et une courbe incluse
i=1
dans U, définie par un paramétrage t [t0, t1] x(t) = (x1(t), ..., xn(t)) de classe C1. On appelle
intégrale curviligne de le long de la quantité :
t1 n
= Pi(x(t)) xi'(t) dt
i=1
t0
Cette quantité s'appelle également circulation du champ de vecteurs (P1, ..., Pn) le long de .
L'intégrale ne dépend pas du paramétrage choisi, car si t = (u) avec t0 = (u0) et t1 = (u1), avec
de classe C1, alors la formule de changement de variables dans l'intégrale de droite donne :
t n u n
1 P (x(t)) x '(t) dt = 1 P (x((u))) x '((u)) '(u) du
i=1 i i
i=1 i i
t u
0 0
u1 n
= Pi(y(u)) yi'(u) du
i=1
u
0
On obtient l'intégrale curviligne de le long de , celle-ci étant maintenant paramétrée par la
fonction u y(u) = x((u)).
- 41 -
EXEMPLES :
Considérons = ydx – xdy et le segment joignant le point (0, 1) au point (1, 0). Un
paramétrage possible est donné par x = t, y = 1 – t, t variant de 0 à 1. D'où :
1
= (1 – t) + t dt = 1
0
Par contre, si on va de (0, 1) à (1, 0) par le segment [(0, 1), (0, 0)] suivi de [(0, 0), (0, 1)] (couper
en deux morceaux, chacun correspondant à un segment), on trouvera = 0. Autrement dit,
dépend du chemin suivi.
Considérons = ydx + xdy et le segment joignant le point (0, 1) au point (1, 0). Reprenons le
paramétrage x = t, y = 1 – t, t variant de 0 à 1. D'où :
1 1
= (1 – t) – t dt = 1 – 2t dt = 0
0 0
Si on va de (0, 1) à (1, 0) par le segment [(0, 1), (0, 0)] suivi de [(0, 0), (0, 1)], on a toujours
= 0. Dans le cas présent, ne dépend pas du chemin suivi. La différence avec l'exemple 1
est que ydx + xdy est une différentielle exacte (à savoir celle de xy) alors que ydx – xdy n'est pas
exacte.
PROPOSITION
Si est une forme exacte, de primitive f, et si est un chemin parcouru depuis le point M0 jusqu'au
point M1, alors
= f(M1) – f(M0).
Démonstration :
f
Si est exacte, alors, pour tout i, Pi = . On a alors, aprés avoir pris un paramétrage de :
xi
=
t1 n t1 n
f
Pi(x(t)) xi'(t) dt =
(x(t)) xi'(t) dt
x
i=1
t
i=1 i
t0 0
n
f
On reconnaît dans (x(t)) xi'(t) la dérivée de la fonction composée :
i=1 xi
f
t x(t) = (x1(t), ..., xn(t)) f(x(t))
Donc :
= [f(x(t))]t1 = f(x(t1)) – f(x(t0)) = f(M1) – f(M0)
t0
- 42 -
EXEMPLES :
Pour = ydx + xdy = df avec f(x, y) = xy, et le segment joignant le point M0 = (0, 1) au point
M1 = (1, 0), on a :
= f(M1) – f(M0) = 0
Il est inutile de définir un paramétrage de .
Les formes différentielles et leur intégrale curviligne apparaissent également dans le contexte
suivant. Supposons qu'un point se déplace dans l'espace entre les instants t0 et t1, suivant une courbe
paramétrée = {(x(t), y(t), z(t)) , t0 t t1} de classe C1 depuis le point M0 = M(t0) jusqu'en
M1 = M(t1) et qu'en chaque point soit définie une force F de composantes (P, Q, R), dépendant de x,
y et z. On dispose d'un champ de forces. Le travail effectué par cette force le long de est donné par
l'intégrale suivante, en utilisant le produit scalaire < , > :
W=
<F, dM> = Pdx + Qdy + Rdz =
où est la forme différentielle Pdx + Qdy + Rdz. Par définition, W n'est autre que :
t1
W= P(x(t), y(t), z(t)) x'(t) + Q(x(t), y(t), z(t)) y'(t) + R(x(t), y(t), z(t)) z'(t) dt
t
0
La notation Pdx + Qdy + Rdz se justifie par le fait que W dépend a priori de mais ne dépend
pas du paramétrage choisi pour le parcourir. Physiquement, un changement de paramétrage
correspond au fait de parcourir avec des vitesses différentes. Le travail W dépend du chemin
parcouru mais pas de la vitesse à laquelle il est parcouru.
Supposons que la force F dérive d'une énergie potentielle Ep. Cela signifie que – grad(Ep) = F (La
raison du signe – est que la force indique la direction dans laquelle l'énergie potentielle diminue).
Dans ce cas, on a :
E E E
= <F, dM> = Pdx + Qdy + Rdz = – p dx – p dy – p dz
x y z
qui n'est autre que la différentielle de la fonction f = – Ep. est une forme différentielle exacte, et le
travail de la force F le long de est :
W = f(M1) – f(M0) = Ep(M0) – Ep(M1)
Il ne dépend que des extrémités de mais pas du chemin suivi.
Inversement, on prouve que si toute circulation du champ de vecteurs ne dépend que des valeurs
initiales et finales par une formule :
W = Pdx + Qdy + Rdz = E(M0) – E(M1)
[M0,M1]
alors le champ de vecteurs dérive du potentiel E. Il suffit pour cela de considérer par exemple un
déplacement selon x, alors que y et z restent constant, pour voir que P est la dérivée de – E par
rapport à x. De même pour les autres variables.
- 43 -
La relation Ep(M0) = Ep(M1) + W est une démonstration du principe de conservation de l'énergie.
On notera par ailleurs que, si V = dM désigne la vitesse de la particule et a = dV son accélération,
dt dt
égale à F si m est sa masse, alors :
m
W= 1 2 1 2
<F, dM> = m <a, V> dt = m <dV, V> = 2 mV1 – 2 mV0
La relation Ep(M0) = Ep(M1) + W s'écrit donc aussi sous la forme :
1 1
Ep(M0) + mV02 = Ep(M1) + mV12
2 2
et l'on voit apparaître la conservation de l'énergie mécanique, somme de l'énergie potentielle et de
l'énergie cinétique.
y x
On a déjà vu que = – 2 2 dx + 2 dy était une forme fermée, exacte sur l'ouvert étoilé
x +y x + y2
R2 \ {(x, 0), x 0} , mais non exacte sur R2 \ {(0, 0)}. On retrouve ce fait de la façon
suivante : si on prend le cercle de centre (0, 0) de rayon 1, orienté dans le sens trigonométrique,
on vérifiera que = 2, par exemple en prenant le paramétrage t [0, 2] (cos(t), sin(t). Le
résultat devrait être nul pour une courbe qui se referme si était exacte.
Soit a > 0. Nous allons montrer que
cos(ax) –a
1 + x2 dx = e
–
Pour cela nous considérons ici une forme différentielle à coefficients complexes parce que les
calculs sont plus simples. Ce que nous avons dit précédemment sur les formes fermées ou exactes
reste vrai (il suffirait de séparer partie réelle et imaginaire).
exp(iaz) exp(iaz)
Soit = 2 dx + i dy = Pdx + Qdy, avec z = x + iy.
1+z 1 + z2
P d exp(iaz) dz d exp(iaz) Q
est fermée car = 2 = i 2 = . Cependant est définie sur R2 privé
y dz 1 + z dy dz 1 + z x
des deux points (0, 1) = i et (0, –1) = –i.
Considérons la courbe 1 suivante : Le grand arc de cercle est de centre (0, 0) de rayon R, le petit
cercle de centre (0, 1) de rayon r.
- 44 -
Cette courbe est incluse dans un ouvert étoilé sur laquelle est définie, par exemple le plan privé de
la demi-droite {(x, 1), x 0}. étant une forme différentielle fermée dans un ouvert étoilé, est
exacte. Il en résulte que = 0 car 1 se referme. Il en sera de même pour 2, courbe symétrique
1
de 1 par rapport à l'axe des ordonnées :
En tenant compte de la relation de Chasles et du fait que les intégrales de sur deux chemins
identiques mais parcourus en sens opposés s'annuleront, l'intégrale de sur 1 2 (qui est nulle,
rappelons-le) n'est autre que la somme de l'intégrale de sur le grand demi-cercle parcouru dans le
- 45 -
sens trigonométrique et de l'intégrale sur le petit cercle parcouru dans le sens inverse au sens
trigonométrique. La somme de ces deux intégrales étant nulle, il en résulte que l'intégrale sur le
demi-cercle est égale à celle du petit cercle, à condition que ce dernier soit parcouru dans le sens
trigonométrique. Ces deux intégrales sont donc indépendantes de R et r. Nous allons faire tendre R
vers + et r vers 0.
exp(iax) dx.
R
Sur le grand diamètre, l'intégrale de vaut
exp(iax)
2 dx qui tend vers 2
–R 1 + x – 1 + x
Sur le grand demi-cercle lui-même, paramétré par x = Rcos() et y = Rsin(), 0 (et donc
z = Rei), on vérifiera que l'intégrale de vaut
exp(iaz) i
1 + z2 iRe d. Comme on a :
0
Sur le petit cercle, paramétré par x = rcos() et y = 1 + rsin(), 0 2 (et donc z = i + rei),
l'intégrale de vaut :
exp(iaz) irei d = e–a exp(iare ) irei d = e–a exp(iare ) i d
2 2 i 2 i
1 + z2 rei(2i + rei) (2i + rei)
0 0 0
THEOREME DE FUBINI
Soit f continue sur D = [a, b] [c, d]. Alors :
b d d b
( f(x, y) dy) dx = ( f(x, y) dx) dy
a c c a
quantité notée f(x, y) dxdy.
D
Démonstration :
2
Une hypothèse de domination est à vérifier pour permuter le symbole de limite et le symbole d'intégration : majorer la
fonction des deux variables (r, ) que l'on intègre par une fonction uniquement de , intégrable sur [0, 2]. Voir le
chapitre L2/SUITESF.PDF pour plus de détails, où l'on calcule d'ailleurs l'intégrale demandée d'une autre façon.
- 46 -
Y b b Y
Considérons les fonctions Y f(x, y) dx dy et Y f(x, y) dy dx. Ces deux
c a a c
fonctions coïncident pour Y = c (elles sont nulles).
Y b
La première est de la forme g(y) dy avec g(y) = f(x, y) dx, fonction continue de y. En effet,
c a
pour tout x, y f(x, y) est continue et f vérifie une hypothèse de domination : f étant continue sur le
domaine D fermé bornée, f est bornée, donc on peut dominer f sur D par une constante, qui est
intégrable sur [a, b] (Voir le chapitre L2/EVNORME sur le fait qu'une fonction continue sur un
fermé borné à valeurs réelles admet un maximum, et le chapitre L2/SUITESF.PDF pour les
hypothèses de continuité des intégrales dépendant d'un paramètre, ou un peu plus bas, pour les
hypothèses de dérivation d'une intégrale dépendant d'un paramètre). g étant continue, la fonction
Y b
Y g(y) dy a pour dérivée g(Y) = f(x, Y) dx.
c a
b Y
La seconde fonction est de la forme F(x, Y) dx avec F(x, Y) = f(x, y) dy. Montrons que
a c
b
d F(x, Y) dx. Pour chaque x, la fonction F(x,Y) est une intégrale
b
F(x, Y) dx est égal à
dY
a a y
F
fonction de la borne supérieure et de dérivée (x, Y) = f(x, Y) continue. Comme on est sur un
y
F
fermé borné [a, b] [c, d], est bornée, et l'hypothèse de domination permettant de dériver sous le
y
b
signe intégrale est vérifiée en prenant une constante majorant f . F(x, Y) dx est donc dérivable
a
b
b
F
par rapport à Y de dérivée
y (x, Y) dt = f(x, Y) dt = g(Y)
a a
Les deux fonctions ayant même dérivée et étant égales en un point sont égales en tout point. Elles le
sont en particulier pour Y = d. D'où l'égalité demandée.
En effet, considérons un disque quelconque inclus dans l'ensemble de définition de f. Soient (a, c) et
x=b y=d 2f
(b, d) deux éléments de ce disque. Considérons alors I(b, d) =
yx(x, y) dy dx. Comme
x=a y=c
f f 2
y (x, y) est une primitive de la fonction y (x,y), on a, pour tout x :
x yx
y=d 2f f f
(x, y) dy = (x, d) – (x, c)
yx x x
y=c
- 47 -
f f
Comme f(x, d) – f(x, c) est une primitive de la fonction x (x, d) – (x, c), on a :
x x
x=b f f
I(b,d) = (x, d) – (x, c) dx = (f(b, d) – f(b, c)) – (f(a, d) – f(a, c))
x=a x x
Le théorème de Fubini permet de permuter les deux intégrales et d'écrire :
y=d x=b 2f
(f(b, d) – f(b, c)) – (f(a, d) – f(a, c)) = I(b, d) = (x, y) dx dy
yx
y=c x=a
d
Dérivons alors les deux membres par rapport à d. L'intégrale de droite est de la forme (y) dy
c
x=b f
f (x, d) dx.
2 b 2
(avec (y) = (x, y) dx, fonction continue de y), dont la dérivée est (d) =
yx yx
x=a
a
f f
Le membre de gauche se dérive par rapport à d en (b, d) – (a, d). On a donc :
y y
f f b f
2
(b, d) – (a, d) =
y y yx(x, d) dx
a
Dérivons maintenant par rapport à b. On obtient dans le membre de gauche :
( f )(b, d) = 2f (b, d)
x y xy
et dans le membre de droite :
2f
(b, d)
yx
2f 2f
Donc (b, d) = (b, d)
xy yx
Le (i) est un énoncé du théorème de Poincaré sous forme de champ de vecteurs, équivalent pour
n = 3 à l'énoncé vu plus haut :
forme différentielle fermée sur un ouvert étoilé exacte
en prenant = Pdx + Qdy + Rdz et f sa primitive.
Le (ii) présente un intérêt pour le physicien et se montre d'une façon comparable au (i). Elle a aussi
une interprétation en termes de forme différentielle , mais celle-ci est de degré 2 : a une
expression qui s'écrit sous la forme = P dy dz + Q dz dx + R dx dy et sa primitive est une
forme différentielle de degré 1. Voir l'annexe suivante pour plus de précision.
TEHOREME DE POINCARE
- 48 -
P
(i) Soit U un ouvert étoilé de R et Q un champ de vecteurs C1 de rotationnel nul défini
3
R
P
sur U. Alors ce champ dérive d'un potentiel scalaire : il existe f tel que Q = grad(f).
R
P
(ii) Soit U un ouvert étoilé de R3 et Q un champ de vecteurs C1 de divergence nulle défini
R
P
sur U. Alors ce champ dérive d'un potentiel vecteur : il existe A tel que Q = Rot(A).
R
Dans le (i), on a 1 = grad et 2 = Rot.
Dans le (ii), on a 1 = Rot et 2 = div.
Démonstration :
Nous supposerons pour simplifier, que l'origine O appartient à U. Nous noterons r le point de
coordonnées (x, y, z), ou le vecteur joignant O à ce point :
- 49 -
Si U n'est pas étoilé, on a seulement une inclusion Im(grad) Ker(Rot) sans forcément avoir
– y
1 x
d'égalité. Nous avons déjà vu dans III-1) et III-2) que le champ 2 défini sur U privé de
x + y2 0
l'axe Oz avait un rotationnel nul, mais ne dérivait pas d'un gradient. Cet exemple classique est, à une
constante multiplicative près, celui du champ magnétique créé par un courant constant parcourant la
droite Oz. La circulation de ce champ le long d'une courbe fermée entourant cette droite n'est pas
nulle (théorème d'Ampère) alors qu'elle devrait l'être si le champ dérivait d'un gradient scalaire.
Physiquement, il est plus réaliste de considérer que courant parcourt un cylindre d'axe Oz et de
rayon r petit. U est alors le domaine {(x, y, z), x2 + y2 r2}.
On peut montrer3 que :
Ker(Rot) = Im(grad) HK
où HK (harmonic knot) = {V | div(V) = 0 sur U, V est tangent au bord de U et Rot(V) = 0}.
– y
1 x
L'exemple 2 est précisément un champ qui est élément de HK. Dans le cas d'un ouvert
x + y2 0
étoilé, le sous-espace vectoriel HK est réduit au champ nul.
3
Jason Cantarella, Dennis DeTurck, Herman Glick, Vector Calculus and the Topology of Domains in 3-space, 109:5,
Amer. Math. Monthly (mai 2002), 409-442.
- 50 -
1 P P P
– = 2tP(tx,ty,tz) + t2x (tx, ty, tz) + t2y (tx, ty, tz) + t2z (tx, ty, tz) dt
y z x y z
0
On reconnaît sous l'intégrale la dérivée de t2P(tx, ty, tz)
– = t2P(tx, ty, tz) 1 = P(x, y, z)
[ ]0
y z
P
On procède de même pour les autres composantes, conduisant bien à Rot(A) = Q
R
EXEMPLE :
Considérons un champ de vecteurs constant B. Alors :
1
A=
1
t B r dt = 2 B r
0
On pourra vérifier que Rot(A) = B.
Si U n'est pas étoilé, on a seulement une inclusion Im(Rot) Ker(div) sans forcément avoir
d'égalité. Soit U le domaine limité par deux sphères concentriques de rayon R1 et R2 :
U = {(x, y, z) | R12 x2 + y2 + z2 R22}
1
Soit V = 2 er où r2 = x2 + y2 + z2 et er est le vecteur unitaire de O vers le point (x, y, z). V n'est autre
r
1
que le gradient de – . C'est, à une constante multiplicative près, le champ électrique engendré par
r
une particule chargée située à l'origine, ou le champ gravitationnel engendré par une masse
ponctuelle.
On a div(V) = 0. En effet, V étant seulement radial, l'expression de la divergence en sphérique est
(voir le chapitre L2/GRADIVRT.PDF) :
V V 1
div(V) = 2 r + r avec Vr = 2
r r r
=0
Cependant V ne peut s'exprimer sous forme de rotationnel. En effet, supposons qu'il existe un
champ de vecteurs W tels que V = Rot(W). Considérons également la sphère de centre O et de rayon
R, avec R1 < R < R2. Cette sphère S constitue une surface dont le bord S est vide, de sorte que le
flux de V à travers la sphère vaut :
<V, n> d = <Rot(W), n> d = <W, dl>
S S S
en utilisant le théorème de Stokes. Voir L2/GRADIVRT.PDF
=0 puisque le bord S de S est vide
Mais par ailleurs, n = er de sorte que <V, n> = 2 et que
1
R <V, n> d = 4. D'où une contradiction.
S
On peut montrer que :
Ker(div) = Im(Rot) HG
où HG (harmonic gradients) = {V = grad() | div(V) = 0 et est constante sur chaque composante
connexe de U}. On peut montrer que la dimension de HG est un de moins que le nombre de
composantes de U. Ainsi, dans l'exemple précédent, U est constitué des deux sphères S1 et S2 et
- 51 -
1
HG est donc de dimension 1. Le champ V = er qui est élément de HG en est donc une base, et est
r2
un exemple typique dans une des configurations les plus simples de champ de divergence nulle sans
être issu d'un rotationnel.
- 52 -
= – v [Rot(B)]x
0
1 E
Or une autre équation de Maxwell fournit Rot(B) = 0j + , où j est le vecteur densité de
c2 t
courant. Celle-ci montre que Rot(B) est non nul en général, et donc que le théorème de Gauss
N'EST PAS vérifié dans O'x'y'z'. Or l'expérience prouve le contraire. Les expériences
électromagnétiques sont identiques dans les deux référentiels. L'expérience est donc en
contradiction avec la théorie. Les équations de Maxwell sont-elles fausses ?
Cette question souleva un grave problème à la fin du XIXème. Les équations de Maxwell furent
confirmées par les expériences de Hertz et apportaient une explication séduisante aux phénomènes
électriques et magnétiques largement étudiés au cours du siècle. Elles unifiaient également
électricité et magnétisme en une seule théorie. Elles se trouvaient cependant en contradiction avec le
principe de relativité galiléenne qui énonce qu'aucune loi physique ne peut permettre de différencier
un référentiel galiléen d'un autre. Et les expériences physiques confirment ce dernier point : le
théorème de Gauss est vérifié dans tout repère galiléen. Ou encore l'expérience de Michelson et
Morley montre que la vitesse de la lumière est identique dans tout référentiel galiléen. On se trouve
alors placé dans la situation contradictoire et apparemment inextricable suivante :
les expériences montrent que les lois de Maxwell sont vérifiées dans tout référentiel galiléen.
les calculs montrent que les lois de Maxwell dépendent du référentiel choisi.
La solution consista à modifier les règles de changement de référentiel de façon que les lois de
Maxwell ne dépendent plus du référentiel, conformément à l'expérience, conciliant à la fois la
validité des lois de Maxwell et le principe de relativité. En particulier, on postule que chaque
référentiel dispose d'un temps propre qu'il est impossible de synchroniser avec le temps d'un autre
référentiel en translation par rapport au premier. Le changement de référentiel doit donc également
modifier le temps, et laisser la vitesse de la lumière invariante. On débouche alors sur la relativité
1
restreinte. Si on note c la vitesse de la lumière et la quantité ( = 1 dans l'approximation
v2
1– 2
c
classique), on montre que les changements de référentiels galiléens en mécanique classique
deviennent en mécanique relativiste :
x' = (x – vt) x = (x' + vt')
y' = y y = y'
z' = z z = z'
vx vx'
t' = (t – 2 ) t = (t' + 2 )
c c
On notera que, si x = ct (propagation d'un rayon lumineux dans Oxyz), alors on obtient x' = ct'.
Quant aux quantités électromagnétiques, elles sont transformées de la façon suivante :
Ex' = Ex Bx' = Bx jx' = (jx – v)
v
Ey' = (Ey – vBz) By' = (By + 2 Ez) jy' = jy
c
v
Ez' = (Ez + vBy) Bz' = (Bz – 2 Ey) jz' = jz
c
v
' = ( – 2 jx)
c
On a alors, en utilisant toujours la dérivation de fonctions composées :
- 53 -
Ex' Ey' Ez'
div(E') = + +
x' y' z'
E v E (Ey – vBz) (Ez + vBy)
= x+ 2 x + +
x c t y z
v E
= div(E) + 2 x – v[Rot(B)]x
c t
1 E
Or [Rot(B)]x = 0jx + 2 x
c t
div(E') = div(E) – v0jx
= ( – 2jx)
v 1
car 00 = 2
0 c c
'
=
0
Ainsi, le théorème de Gauss est vérifié dans le repère Ox'y'z'. Il en serait de même des autres
équations de Maxwell.
On notera que, si un système matériel ne peut pas dépasser la vitesse de la lumière, c'est parce que
1
= et que la racine carrée d'un nombre négatif n'est pas définie dans R !!
v2
1– 2
c
Imaginons par exemple que f(x, y) soit l'altitude z en un point de la Terre repéré par sa latitude x et
sa longitude y. Un maximum local de f correspond par exemple au sommet d'une colline. Mais si on
impose une condition supplémentaire g(x, y) = 0, alors x et y sont liés, et ne permettent pas
forcément d'aller au sommet de la colline. Tout au plus pourra-t-on suivre un sentier S à flanc de
colline, et la recherche de l'altitude maximale le long de ce sentier ne correspondra pas au sommet
de la colline, et donc ne sera pas obtenu par l'annulation des dérivées partielles de f. Quelles sont
alors les nouvelles conditions vérifiées par un extremum de f sous la contrainte des conditions
imposées par les gi ?
PROPOSITION
- 54 -
Avec les notations précédentes, on suppose qu'en tout point X de U, les vecteurs grad(g1)(X),
grad(g2)(X), ..., grad(gp)(X) sont linéairement indépendants. Alors :
(i) En tout point X0 de S, le sous-espace tangent à S en X0 est de dimension n – p.
(ii) Ce sous-espace tangent est le sous-espace affine passant par X0 et orthogonal à
grad(g1)(X0), grad(g2)(X0), ..., grad(gp)(X0).
(iii) Les extrema de f sur S se cherchent parmi les points X0 pour lesquels grad(f)(X0) est
orthogonal à ce sous-espace tangent. Autrement dit :
(1, ..., p) Rp, grad(f)(X0) = 1 grad(g1)(X0) + ... + p grad(gp)(X0)
Démonstration :
(i) : Comme nous l'avons fait pour une surface en dimension 3 dans le chapitre
L1/CALCDIF1.PDF, nous définissons le sous-espace tangent à S en X0 comme celui contenant la
tangente en X0 de toute courbe C1 incluse dans S et passant par X0. Pour cela, on procède d'abord à
une paramétrisation de S au voisinage de X0. Les vecteurs grad(g1)(X0), ..., grad(gp)(X0) ont pour
composantes les lignes de la matrice J(G) de dG(X0) (matrice jacobienne de G en X0), qui est
élément de Mpn(R). Puisque ces lignes sont supposées indépendantes, J(G) est de rang p, donc elle
possède aussi p colonnes linéairement indépendantes, par exemple les p dernières. La sous-matrice
g
de J(G) constituée des termes situés dans ces p colonnes et les p lignes sont les i, 1 i p,
xj
n – p + 1 j n. Puisque cette sous-matrice carrée p p est de rang p, son déterminant est non nul
et nous sommes dans le cadre d'application du théorème des fonctions implicites. Il est possible de
trouver un paramétrage de S au voisinage de X0 de la forme :
xn–p+1 n–p+1(x1, ..., xn–p)
... = ... = () en posant = (x1, ..., xn–p)
xn n(x1, ..., xn–p)
(x1, ..., xn–p) sont les n – p paramètres d'où se déduisent les p dernières composantes de X, le
paramétrage complet de la surface étant Rn–p X = () = S R n.
()
Pour définir une courbe de classe C1 incluse dans S, il suffit de définir une fonction t (t), de
sorte que la courbe sera paramétrée par :
(t)
t X(t) = ((t)) = S
((t))
On peut supposer qu'on passe par X0 pour la valeur 0 du paramètre. La tangente à cette courbe en X0
est dirigée par le vecteur X'(0), égal à d(0)('(0)). Comme '(0) est un vecteur quelconque de Rn–p,
In–p
on voit que la direction du sous-espace tangent n'est autre que Im(d(0)). Comme d(0) = ,
d(0)
le bloc supérieur In–p fait que d(0) est de rang n – p. Donc le sous-espace tangent est bien de
dimension n – p.
(ii) : Le fait que grad(g1)(X0), grad(g2)(X0), ..., grad(gp)(X0) soient des vecteurs linéairement
indépendants est équivalent à dire que dG(X0), dont les lignes sont les composantes des susdits
gradients, est de rang p, ou encore que Ker(dG(X0)) est de dimension n – p. Ker(dG(X0)) n'est autre
que le sous-espace vectoriel de Rn orthogonal à grad(g1)(X0), ..., grad(gp)(X0). En effet, pour tout h
de Rn, on a les équivalences :
- 55 -
h Ker(dG(X0))
dG(X0)(h) = 0
i [[ 1, p ]] , dgi(X0)(h) = 0
i [[ 1, p ]] , <grad(gi)(X0), h> = 0
i [[ 1, p ]] , h grad(gi)(X0)
h Vect(grad(g1)(X0), ..., grad(gp)(X0))
En particulier :
dim(Ker(dG(X0))) = dim(Vect(grad(g1)(X0), ..., grad(gp)(X0)))
= n – dim(Vect(grad(g1)(X0), ..., grad(gp)(X0)))
=n–p
On montre de même Ker(df(X0)) = Vect(grad(f)(X0)), égalité que nous utiliserons dans le (iii).
Or, au voisinage de X0, on a :
X S G(X) = 0 , X = ()
G
et G vérifient donc G o = 0, avec Rn–p Rn Rp et donc, en différentiant en 0 tel que
X0 = (0) :
d(G o )(0) = 0
dG((0)) o d(0) = 0
dG(X0) o d(0) = 0
Im(d(0)) Ker(dG(X0))
mais Im(d(0)) dirige le sous-espace tangent à S en X0, et il est de dimension n – p, tout comme
dG(X0). Cest deux espaces ayant même dimension et l'un étant inclus dans l'autre, ils sont égaux :
Im(d(0)) = Ker(dG(X0)) = Vect(grad(g1)(X0), ..., grad(gp)(X0))
EXEMPLES :
Reprenons notre exemple de f(x, y) altitude en un point (x, y) et de g(x, y) = 0 équation implicite
d'un sentier à flanc de colline. La recherche de l'altitude maximale le long de ce sentier conduit à
résoudre grad(f)(X0) = grad(g)(X0). On souhaite donc que les deux gradients soient colinéaires au
point cherché X0. Or grad(f) indique dans quelle direction l'altitude f varie le plus vite. C'est la
direction de la ligne de plus grande pente. Par ailleurs, grad(g) est orthogonal à la courbe g(x, y) = 0.
L'altitude maximale sur le sentier sera donc obtenue en un point X0 tel que la ligne de plus grande
- 56 -
pente coupera le sentier à angle droit. C'est aussi le point où le sentier et la ligne de niveau f(x, y) =
f(X0) sont tangentes.
Ci-dessous, la courbe imposée g(x, y) = 0 est en bleu. Les courbes noires sont diverses lignes de
niveau de la fonction f, croissant de l'extérieur vers l'intérieur de la figure. Le vecteur indique la
direction commune de grad(f)(X0) et grad(g)(X0).
g(x, y) = 0
X0
Dans l'exemple précédent, on retrouve la colinéarité des gradients en utilisant le théorème des
g
fonctions implicites. Supposons que (X0) 0. Au voisinage de X0, la courbe g(x, y) = 0 est
y
représentative d'une fonction y = (x). On cherche le maximum de f le long de cette courbe, et donc
le maximum de x f(x, (x)). Si ce maximum est en x0, abscisse de X0, la dérivée en x0 de la
f f
fonction x f(x, (x)) doit être nul. Or cette dérivée vaut (X0) + (X0) '(x0). Par ailleurs, on
x y
g
(X0)
x
sait que '(x0) = – . On a donc en X0 :
g
(X0)
y
g
(X0)
f f x
(X0) – (X0) =0
x y g
(X0)
y
ou encore :
f g f g
(X0) (X0) – (X0) (X0) = 0
x y y x
égalité équivalente à la colinéarité des deux vecteurs :
f
x (X0) g (X0)
grad(f)(X0) =
et grad(g)(X0) =
x .
f (X0) g(X0)
y y
- 57 -
Quelle est l'aire maximale d'un rectangle de côtés x et y, dont le périmètre P est donné ?
On prend U = ]0, +[ ]0, +[ car il est clair qu'un côté de longueur nulle ne présente aucun
intérêt. On cherche ici à maximiser f(x, y) = xy sous la contrainte g(x, y) = 2x + 2y – P = 0. Si (x0, y0)
sont les longueurs cherchées, on écrit qu'il existe tel que :
grad(f)(x0, y0) = grad(g)(x0, y0)
y0 1
donc x = 2 1
0
donc x0 = y0 = 2
P
Comme g(x0, y0) = 0, on a nécessairement x0 = y0 = . Il s'agit du carré.
4
P P
On vérifie bien que f( , ) est maximal, puisque :
4 4
P P P2 P P P
f( + h, + k) = + (h + k) + kh et g( + h, + k) = 2h + 2k = 0
4 4 16 4 4 4
2
P P P P P P2
h = – k et f( + h, + k) = f( + h, – h) = – h2
4 4 4 4 16 16
La méthode décrite peut s'appliquer également à la recherche d'extrema, les contraintes étant des
inégalités. On cherche par exemple les extrema de f(x, y) = x2 + xy – y2 avec les conditions 0 x 1
et 0 y 1. Il y a deux méthodes possibles :
Méthode 1 :
On étudie f sur la frontière du domaine [0, 1] [0, 1] pour y déterminer en quels points f est
extrémal, et on compare ces extrema avec ceux qu'on trouve dans le domaine ouvert ]0, 1[ ]0, 1[
par annulation du gradient.
Sur {0} [0, 1], f(x, y) = – y2 de valeurs extrémales 0 et 1.
5
Sur {1} [0, 1], f(x, y) = 1 + y – y2 de valeurs extrémales et 1.
4
2
Sur [0, 1] {0}, f(x, y) = x de valeurs extrémales 0 et 1.
Sur [0, 1] {1}, f(x, y) = x2 + x – 1 de valeurs extrémales –1 et 1.
5
Donc sur la frontière de [0, 1] [0, 1], les valeurs extrémales de f sont – 1 au point (0, 1) et au
4
1
point (1, ).
2
- 58 -
2x + y
Sur l'ouvert ]0, 1[ ]0, 1[, grad(f) = x – 2y qui ne s'annule pas sur cet ouvert. Il n'y a donc pas
d'extremum sur ]0, 1[ ]0, 1[.
Méthode 2 :
On peut traduire le fait que x et y sont positifs ou nuls en les remplaçant respectivement par des
carrés u2 et v2, et traduire la condition u2 1 par u2 = 1 – z2. De même, v2 1 se traduira par
v2 = 1 – t2. On introduit ainsi de nouvelles variables. Les fonctions considérées dépendent alors de u,
v, z et t. Il s'agit de rechercher les extrema de la fonction F : (u, v, z, t) u4 + u2v2 – v4 = f(x, y) sous
les conditions
2 2
g1 = u + z – 1 = 0
g2 = v + t – 1 = 0
2 2
4u
3
+ 2uv2 = 2u
2u2v – 4v3 = 2v
2z = 0
2t = 0
Le système complet à résoudre est :
u2 + z2 – 1 = 0
v2 + t2 – 1 = 0
u = 0 ou 4u2 + 2v2 = 2
v = 0 ou 2u2 – 4v2 = 2
z = 0 ou = 0
t = 0 ou = 0
dont on vérifiera que les seules solutions sont les suivantes :
Si u = v = 0 alors x = y = 0. f est nul en ce point, mais il ne s'agit ni d'un minimum (car f(x, 0) > 0
pour x 0), ni d'un maximum (car f(0, y) < 0 pour y 0).
u = 0 et v = 1 x = 0, y = 1 et f(0, 1) = –1. On remarque que, au voisinage de ce point :
f(x, y) = f(u2, 1 – t2) = – 1 + u2 + 2t2 + u4 – t4 – u2t2
= – 1 + u2 + 2t2 + o(|| (u, t) ||2) – 1.
On a un minimum local.
u = 1 et v = 0 x = 1, y = 0 et f(1, 0) = 1. Au voisinage de ce point, on a :
f(x, y) = f(1 – z2, v2) = 1 – 2z2 + v2 + z4 – v2z2 – v4
= 1 – 2z2 + v2 + o(|| (v, z) ||2).
La quantité – 2z2 + v2 changeant de signe, il n'y a pas d'extremum en ce point.
1 1 1 5
u = 1 et v = x = 1, y = et f(1, ) = . Au voisinage de ce point, on a :
2 2 2 4
1 5 5
f(1 – z2, + h) = – z2 – h2 + o(|| (h,z) ||2)
2 4 2
On a un maximum local.
u = 1 et v = 1 x = y = 1 et f(1, 1) = 1. Au voisinage de ce point, on a :
f(1 – z2, 1 – t2) = 1 – 3z2 + t2 + o(|| (t, z) ||2)
Il n'y a pas d'extremum.
1
Conclusion : il y a un minimum en (0, 1) et un maximum en (1, ). Ci-dessous, la représentation
2
graphique de la surface z = f(x, y) :
- 59 -
1
–1 1
1 x
y
0
- 60 -
On obtient une expression de S sous forme de fonction continue et même différentiable en utilisant
la formule de Stirling (voir le chapitre L2/SUITESF.PDF) : ln(N!) = Nln(N) – N + o(N), soit ici, en
négligeant le reste o(N) :
n n n
S
= ln() = Nln(N) – N – (Ni ln(Ni) – Ni) = Nln(N) – Ni ln(Ni) car Ni = N
k i=1 i=1 i=1
n n n
= Nln(N) – Npi ln(Npi) = Nln(N) – Npi ln(N) – Npi ln(pi)
i=1 i=1 i=1
n
= – N pi ln(pi)
i=1
S
N et Em sont donnés. Les variables sont les pi. Soit f la quantité , de sorte que :
kN
f
= (– pi ln(pi)) = – ln(pi) – 1
n
n
= – kN ln(C) + kN C exp(– Ei) Ei
i=1
= – kN ln(C) + kNEm
= – kN ln(C) + kE
dS
où E = NEm est l'énergie totale E du système. On a alors = k, mais par ailleurs, l'étude des gaz
dE
dS 1 1
parfaits conduit à la relation = , où T est la température absolue. On pose donc = et la
dE T kT
E
probabilité qu'une particule se trouve à l'énergie Ei est donc proportionnelle à exp(– i ). Il est
kT
remarquable que cette répartition ait été observée dans des domaines très variés, sans rapport avec
les gaz parfaits. La constante de Boltzman k est directement liée au choix de l'échelle de température
- 61 -
R
T. Elle vaut environ 1.38 10–23 J/K et correspond également au quotient où R est la constante des
N
gaz parfaits et N le nombre d'Avogadro. La détermination de k par observation de répartition de
particules selon leur niveau d'énergie dans diverses expériences est un moyen de déterminer le
nombre d'Avogadro N.
On rappelle les hypothèses du théorème d'inversion locale : f est une fonction d'un ouvert U de E
dans F, de classe C1, et a un point de U. On suppose que df(a) est inversible.
Il s'agit de montrer qu'il existe un voisinage U' de a inclus dans U et un voisinage W de f(a) tels que
f soit un difféomorphisme de U' sur W.
Pour alléger les notations, notons L l'application linéaire df(a). On pose également b = f(a).
- 62 -
avec : x x – a + L–1(f(a) – f(x)). , qui diffère de de la quantité L–1(y – b) indépendante de x,
1
est C1 et a même différentielle que en tout point, donc, pour tout x de B (a, r), ||| d(x) ||| . Le
2
théorème des accroissements finis permet alors de dire que :
1 r
|| (x) – (a) || || x – a || car x B (a, r)
2 2
r
|| (x) || car (a) = 0
2
Par ailleurs :
|| L–1(y – b) || ||| L–1 ||| || y – b ||
r r
< ||| L–1 ||| car y B(b, )
2 ||| L–1 ||| 2 ||| L–1 |||
r
<
2
Donc, par l'inégalité triangulaire :
|| (x) – a || || (x) || + || L–1(y – b) || < r
et (x) appartient à B(a, r) B (a, r).
r
Prenons W = B(b, ) et U' = {x B(a, r), f(x) W}. f est alors une bijection de U' sur W.
2 ||| L–1 |||
Nous considérons désormais la restriction de f à U', que nous continuerons à noter f. Cette
restriction f étant continue et W ouvert, U' qui est égal à f–1(W) est ouvert dans B(a, r), et B(a, r)
étant lui-même un ouvert de E, U' est un ouvert de E.
4- Continuité de f–1
En reprenant la fonction : x x – a + L–1(f(a) – f(x)) qui est, comme la fonction , lipschitzienne
1
de rapport sur B (a, r), on a, pour tout y et y' dans W, et en notant x et x' leurs antécédants par f–1
2
dans U' :
- 63 -
(x) – (x') = x – x' + L–1(f(x') – f(x)) = x – x' + L–1(y' – y)
x – x' – ((x) – (x')) = L–1(y – y')
|| x – x' || – || (x) – (x') || || x – x' – ((x) – (x')) || || L–1(y – y') || ||| L–1 ||| || y – y' ||
1
|| x – x' || – || x – x' || || x – x' || – || (x) – (x') || ||| L–1 ||| || y – y' ||
2
1
|| x – x' || ||| L–1 ||| || y – y' ||
2
|| f–1(y) – f–1(y') || = || x – x' || 2 ||| L–1 ||| || y – y' ||
Donc f est lipschitzienne sur W de rapport 2 ||| L–1 ||| donc continue.
–1
5- Différentiabilité de f–1
Soit x0 un élément de U', et y0 = f(x0). Posons H = df(x0). On a :
f(x) – f(x0) = H(x – x0) + || x – x0 || (x) avec lim (x) = 0
xx0
y – y0 = H(x – x0) + || x – x0 || (x) en posant y = f(x)
x – x0 = H–1(y – y0) – H–1(|| x – x0 || (x)) car H est inversible
–1 –1 –1 –1
f (y) – f (y0) = H (y – y0) – || x – x0 || H ((x))
Pour conclure que f–1 est différentiable en y0, de différentielle H–1, il suffit que montrer que :
|| x – x0 || H–1((x)) = o(|| y – y0 ||) quand y tend vers y0
–1 –1
Or l'égalité x – x0 = H (y – y0) – || x – x0 || H ((x)) entraîne :
|| x – x0 || || H–1(y – y0) || + || x – x0 || || H–1((x)) ||
||| H–1 ||| || y – y0 || + || x – x0 || || H–1((x)) ||
|| x – x0 || – || x – x0 || || H–1((x)) || ||| H–1 ||| || y – y0 ||
|| x – x0 || (1 – || H–1((x)) ||) || ||| H–1 ||| || y – y0 ||
Quand y tend vers y0, x = f–1(y) tend vers x0 = f–1(y0) car nous avons vu que f–1 était continue, donc
(x) tend vers 0 ainsi que son image par H–1, car H–1 est continue. On peut donc se placer sur un
1 1
voisinage de y0 tel que, pour y dans ce voisinage, || H–1((x)) || , et donc (1 – || H–1((x)) ||) . On
2 2
obtient :
|| x – x0 || 2 ||| H–1 ||| || y – y0 ||
donc || x – x0 || || H–1((x)) || 2 ||| H–1 ||| || y – y0 || || H–1((f–1(y))) || = o(|| y – y0||)
car lim H–1((f–1(y))) = lim H–1((x)) = 0.
yy0 xx0
Ainsi, f est différentiable en y0, de différentielle d(f–1)(y0) = H–1 = (df(x0))–1.
–1
6- Caractère C1 de f–1
Il reste à montrer que f–1 est C1, i.e. que l'application y d(f–1)(y) est continue. Cette application est
la composée de :
f–1 df –1
y x = f–1(y) df(x) (df(x))–1 = d(f–1)(y)
f–1 df
La première flèche est continue. La seconde flèche est continue car f est C1, ce qui signifie
–1
que df(x) dépend continûment de x. La troisième flèche est l'application qui, à une application
linéaire inversible, associe son inverse. Elle est continue comme on le voit plus facilement sur les
matrices : l'application qui, à une matrice inversible, associe la matrice inverse est continue, car
l'expression de la matrice inverse en fonction de la comatrice (voir le chapitre
L1/DETERMNT.PDF) montre que tous les coefficients de la matrice inverse s'expriment
- 64 -
continûment à partir des coefficients de la matrice initiale. Chacune des flèches étant continue, il en
est de même de la composée y d(f–1)(y).
Exercices
1- Enoncés
x y si (x, y) (0, 0)
a
x
Exo.2) Soit f : Rn \ {0} Rn \ {0} la fonction définie par f(x) = , où || || désigne la norme
|| x ||2
euclidienne. f est une inversion.
a) Quelle est la matrice jacobienne J de f en un point quelconque de Rn \ {(0, 0)} ?
b) Montrer que J est la matrice d'une similitude (produit d'une homothétie par une
isométrie). En donner les éléments caractéristiques.
Exo.3) Dans Rn+1, on considère l'hyperplan (H) = {(x1, ..., xn, 0) | i, xi R}, la sphère unité
n+1
Sn = {(y1, ..., yn+1) Rn+1, yi2 = 1} et les deux points N = (0, 0, ..., 0, 1) et P = (0, 0, ..., 0, – 1),
i=1
appelés respectivement pôle nord et pôle sud de Sn. Pour tout x élément de Rn, on considère le point
M de (H) de coordonnées (x, 0) et le point M' autre que N intersection de Sn et de la droite (MN).
f1(x1, ..., xn)
On définit ainsi une fonction f : x = (x1, ..., xn) R M' = f(x) =
n
... Sn. La
fn+1(x1, ..., xn)
transformation M' M s'appelle projection stéréographique de Sn sur (H) de pôle N. f en est la
réciproque (abstraction faite de la dernière composante nulle des points de (H)).
a) Donner l'expression de f(x) en fonction des composantes de x. On pourra poser
n
r= xi2.
i=1
b) Pour tout x = (x1, ..., xn) de Rn, on forme la matrice jacobienne J de f, de terme général
fi
. Calculer les coefficients de la matrice J.
xj
c) Montrer que, pour tout x de Rn, l'image de la base canonique de Rn par la différentielle
dfx est une base orthogonale du sous-espace vectoriel de Rn+1 orthogonal à f(x). Quelle est la norme
euclidienne des vecteurs de cette base ?
d) Soit g : Rn Sn la projection stéréographique réciproque de pôle P. Montrer que g–1 o f
est un difféomorphisme de Rn \ {0} sur lui-même.
Exo.4) Toutes les fonctions sont supposées C1. E et F désigne deux espaces vectoriels de dimension
finie, E étant euclidien. On dispose de plusieurs notions voisines :
- 65 -
Pour f de E dans F, on utilise la notion de différentielle dfa
Pour f de R dans F, on utilise celle de dérivée f '(a). Quel rapport avec dfa ?
Pour f de E euclidien dans R, on utilise celle de gradient grad(f)(a). Quel rapport avec dfa ?
Pour f : E F, et g : F G, on a d(g o f)a = dgb o dfa, avec b = f(a).
a) Pour f : R F et g : F G, exprimer (g o f)' en fonction de dg et f '
b) Pour f : E R et g : R G, exprimer d(g o f) en fonction de g' et de grad(f)
c) Pour f : E F et g : F R, exprimer grad(g o f) en fonction de grad(g) et df
d) Pour f : R R et g : R F, exprimer (g o f)' en fonction de g' et f '
e) Pour f : R E et g : E R, exprimer (g o f)' en fonction de grad(g) et f '
f) Pour f : E R et g : R R, exprimer grad(g o f) en fonction de g' et grad(f).
Exo.5) Soit f une fonction dérivable de R dans R, et g la fonction de R2 dans R définie par :
f(x) – f(y) si x y
g(x, y) = x – y
f '(x) si x = y
a) Montrer que f est est C sur R si et seulement si g est continue sur R2.
1
b) Donner un exemple de fonction f dérivable sur R telle que g ne soit pas continue en au
moins un point.
c) Montrer que, si f est C2, alors g est différentiable.
x = rcos() x
Exo.6) Lors d'un passage en coordonnées polaires , Gaston constate que = cos() et
y = rsin() r
que :
r x
= x2 + y2 = 2 = cos()
x x x + y2
x r x 1
On a donc = alors que Gaston aurait plutôt pensé que = . Dans le cas d'un changement de
r x r r
x
x = x(u, v) x 1
variable général bijectif y = y(u, v) , quelle relation y a-t-il entre et ?
u u
x
Exo.7) Soit f : R2 R2 définie par f(x,y) = (x + y, xy). Déterminer deux ouverts U et V de R2, les
plus grands possibles, tels que f soit un C1-difféomorphisme de U sur V.
Exo.10) On se place dans le disque D ouvert de centre O = (0, 0), de rayon 1, privé de son centre O.
a) x et y étant deux fonctions de classe C1 de la variable réelle t à valeurs réelles, résoudre les
x' = – x –
y
x' = – x
systèmes différentiels (1) y' = – y et (2)
ln(x2
+ y2)
. Pour le second système, on pourra
y' = – y + 2x 2
ln(x + y )
poser z = x + iy = re avec r module de z et son argument, et résoudre le système vérifié par r et ,
i
suffisés fonctions C1 de t (l'existence du couple (r, ) en tant que fonctions C1 n'est pas tout à fait
évident et sera ici admise. Une preuve rigoureuse est donnée dans le chapitre L3/HOLOMRPF.PDF
dans la partie relative au théorème du relèvement).Tracer les courbes paramétrées t (x(t), y(t)) des
solutions trouvées dans chaque cas.
b) Déterminer un difféomorphisme h : R2 \ {(0, 0)} D tel que les courbes intégrales de
(1) aient pour images par h les courbes intégrales de (2).
P 2xyz – y
l'équation Rot( Q ) = y – y z , où P, Q, R sont trois fonctions C1
2
Exo.11) On considère dans R 3
R 2x – z
de (x, y, z).
a) Chercher les solutions vérifiant R = 0 et Q(x, y, 0) = 0 pour tout (x, y)
2
P yz + x
b) Vérifier que Q = yz + x est solution.
2
R xy2z
c) Déterminer une fonction f telle que l'ajout de grad(f) à la solution a) donne la solution b).
Cet exercice est un cas particulier du théorème de Poincaré exposé dans l'annexe II4.
Exo.12) Vérifier qu'une fonction y = (x) est bien définie implicitement au voisinage de (1, 1) par
x3 + y3 = xy + 1. Donner un développement limité à l'ordre 4 de au voisinage de 1.
4
Pour une généralisation, voir : Shirley Llamado Yap, The Poincaré lemma and an elementary construction of vector
potentials, 116:3, Amer. Math. Monthly, (mars 2009), 261-267.
- 67 -
b) Donner les dérivées partielles premières de en (2, – e).
c) Donner les dérivées partielles secondes de en (2, – e).
Exo.14) Utilisation d'une forme différentielle pour résoudre une équation différentielle : Pour
chacune des formes différentielles 0 suivantes, dire si elle est exacte. Si ce n'est pas le cas, la
multiplier par un facteur intégrant g adéquat. Trouver ensuite une primitive f de = g0 sur un
ouvert convexe ou étoilé convenable. Déterminer enfin les courbes intégrales de l'équation
différentielle indiquée.
x xy + 1 – y2
a) 0(x, y) = (xy + 1 – y2) dx – xy dy, g(x, y) = , y' = .
1 + xy xy
ex
b) 0(x, y) = (y2 + ex) dx – y dy, g fonction de x, y' = y + .
y
Exo.15) Dans R2, soit A = (0, 1), B = (1, 1) et C = (0, 2). On considère le chemin constitué :
du segment [CA]
du segment [AB]
de l'arc BC, de centre A et de rayon 1
2xy dx + (1 – x2) dy
Soit = . Calculer
y2 de deux façons.
–R R
Que vaut
?
c) Majorer l'intégrale de sur les deux segments latéraux et montrer qu'elles tendent vers 0
quand R tend vers l'infini.
d) En déduire que 2
exp(– (x + ia) ) dx ne dépend pas de a.
–
e) Donner une autre démonstration de cette propriété.
Exo.17) Pour tout (x, y) réels, on considère le complexe z = x + iy. On note dz la forme linéaire à
valeur dans C égale à dx + idy. On considère la forme différentielle suivante, définie sur
R2 \ {(0, 0)} :
- 68 -
2z
= Re ( z dz)
e –1
x(cos(y) – e–x) + ysin(y) y(cos(y) – e–x) – xsin(y)
a) Vérifier que = dx – dy
ch(x) – cos(y) ch(x) – cos(y)
b) Vérifier que est une forme différentielle fermée.
x(cos(y) – e–x) + ysin(y) y(cos(y) – e–x) – xsin(y)
c) Montrer que les fonctions et admettent
ch(x) – cos(y) ch(x) – cos(y)
une limite quand (x, y) tendent vers (0, 0).
d) Que dire de où est le chemin suivant ?
D C
A B
avec 0 < a < b et A(a, 0), B(b, 0), C(b, ), D(0, ), E(0, a).
e) On fait tendre a vers 0 et b vers +. En déduire la valeur de
x
sh(x) dx.
0
/2
dz) pour en déduire la valeur de
2z t
f) Procéder de même avec = Im( z
e –1 tan(t) dt.
0
Exo.18) Dans ce chapitre, nous avons essentiellement utilisé la notion de différentielle pour des
fonctions de Rn dans Rp. Voici des exemples de différentielles pour des fonctions définies sur
l'espace des matrices carrées Mn(R). Pour chaque fonction suivante, montrer qu'elle est
différentiable et déterminer sa différentielle :
a) M Mn(R) M2
b) M GLn(R) M–1
c) M Mn(R) det(M)
2- Solutions
a+2
mx m
Sol.1) a) Pour a 2 et pour tout m > 0, on a f(x, mx ) = 2
= x a–2
. Cette quantité
(1 + m2)x4 1 + m2
m
tend vers l'infini si a < 2 quand x tend vers 0, et vers si a = 2, et non vers f(0, 0) = 0. Donc f
1 + m2
n'est pas continue en (0, 0).
Pour a > 2, on a :
–1+a/2 1 u2 + v2
x a
y = x 1+a/2
x y (x a+2
+ x a–2 2
y ) en utilisant uv
2 2
- 69 -
donc, pour (x, y) (0, 0) :
a+2
1 x x a–2y2
f(x, y) ( 4 + )
2 x + y2 x4 + y2
a+2 a–2 2
1 x x y
( 4 + 2 ) = x a–2 0 quand (x, y) tend vers (0, 0)
2 x y
Donc f est continue en (0, 0)
b) Toujours pour a > 2, la dérivée de f en (0, 0) suivant le vecteur (u, v) est la dérivée en 0 de la
u av f f
fonction t t a–2
t et est donc nulle. En particulier, (0, 0) = (0, 0) = 0. f est
x y
4 4 2
t u +v
différentiable en (0, 0) si et seulement si :
f f
f(x, y) = f(0, 0) + x (0, 0) + y (0, 0) + o(x, y) = o(x, y)
x y
a–2
Ce sera bien le cas si a > 3 d'après l'inégalité du a) f(x, y) = O( x ) = o( x ) = o(x, y). Mais c'est
faux si 2 < a 3. En effet, dans ce cas :
a+2 a–2
2
x x
f(x, x ) = =
2x4 2
qui n'est pas un o(x, y). Donc f n'est pas différentiable en (0, 0), bien qu'y admettant des dérivées
partielles selon n'importe quel vecteur (mais f n'est pas C1).
Sol.2) On note xi les composantes de x dans la base canonique de Rn, et fi(x) celles de f(x), de
sorte que :
xi
fi(x) = 2
x1 + ... + xn2
– ||2xxix||4j si i j
f
a) Le terme général de J est i = || x ||2 – 2x 2 .
xj i
|| x ||4 si i = j
– ||2xxix||2j si i j
b) Prenons =
1 J
2 et P = . Le terme général de P est Pij = || x ||2 – 2x 2 . On peut
|| x || i
|| x || 2 si i = j
2xxT
remarquer que P = In – . Appliquée sur un vecteur y de Rn, on obtient :
|| x ||2
2xxTy <x, y>
Py = y – =y–2 x
|| x ||2 || x ||2
où <x, y> est le produit scalaire de x par y. P est la matrice de la réflexion par rapport à l'hyperplan
orthogonal à x, qui est une isométrie, et J est le produit de cette isométrie par l'homothétie de
rapport .
On peut chercher directement la différentielle de f en écrivant que :
x+h x+h 1 <x, h>
f(x + h) = 2= 2 2= 2 (1 – 2 + o(h))(x + h)
|| x + h || || x || + 2<x, h> + || h || || x || || x ||2
1 <x, h>
= f(x) + (h – 2 x) + o(h)
|| x ||2 || x ||2
- 70 -
1 <x, h>
On retrouve que la différentielle de f est l'application h 2 (h – 2 x), composée de
|| x || || x ||2
1
l'homothétie de rapport et de la réflexion P par rapport à l'hyperplan orthogonal à x.
|| x ||2
Sol.3) a) Si x = (x1, ..., xn), alors M = (x1, ..., xn, 0). Posons M' = (y1, ..., yn+1). Puisque M, M' et N
sont alignés, il existe (non nul car M' N) tel que M' = M + (1 – )N, i.e. :
i n, yi = xi
et yn+1 = 1 –
n+1
On veut que yi2 = 1, ce qui donne :
i=1
n
2 xi2 + (1 – )2 = 1
i=1
2(r2 + 1) – 2 = 0 en développant
2
= 2 car 0
r +1
2x1
...
r + 1 2xn
1
Ainsi, f(x1, ..., xn) = 2 .
r – 1
2
4x 2 2xj
donc <dfx(ej), f(x)> = – 2 j 3 (2r2 – r2 + 1) + 2 2 = 0.
(r + 1) r +1r +1
On a montré que les dfx(ej) étaient tous orthogonaux à f(x). On peut obtenir ce résultat plus
rapidement en remarquant que, pour tout x de Rn, <f(x), f(x)> = 1, donc en différentiant en x, on a,
pour tout h élément de Rn, <f(x), dfx(h)> = 0.
Montrons que les dfx(ej) sont orthogonaux deux à deux. Pour i j :
16x x 8x x 8x x
<dfx(ei), dfx(ej)> = 2 i j 4 (r2 + 1) – 2 j i 3 – 2 i j 3 = 0
(r + 1) (r + 1) (r + 1)
donc la base formée des dfx(ei) est orthogonale.
- 71 -
16xj2 2 16xj2 4 4
<dfx(ej), dfx(ej)> = 2 4 (r + 1) – 2 3+ 2 2= 2
(r + 1) (r + 1) (r + 1) (r + 1)2
2
donc, pour tout i, || dfx(ej) || = 2 .
r +1
On a montré que l'image d'une base de Rn par la différentielle de f en x est une base de l'hyperplan
tangent à la sphère Sn en f(x), la différentielle préservant l'orthogonalité. La projection
stéréographique réciproque f–1 sur H permet d'établir au voisinage de tout point f(x) une carte locale
plane de la sphère Sn. Cette projection conserve les angles.
d) On reprendra le calcul du a), en changeant N en P :
2x1
...
y1 n
x R , g(x) = 2
n 1
r +1 2x =
...
avec r 2
= xi2 = || x ||2
1 – r2 yn+1
n i=1
y (r2 + 1) 1 – r2 2 1 – yn+1
et réciproquement, xi = i pour i variant de 1 à n et 2 = yn+1, donc r = et
2 1+r 1 + yn+1
r2 + 1 1
= . Donc :
2 1 + yn+1
y1
–1
g (y1, ..., yn, yn+1) =
1 ...
1 + yn+1 y
n
Donc, pour x dans R \ {0} (et donc tel que r 0) :
n
2x1
2
r +1
–1
(g o f)(x) = g ( 2–1 2x1
r +1
, ..., 2
2xn r2 – 1 1 + r2
,
r + 1 r2 + 1
)= 2r2 ...
2xn
r2 + 1
x1
1 ... x
= 2 =
r x || x ||2
n
x
On obtient l'inversion x définie dans l'exercice précédent. g–1 o f réalise un changement de
|| x ||2
carte. On passe d'une représentation plane sur (H) de la sphère Sn de pôle N (celui-ci étant rejeté à
l'infini et le pôle P étant à l'origine) en une représentation plane sur (H) de Sn de pôle P (celui-ci
étant rejeté à l'infini et le pôle N étant ramené à l'origine). Ou encore, pour la sphère terrestre en
dimension 3, on passe d'une carte plane où l'antarctique est au centre et le pôle nord rejeté à l'infini
en une carte plane où l'arctique est au centre et le pôle sud rejeté à l'infini. Au voisinage de chaque
point, le changement de carte est une similitude.
- 72 -
d(g o f)(a)(h) = (dgb o dfa)(h) = dgb(<grad(f)(a), h>)
= <grad(f)(a), h> g'(b)
d(g o f)(a) = <grad(f)(a), . > g'(b)
c) <grad(g o f)(a), h> = d(g o f)(a)(h) = (dgb o dfa)(h)
= <grad(g)(b), dfa(h)>
= <dfa*(grad(g)(b)), h>
où * désigne l'adjoint d'une application linéaire.
Revoir au besoin le chapitre L2/PREHILB.PDF
grad(g o f)(a) = dfa*(grad(g)(b))
d) h(g o f)'(a) = d(g o f)(a)(h) = (dgb o dfa)(h)
= dgb(hf '(a)) = hf '(a)g'(b)
(g o f)'(a) = f '(a)g'(b)
e) h(g o f)'(a) = d(g o f)(a)(h) = (dgb o dfa)(h)
= dgb(hf '(a)) = <grad(g)(b), hf '(a)>
(g o f)'(a) = <grad(g)(b),f '(a)>
f) <grad(g o f)(a), h> = d(g o f)(a)(h) = (dgb o dfa)(h)
= dgb(<grad(f)(a), h>) = g'(b)<grad(f)(a),h>
grad(g o f)(a) = g'(b) grad(f)(a)
Sol.5) a) Supposons f de classe C1. g est continue sur R2 \ {(x, x), x R}, comme différences et
quotient de fonctions continues (dont les fonctions (x, y) f(x) et (x, y) f(y)). Reste à étudier la
continuité de g en un point (c, c), point quelconque de la diagonale de R2.
Pour tout x y, l'égalité des accroissements finis donne l'existence d'un élément z compris entre x et
y tel que g(x, y) = f '(z). Cette égalité est également vérifiée si x = y en prenant z = x = y. Quand x et
y tendent vers c, z également, et puisque f ' est supposée continue, f '(z) tend vers f '(c). On a ainsi
montré que, pour tout c, lim g(x, y) = f '(c) = g(c, c)
(x,y)(c,c)
donc g est également continue en tout point de la diagonale de R2.
Réciproquement, soit g continue sur R2. Il s'agit de à montrer que f ' est continue. Soit c un réel
et > 0. Comme on sait que lim g(x, y) = g(c, c) = f '(c), il existe > 0 tel que, pour x et y
(x,y)(c,c)
éléments distincts de ]c – , c + [, on a :
f(x) – f(y)
f '(c) – <
x–y
Pour tout d tel que c – d < , prenons x (dépendant de d) assez proche de d pour que l'on ait à la
f(x) – f(d)
fois c – x < et f '(d) – < , ce qui est possible car f est dérivable en d. On a alors :
x–d
f(x) – f(d) f(x) – f(d)
f '(c) – f '(d) f '(c) – + – f '(d) < 2
x–d x–d
On a montré que :
> 0, > 0, d ]c – , c + [, f '(c) – f '(d) < 2
ce qui est la définition de lim f '(d) = f '(c). On a prouvé que f ' est continue en tout point c de I, donc
dc
f est C1 sur I.
- 73 -
x2 sin(1) si x 0
b) La fonction f : x x est dérivable sur R , de dérivée nulle en 0 (revoir au besoin
0 si x = 0
le chapitre L1/DERIVEE.PDF).
1 1
Par l'absurde, si g était continue en (0, 0), on devrait avoir, en prenant xn = et yn = :
2n + 2n –
2 2
lim g(xn, yn) = g(0, 0) = f '(0) = 0
n
f(xn) – f(yn)
lim =0
n xn – yn
x 2 + yn2
lim n =0 car f(xn) = xn2 et f(yn) = – yn2
n x n – yn
x /y + yn/xn
lim n n =0
n 1/yn – 1/xn
2
Or le membre de gauche vaut – .
c) Au voisinage de (x0, y0) avec x0 y0, g est différentiable car C1 comme quotient de différences de
fonctions C1. Considérons maintenant le cas y0 = x0. Pour simplifier les notations, on peut, par
translation de variable, supposer que x0 = 0. On prendra également comme norme sur R2 :
|| (x, y) || = x + y
x2f"(0)
Considérons la fonction : x f(0) + xf '(0) + , partie principale au second ordre de la
2
fonction f en 0. On a '(x) = f '(0) + xf"(0), et, pour x y :
(x) – (y) f"(0)
= f '(0) + (x + y)
x–y 2
(x) – (y) si x y
La fonction : (x, y) x–y est donc différentiable en (0, 0), de différentielle
'(x) si x = y
f"(0)
(x, y) (x + y), que x soit différent de y ou pas, le reste du développement limité étant nul.
2
Raisonnons alors sur les fonctions F = f – et G = g – , de sorte que :
F(x) – F(y) si x y
G(x, y) = x – y
F'(x) si x = y
2
F est C , et a F(0) = 0, F'(0) = 0, F"(0) = 0,
Montrons que G est différentiable de différentielle nulle. Il en résultera que g est différentiable en
(0, 0), de même différentielle que celle de calculée précédemment. Il s'agit donc de montrer que
G(x, y) = o(|| (x, y) ||) quand (x, y) tend vers 0.
Au voisinage de 0, F'(t) = F'(0) + tF"(0) + o(t) = o(t). Donc, pour tout > 0, il existe > 0 tel que :
t ]– , [, F'(t) t
Donc :
si – < x = y < :
G(x, y) = F'(x) x || (x, y) ||
et si x y, éléments de ]– , [ :
- 74 -
y
F(x) – F(y) =
F'(t) dt y – x Sup{ t , t entre x et y}
x
Sol.6) Considérons la composée (x, y) (u, v) (x, y). Si calcule les dérivées partielles par
rapport à x de cette fonction composée, on obtient :
x u x v
1= +
u x v x
y u y v
0= +
u x v x
y x
donc, en multipliant la première égalité par et la seconde par :
v v
y y x u y x v
= +
v v u x v v x
x y u x y v
0= +
v u x v v x
et en retranchant membre à membre :
y y x x y u
=( – )
v v u v u x
et donc :
y
u v
=
x y x x y
–
v u v u
ou encore :
x y
1 x v u
= –
u u y
x v
x y
v u x 1
Par conséquent, il y a un terme correctif à retrancher à pour obtenir .
y u u
v x
Une autre démonstration, plus rapide, utilise les matrices jacobiennes. Si J est la matrice jacobienne
de l'application (u, v) (x, y), J–1 est la matrice jacobienne de l'application (x, y) (u, v), de sorte
que :
- 75 -
x x
u
J=
v
y y
u v
u u
et
x y = J–1
v v
x y
y x
–
=
1 v v en inversant la matrice J
x y x y – y x
u v v u u u
–
y
u v
donc = comme précédemment.
x x y x y
–
u v v u
On peut également en donner une démonstration géométrique. Dans la figure ci-dessous, les calculs
sont menés au premier ordre, x et y étant fonctions de (u, v), et les courbes représentatives des
x(u, v) x(u, v)
fonctions partielles u y(u, v) et v y(u, v) étant approximées par leur tangente. On se
donne une variation h de la variable u :
courbe u y(u, v)
x(u, v)
Oy
courbe v y(u+h, v)
x(u+h, v)
D
courbe v y(u, v)
x(u, v)
y
h
u de pente
y
A B
C v
p=
x
v
y h
u p
Ox
h x
u u
h
x
- 76 -
On a :
C = (x(u, v), y(u, v))
D = (x(u + h, v), y(u + h, v))
B = (x(u + h , v), y(u, v))
donc les différences de coordonnées sont, au premier ordre :
y
yD – yA = yD – yB = yD – yC = y(u + h, v) – y(u, v) = h
u
x
xB – xC = x(u + h, v) – x(u, v) = h
u
y
y –y v
Par ailleurs, D A = p = , pente de (AD). Donc :
xD – xA x
v
y –y y h
xB – xA = xD – xA = D A =
p u p
Enfin :
A = (x(u + h, v + k), y(u + h, v + k) pour une certaine valeur de k
k est tel que y(u + h, v + k) = y(u, v). Pour cette même ordonnée y, u varie de la quantité h quand
l'abscisse x varie de xC à xA. Si on voit u comme fonction de (x, y), on a donc, au premier ordre :
u
h = u(xA, y) – u(xC, y) = (xA – xC)
x
h
donc xA – xC =
u
x
On conclut alors que :
xA – xC = xA – xB + xB – xC
h y h x
=– + h
u u p u
x
x y
1 y 1 x x v u
=– + = – comme précédemment.
u u p u u y
x v
Sol.7) Posons (u, v) = f(x, y). f n'est pas bijective sur R2 puisque f(x, y) = f(y, x).
1 1
f est C1 de matrice jacobienne y x = x – y. Pour que f soit un difféomorphisme, il est nécessaire
que cette matrice soit inversible, et donc que x soit différent de y. Comme (x, y) a même image que
(y, x), on peut prendre U = {(x, y) | x > y} et V = f(U). Il reste à montrer que V est un ouvert et que f
est bien bijective de U sur V. On a u = x + y et v = xy, donc :
u2 – 4v = (x + y)2 – 4xy = (x – y)2 > 0
donc V {(u, v) | u2 – 4v > 0}.
Réciproquement, si (u, v) est tel que u2 – 4v > 0, alors il existe un unique couple (x, y) antécédent de
(u, v) par f et tel que x > y. Ce sont les racines du trinôme X2 – uX + v, à savoir :
- 77 -
u + u2 – 4v u – u2 – 4v
(x, y) = ( , ) = f–1(u, v)
2 2
On a alors montré que V = {(u, v) | u2 – 4v > 0}.
f est bijective de U sur V, C1 sur U et sa différentielle est inversible en tout point de U. La
proposition du cours qui suit le théorème d'inversion locale suffit pour conclure que f est un
difféomorphisme, i.e. que f–1 est différentiable et que sa différentielle est une fonction continue de
(u, v) (ce qu'on peut aussi directement voir puisqu'on connaît l'expression de f–1. On pourra
1 x –1 1 1
également vérifier que l'inverse de la matrice jacobienne y x de f est la matrice
x–y –y 1
–1
jacobienne de f ).
On peut représenter l'image d'un quadrillage de U :
Pour c > 0, les droites y = x – c ont pour image les paraboles (u, v) = (c + 2y, y2 + cy), d'équation
u2 – c2 u2
v= . En particulier la frontière x = y a pour image v =
4 4
c
Pour c quelconque, les demi-droites y = – x + c, x > > y, ont pour image les demi-droites
2
2
c
(u, v) = (c, cy – y2), soit u = c, v < . On obtient le dessin suivant :
4
f
U V
Le demi-plan U semble projeté sur un paraboloïde hyperbolique (voir L2/CONIQUES.PDF).
Prenons X = x + y et Y = x – y. On s'intéresse au demi-plan x > y ou Y > 0. Au point (X, Y) du
X2 – Y2
demi-plan, on associe le point (X, Y, Z) du paraboloïde tel que Z = , puis on projette sur le
4
X2 – Y2
plan OXZ, ce qui donne le point (X, ) = (x + y, xy).
4
- 78 -
1 u2 + v2
1– =
x2 + y2 u2 + v2 + 1
1 1
=1+ 2
1– 2
1 u + v2
x + y2
donc nécessairement, la réciproque f–1 est donnée par :
1
(u, v) U2 (x, y) = (1 + 2 ) (u, v)
u + v2
On vérifie qu'on a bien toujours x2 + y2 = u2 + v2 + 1, donc x2 + y2 > 1. f est donc bien une
bijection de {(x, y), x2 + y2 > 1} sur U2. f et f–1 sont C1, donc f est un difféomorphisme.
1 + y2
b) f : (x, y) (u, v) = ((1 – ) x, y)
x
Si x2 – y2 > 1, x > 1 + y2, donc u 0. Donc f(x, y) U1 R.
f a été construit de façon que les deux branches d'hyperbole x2 – y2 = 1, formant la frontière du
domaine {(x, y), x2 – y2 > 1}, aient pour image l'axe des ordonnées.
Pour le calcul de f–1, on a y = v et :
1 + y2 1 + v2
u = (1 – ) x = (1 – )x
x x
donc :
1 + v2 1 + v2 1 + y2
u = (1 – ) x car 1 – =1– > 0 si x2 – y2 > 1
x x x
donc :
x = u + 1 + v2
1 + v2 1 + v2
=
x u + 1 + v2
1 + v2 u
1– =
x u + 1 + v2
1 1 + v2
= 1 +
1 + v2 u
1–
x
Donc nécessairement, f–1 est donné par :
1 + v2
(u, v) (x, y) = ((1 + ) u, v)
u
On a bien :
1 + v2
x2 – y2 = (1 + )2 u2 – v2
u
= u2 + 2 u 1 + v2 + 1
>1
- 79 -
Donc f est bien une bijection de {(x, y), x2 – y2 > 1} sur U1 R. f et f–1 sont C1, donc f est un
difféomorphisme.
1
c) (x, y, z) (1 – 2 ) (x, y, z). La réciproque est donnée par :
x + y2 + z2
1
(u, v, w) (1 + 2 ) (u, v, w)
u + v2 + w2
Le raisonnement est analogue à celui du a).
1 + z2 1 + z2
d) (x, y, z) ((1 – 2 ) x, (1 – ) y, z)
x + y2 x2 + y2
On tient le même raisonnement qu'au b) en remplaçant x par (x, y), x par x2 + y2, u par (u, v), u
par u2 + v2. La réciproque est :
1 + w2 1 + w2
(u, v, w) ((1 + 2 ) u, (1 + ) v, w)
u + v2 u2 + v2
1 + y2 + z2
e) (x, y, z) ((1 – ) x, y, z)
x
La réciproque est :
1 + v2 + w2
(u, v, w) ((1 + ) u, v, w)
u
On tient le même raisonnement qu'au b) en remplaçant y par (y, z) et v par (v, w).
k n
f) Vérifier qu'on définit un difféomorphisme de {(x1, ..., xn), xi2 – xi2 > 1} sur Uk Rn–k par :
i=1 i=k+1
x1 0
+
... ...
2 2 xk 0
1 + xk+1 + ... + xn
(x1, ..., xn) (1 – )
x12 + ... + xk2 0
xk+1
...
0 ...
xn
La réciproque est :
... ...
u1 0
0 u n
x
Sol.9) a) Supposons m > 0. Pour tout x non nul de E, posons y = . y appartient à B et :
|| x ||
<u(x), x> = || x ||2 <u(y), y> || x ||2 m(u) > 0
donc u appartient à U.
Réciproquement, l'application x B <u(x), x> est continue sur le fermé borné B de E, espace
vectoriel normé de dimension fini, donc atteint son minimum m(u) en un élément x0 de B (revoir au
besoin le chapitre L2/EVNORME.PDF). Donc, si u appartient à U, on a :
m(u) = <u(x0), x0> > 0
- 80 -
m(u)
b) Soit u U et v S(E) telle que ||| u – v ||| < (en notant ||| ||| la norme d'endomorphisme
2
subordonnée à la norme euclidienne de E). Alors, pour tout x dans B :
<v(x), x> – <u(x), x> || (u – v)(x) || || x || d'après l'inégalité de Schwarz
||| u – v ||| || x ||
2
d'après la définition de ||| |||
||| u – v ||| car x B
m(u)
<
2
m(u) m(u)
donc <v(x), x> <u(x), x> – > 0 donc v U.
2 2
c) Si v est élément de U, v2 est bien élément de U. En effet, v2 est symétrique, et pour tout x non nul,
on a :
<v2(x), x> = <v(v(x)), x>
= <v(x), v(x)> car v est symétrique
2
= || v(x) ||
>0
car v(x) est non nul puique <v(x), x> > 0.
Montrons la surjectivité de f. Soit u appartenant à U. Montrons qu'il existe v appartenant à U tel que
u = f(v) = v2. On utilise le fait que, u étant symétrique, u est diagonalisable dans une base
orthonormée (e1, ..., en) de vecteurs propres (voir L2/PREHILB.PDF). Notons di la valeur propre
associée à ei. u étant défini positif, on a :
0 < <u(ei), ei> = <diei, ei> = di || ei ||2
donc di > 0. Notons v l'endomorphisme de E défini par : i, v(ei) = di ei. v est un endomorphisme
symétrique puisque sa matrice est diagonale donc symétrique dans la base orthonormée (e1, ..., en). v
n
est défini positif car, pour tout x = xiei non nul, on a :
i=1
n n n
<v(x), x> = < xi di ei, xi ei> = xi2 di > 0
i=1 i=1 i=1
Sol.10) a) Dans le premier cas, il existe deux réels et tels que, pour tout t, x(t) = e–t et
y(t) = e–t. Les courbes des solutions sont :
si (, ) (0, 0), les demi-droites d'origine O, O étant exclu
si (l, ) = (0, 0), le singleton {O}.
O est attractif, dans le sens où lim (x(t), y(t)) = (0, 0).
t+
Dans le second cas :
iz
z' = – z +
ln(r2)
- 82 -
irei
r'ei + ir'ei = – rei +
ln(r2)
ir
r' + ir' = – r +
ln(r2)
r' = – r
1
' =
2ln(r)
donc il existe une constante C (strictement positive car r > 0) telle que r = Ce–t. Donc :
1
' =
2(ln(C) – t)
1
donc il existe une constante 0 telle que = 0 – ln( ln(C) – t ). Quitte à changer d'origine des
2
1
temps, on peut supposer C = 1 et prendre r = e–t, et = 0 – ln( t ), ce qui simplifie les notations.
2
Les courbes intégrales s'obtiennent par rotation d'angle 0 à partir de la courbe vérifiant r = e–t et
1
= – ln( t ). Le cercle de rayon 1 est asymptote quand t tend vers 0. r est une fonction
2
décroissante de t. Quant t croît de – à 0, on est à l'extérieur du disque D et croît indéfiniment.
Les courbes intégrales sont des spirales s'enroulant dans le sens trigonométrique. Quand t croît de 0
à +, on est à l'intérieur du disque D et décroît indéfiniment. Les spirales s'enroulent dans le sens
inverse au sens trigonométrique et s'enroulent autour de l'origine. Ci-dessous à droite, on a
seulement représenté les courbes intégrales intérieures à D.
h
b) Les courbes intégrales de (1) sont définies par l'angle 0 définissant la pente de la demi-droite.
Elles sont paramétrées par exemple par u R (x, y) = (cos(0)e–u, sin(0)e–u).
Les courbes intégrales de (2) sont données par le paramètre 0 intervenant dans la définition de
1
= 0 – ln ln(r) avec r = e–t, t ]0, +[. Convenons qu'il s'agisse du même 0 et prenons t = eu,
2
de façon que, lorsque u décrit R, t décrit ]0, +[. Définissons h de façon que :
h((cos(0)e–u, sin(0)e–u) = (cos()e–t, sin()e–t) = (X, Y)
Quand (x(u), y(u)) décrit une courbe intégrale de (1), (X(t), Y(t)) décrit une courbe intégrale de (2).
On a :
- 83 -
1
r = e–t = exp(– eu) = exp(– 2 2
) = X2 + Y2
x +y
1
t = ln(r) =
x + y2
2
x
cos(0) = xeu = tx =
x + y2
2
y
sin(0) = yeu = ty = 2
x + y2
1 ln(x2 + y2)
= 0 + ln( x2 + y2) = 0 +
2 4
2 2
ln(x + y ) ln(x2 + y2)
cos() = cos(0) cos( ) – sin(0) sin( )
4 4
x ln(x2 + y2) y ln(x2 + y2)
= 2 cos( ) – sin( )
x + y2 4 x2 + y2 4
ln(x2 + y2) ln(x2 + y2)
sin() = sin(0) cos( ) + cos(0) sin( )
4 4
y ln(x2 + y2) x ln(x2 + y2)
= 2 cos( ) + sin( ))
x + y2 4 x2 + y2 4
Finalement (X, Y) = h(x, y) avec :
ln(x2 + y2) ln(x2 + y2)
X = exp(–
1
) (
x
cos( ) –
y
sin( ))
x2
+ y2
x2
+ y 2 4 x2
+ y2 4
Y = exp(– 21 2) ( 2y 2 cos(ln(x + y )) + 2x 2 sin(ln(x + y )))
2 2 2 2
x +y x +y 4 x +y 4
1
Réciproquement, on peut calculer h–1 comme suit. On a exp(– 2 2
) = X2 + Y2, donc :
x +y
2 2 2 2
X2X+ Y2 = x2x+ y2 cos(ln(x 4+ y )) – x2y+ y2 sin(ln(x 4+ y ))
2Y 2 = 2y 2 cos(ln(x + y )) + 2x 2 sin(ln(x + y ))
2 2 2 2
X +Y x +y 4 x +y 4
2 2 2 2
x2x+ y2 = X2X+ Y2 cos(ln(x 4+ y )) + X2Y+ Y2 sin(ln(x 4+ y ))
2y 2 = 2Y 2 cos(ln(x + y )) – 2X 2 sin(ln(x + y ))
2 2 2 2
x +y X +Y 4 X +Y 4
1
et comme 2 2
= – ln( X2 + Y2) = ln( X2 + Y2) , on a :
x +y
ln(x + y2)
2
1
= – ln ln( X2 + Y2)
4 2
et donc :
x2x+ y2 = X2X+ Y2 cos(12 ln ln( X2 + Y2) ) – X2Y+ Y2 sin(12 ln ln( X2 + Y2) )
2y 2 = 2Y 2 cos(1 ln ln( X2 + Y2) ) + 2X 2 sin(1 ln ln( X2 + Y2) )
x +y X +Y 2 X +Y 2
et enfin :
- 84 -
ln(
1 1 1
x= (Xcos( ln ln( X2 + Y2) ) – Ysin( ln ln( X2 + Y2) ))
2 2
X2 + Y2) X2 + Y2
y = ln( 1 1 1
(Ycos( ln ln( X2 + Y2) ) + Xsin( ln ln( X2 + Y2) ))
X2 + Y2) X2 + Y2
2 2
z
= xy2z
f
y2z2
= x2 + + 2xy – (x)
x 2
f
= x2 + xyz2
y
f
z
= xy2z
- 85 -
xy2z2
On résout par exemple de la façon suivante. La dernière équation a pour solution f = + g(x, y),
2
g
avec g C1 quelconque, qu'on reporte dans la deuxième équation, ce qui conduit à = x2, donc
y
g(x, y) = x2y + h(x) avec h C1 quelconque. Donc les solutions des deux dernières équations sont f =
xy2z2
x2y + + h(x), qu'on reporte dans la première équation, ce qui conduit à h'(x) = x2 – (x), donc
2
x3
h(x) = – (x) dx, et finalement :
3
x3 xy2z2
+ x2y – (x) dx
f= +
3 2
- 86 -
f 1 f
(x, y, z) = 1 – donc (2, – e, e) 0
z z z
donc, au voisinage de (2, – e, e), on peut exprimer z comme fonction de (x, y).
b) Dans ce voisinage, on a :
f
= – x = – 1 = z (x, y)
ou, mieux, (x, y) =
x f 1–
1 1–z x 1 – (x, y)
z z
Sol.14) a) 0 n'est pas fermée car la fonction (xy + 1 – y2) = x – 2y n'est égale à la fonction
y
(– xy) = – y sur aucun ouvert de R2. A fortiori, elle n'est pas exacte.
x
x(xy + 1 – y2) x2y
= g0 = dx – dy est une forme fermée car :
1 + xy 1 + xy
x(xy + 1 – y2) = – xy(2 + xy) = (– x2y )
y 1 + xy (1 + xy)2 x 1 + xy
De plus, chacun des ouverts suivants est étoilé :
1
U1 = {(x, y), x < 0 et xy + 1 < 0} = {(x, y), x < 0 et y > – }
x
1
U2 = {(x, y), x > 0 et xy + 1 < 0} = {(x, y), x > 0 et y < – }
x
1 1
U3 = {(x, y), xy + 1 > 0} = {(x, y), (x > 0 et y > – ) ou (x = 0) ou (x < 0 et y < – )}
x x
1 1
U1 est convexe comme étant un domaine de la forme y > – avec – fonction convexe (revoir au
x x
besoin le chapitre L1/DERIVEE.PDF).
U2 est convexe car symétrique de U1 par la symétrie centrale de centre l'origine.
U3 est étoilé de pôle l'origine O. En effet, si M = (x, y) est élément de U3 et si t est élément de [0, 1],
alors t [0, 1] (tx)(ty) + 1 est une fonction monotone variant de 1 à xy + 1 > 0, donc elle est
constamment strictement positive, de sorte que [OM] est inclus dans U3.
Sur chacun de ces ouverts étoilés, est une forme fermée, donc exacte. On peut en trouver des
primitives f. f satisfait :
- 87 -
f x(xy + 1 – y )
x
2
=
1 + xy
f = – x y = – x + x
2
y 1 + xy 1 + xy
La deuxième équation donne f(x, y) = – xy + ln( 1 + xy ) + (x), étant une fonction C1 quelconque.
Reportant dans la première équation, on obtient :
y x(xy + 1 – y2)
–y+ + '(x) =
1 + xy 1 + xy
2
x
donc '(x) = x et (x) = + Cte.
2
x2
Donc f(x, y) = – xy + ln( 1 + xy ) + Cte
2
x2
Les courbes intégrales ont pour équation implicite – xy + ln( 1 + xy ) = , R.
2
b) On trouvera par exemple comme facteur intégrant g(x) = 2e–2x. Une primitive de g0 est
f(x, y) = – e–2x y2 – 2e–x. Les courbes intégrales vérifient l'équation e–2x y2 + 2e–x = , R.
- 88 -
2x 1 – x2
On est plus judicieux de remarquer que = dx + 2 dy est une forme fermée sur l'ouvert
y y
étoilé {(x, y), y > 0}, donc est une forme exacte. Comme on l'intégre sur une courbe qui se referme,
l'intégrale est nulle.
On peut retrouver les résultats du premier calcul à partir d'une primitive f de , par exemple
x2 – 1
f(x, y) = . On a alors :
y
= f(A) – f(C) = – 1 + 1 = – 1
2 2
CA
= f(B) – f(A) = 0 + 1 = 1
AB
= f(C) – f(B) = – 1
2
BC
b) Comme on intègre une forme différentielle exacte sur un chemin qui se referme,
= 0.
c) Pour le segment latéral de droite, par exemple :
a a a
exp(– R2 + y2)sin(2Ry) dy exp(– R2 + y2) dy = exp(– R2) exp(y2) dy
0 0 0
qui tend vers 0 quand R tend vers l'infini. On procède de même pour le segment latéral de gauche.
d) On a vu que = 0. En découpant l'intégrale selon les quatre segments qui constituent , on
obtient :
R a
R, exp(– x2
)dx + exp(– R2 + y2)sin(2Ry) dy
–R 0
–R 0
+ 2 2 2 2
exp(– x + a )cos(2xa) dx + exp(– R + y )sin(– 2Ry) dy = 0
R a
On passe à la limite quand R tend vers l'infini en utilisant le fait que, d'après c), les deux intégrales
a 0
et tendent vers 0, ce qui donne :
0 a
–
exp(– x2)dx + exp(– x2 + a2)cos(2xa) dx = 0
–
ou encore :
–
exp(– x2)dx = exp(– x2 + a2)cos(2xa) dx
–
Mais :
- 89 -
exp(– (x + ia)2) dx = exp(– x2 + a2 – 2iax) dx
– –
= 2 2
exp(– x + a )cos(2xa) dx
–
puisque la partie imaginaire de l'intégrale est nulle (à cause de l'imparité de la fonction à intégrer).
Donc, pour tout a :
exp(– (x + ia)2) dx = exp(– x2)dx
– –
e) On aurait pu considérer la fonction a F(a) = 2
exp(– (x + ia) ) dx. On a alors :
–
F'(a) = 2 2
– 2i(x + ia) exp(– (x + ia) ) dx = [i exp(– (x + ia) )]– = 0
–
Pour dériver l'intégrale dépendant du paramètre a, il suffit de vérifier l'hypothèse de domination
pour justifier la dérivation sous le signe intégral (voir le chapitre L2/SUITESF.PDF). On se place
sur un intervalle ]–A, A[ contenant le réel en lequel on veut effectuer la dérivation. Pour tout a dans
]–A, A[ et tout x réel, on a :
– 2i(x + ia) exp(– (x + ia)2) 2 x2 + a2 exp(– x2 + a2) 2 x2 + A2 exp(– x2 + A2)
Le majorant est une fonction intégrable sur R, permettant de satisfaire l'hypothèse de domination.
Dans le chapitre L2/INTMULT.PDF, on montre que 2
. On a donc montré dans
exp(– x ) dx =
–
cet exercice que, pour tout a :
exp(– (x + ia)2) dx =
–
2x + 2iy
Sol.17) a) = Re ( x+iy (dx + idy))
e –1
(2x + 2iy)(ex–iy – 1)
= Re ( x+iy (dx + idy))
(e – 1)(ex–iy – 1)
(2x + 2iy)(excos(y) – 1 – iexsin(y))
= Re ( (dx + idy))
e2x – 2excos(y) + 1
2x(excos(y) – 1) + 2yexsin(y) + i(2y(excos(y) – 1) – 2xexsin(y))
= Re ( (dx + idy))
e2x – 2excos(y) + 1
2x(excos(y) – 1) + 2yexsin(y) 2y(excos(y) – 1) – 2xexsin(y)
= 2x x dx – dy
e – 2e cos(y) + 1 e2x – 2excos(y) + 1
2x(cos(y) – e–x) + 2ysin(y) 2y(cos(y) – e–x) – 2xsin(y)
= dx – dy
ex – 2cos(y) + e–x ex – 2cos(y) + e–x
x(cos(y) – e–x) + ysin(y) y(cos(y) – e–x) – xsin(y)
= dx – dy
ch(x) – cos(y) ch(x) – cos(y)
b) Vérification dont la seule difficulté est due aux calculs assez fastidieux... Une vérification directe
2z
du caractère fermé de en utilisant la fonction complexe z repose sur la notion de fonction
e –1
holomorphe. Voir conditions de Cauchy dans le chapitre L3/HOLOMRPH.PDF.
- 90 -
c) Effectuons un développement limité à l'ordre 2 au voisinage de (0, 0). Posons r2 = x2 + y2 et
remarquons que o(x2) = o(r2), xo(y) = o(r2), etc... :
x(cos(y) – e–x) + ysin(y) x(1 – o(y) – 1 + x + o(x)) + y2 + o(y2)
=
ch(x) – cos(y) x2 y2
1 + + o(x2) – 1 + + o(y2)
2 2
2 2 2
x + y + o(r )
= 2
x + y2
+ o(r2)
2
r2 + o(r2)
= 2 2 quand (x, y) tend vers (0, 0)
r
+ o(r2)
2
y(cos(y) – e–x) – xsin(y)
On vérifiera de même que tend vers 0 quand (x, y) tend vers (0, 0).
ch(x) – cos(y)
2z
On peut aussi utiliser la forme complexe de = Re ( z dz) qui tend vers Re(2dz) = 2dx quand z
e –1
tend vers 0.
d) Vérifions que est incluse dans un ouvert étoilé sur lequel est défini. Etant fermée sur un
ouvert étoilé, sera alors une forme exacte, et se refermant, on aura = 0.
est défini en tout (x, y) tel que ch(x) cos(y). Or ch(x) 1 cos(y), donc ch(x) cos(y) si et
seulement si (x, y) est différent des couples (0, 2k), k Z. L'ouvert étoilé peut être par exemple le
3
suivant (qui est convexe) : {(x, y) | y > x, y < }.
2
e) Quand a tend vers 0 et b tend vers +, tend vers :
AB
x (1 – e–x) x e–x/2 sh(x/2) x e–x/2
dx = dx =
ch(x) – 1 sh2(x/2) sh(x/2) dx
0 0 0
2x
= ex – 1 dx
0
tend vers 0, car [BC] étant paramétré par y [0, ] (b, y), on a :
BC
–b
= – y(cos(y) – e ) – bsin(y) dy
ch(b) – cos(y)
BC 0
y(cos(y) – e–b) – bsin(y)
– dy
ch(b) – cos(y)
0
2 + b
2 + b
ch(b) – 1 dy = ch(b) – 1 qui tend vers 0 quand b tend vers +.
0
tend vers :
CD
- 91 -
–x –x/2 –x/2
x (1 + e ) dx = x e 2 ch(x/2) dx = x e
ch(x) + 1 ch (x/2) ch(x/2) dx
0 0 0
2x
=
ex + 1 dx
0
y dy = – .
y(cos(y) – 1) 2
tend vers dy = –
0 – cos(y)
2
DE 0
tend vers 0, car les composantes de selon dx et dy sont bornées au voisinage de (0, 0)
EA
d'après c), et que la longueur du chemin EA tend vers 0 quand a tend vers 0. Plus précisément, si M
est une borne des composantes de et si on paramétrise EA par (acos(), asin()),
décroissant de à 0, on a dx = – asin() et dy = acos(), et :
2
M asin() + Macos() d = O(a) de limite nulle
EA 0
Comme 0 =
= + + + + , le passage à la limite dans cette égalité
AB BC CD DE EA
donne :
2x 2x 2
0= dx + dx –
ex – 1 ex + 1 2
0 0
Donc :
2 2x 2x 4x ex x
= x dx + dx = dx = 2
2 e –1 e +1
x e –1
2x sh(x) dx
0 0 0 0
x 2
donc sh(x) dx = 4
0
y(cos(y) – e–x) – xsin(y) x(cos(y) – e–x) + ysin(y)
f) prend maintenant la valeur dx + dy
ch(x) – cos(y) ch(x) – cos(y)
On vérifiera que est fermée et que ses composantes tendent respectivement vers 0 et 2. On prend
le même domaine étoilé contenant et sur lequel est exacte. On a encore :
0=
= + + + + ,
AB BC CD DE EA
avec, quand a tend vers 0 et b vers + :
=0
AB
tend vers 0
BC
–x e–x/2
tend vers (1 + e ) dx =
dx = 2 xdx
ch(x) + 1 ch(x/2) e +1
CD 0 0 0
- 92 -
= 2
du
en posant u = ex
u(1 + u)
1
1
= 2
1
u – 1 + u du = 2 ln(2)
1
/2
tend vers – ysin(y)
dy = –
y
dy = – 4 t
dt
– cos(y) tan(y/2) tan(t)
DE 0 0 0
tend vers 0
EA
/2
Donc
t
tan(t) dt = 2 ln(2)
0
z
Une variante de cet exercice, utilisant directement la fonction à valeurs complexes , est
ez – 1
proposée dans les exercices de L3/HOLOMRPH.PDF.
n n
=1+ Ckihki + o(H)
i=1 k=1
en développant det(m1, ..., mi–1, hi, mi+1, ..., mn) par rapport à
sa i-ème colonne hi.
n
= 1 + (Com(M) H)ii + o(H)
T
i=1
T
= 1 + Tr(Com(M) H) + o(H)
raisonnement qu'on aurait pu tenir dès le début.
- 94 -