Thème 1 : Probabilités Statistique pour ingénieur
Statistique pour ingénieur
Thème 1 : Exercices de probabilités
D. Pastor, F.-X. Socheleau & C. Garnier, 31 janvier 2017
Exercice 1 : Spams
Dans une entreprise, 40% des courriers électroniques reçus sont des spams. Parmi tous
les spams reçus, 50% contiennent le mot «order» et, parmi tous les courriels légimites,
30% contiennent le mot «order».
1. Quelle est la probabilité qu’un mail arrivant contienne le mot «order» ?
2. Un mail arrivant contient le mot «order», quelle est la probabilité que ce soit un spam ?
Solution :
Introduisons les notations suivantes :
S = {le mail arrivant est un spam}
M = {le mail arrivant contient le mot «order»}
On a, d’après les données, P (S) = 0,4, P (M |S) = 0,5 et P M |S = 0,3. Alors,
d’après la formule des probabilités totales avec la partition Ω = S ∪ S, la proba-
bilité que le mail arrivant contienne le mot «order» est
P (M ) = P (M |S) P (S) + P M |S P S = 0,5 × 0,4 + 0,3 × 0,6 = 0,38.
Si le mail contient le mot «order», la formule de Bayes avec la même partition
donne la probabilité qu’il s’agisse d’un spam :
P (M |S) P (S) 0,5 × 0,4
P (S|M ) = = ' 0,53.
P (M ) 0,38
Exercice 2 : Durée de vie
La durée de vie d’un certain type de lampes de vidéoprojecteur suit une loi exponen-
tielle de densité de probabilité
(
λe−λx x > 0
fX (x) = (1)
0 sinon.
1. Une variable aléatoire X est dite « sans mémoire », ou « sans vieillissement », si elle
vérifie la propriété suivante :
P (X > x + x0 |X > x0 ) = P (X > x) , (2)
pour tout x, x0 positifs.
Montrer que la durée de vie de ces lampes de vidéoprojecteur est sans mémoire.
Institut Mines-Télécom 1
Statistique pour ingénieur Thème 1 : Probabilités
2. Déterminer la durée de vie moyenne d’une lampe en fonction de λ ?
3. Un fabriquant de lampes annonce à son client que la durée de vie moyenne des lampes
qu’il produit est d’au moins 10000 heures alors que, dans les faits, une lampe sur deux a
une durée de vie de moins de 7000 heures. Est-il honnête ? Justifier.
Solution :
1) D’après la formule de Bayes, on a :
P (X > x0 |X > x + x0 ) P (X > x + x0 ) P (X > x + x0 )
P (X > x + x0 |X > x0 ) = = .
P (X > x0 ) P (X > x0 )
Pour la loi exponentielle, on obtient donc :
e−λ(x+x0 )
P (X > x + x0 |X > x0 ) = = e−λx = P (X > x) .
e−λx0
2)
Z
E (X) = xλe−λx dx
R+ Z
h i+∞
= −xe−λx + e−λx dx
0 R+
1
=
λ
3) On déduit de l’énoncé que P (X < 7000) = 12 . Avec cette information et à l’aide
de la réponse à la question (2), il faut ensuite vérifier si l’assertion "la durée de
vie moyenne des lampes est d’au moins 10000 heures" est vraie ou fausse. Par
définition P (X < 7000) = FX (7000) = 12 , alors
1 ln(2)
1 − e−λ7000 = ⇒λ= .
2 7000
1 7000
Or λ = E(X) , on en déduit que E (X) = ln(2)
≈ 10098. Le constructeur est donc
honnête.
Exercice 3 : Consommation énergétique
Pour effectuer un comparatif entre deux modèles de smartphones, une association de
consommateurs s’intéresse à leurs consommation électriques respectives. Pour cette étude,
elle dispose de données constructeur qui fournissent des informations sur la variabilité de
consommation en fonction de l’usage qui est fait du téléphone.
Pour le modèle 1, le fabricant indique que sa consommation est une variable aléatoire
X1 de fonction de répartition FX1 et de densité fX1 . Pour le modèle 2, la consommation est
une variable aléatoire X2 de fonction de répartition FX2 et de densité fX2 . On suppose que
les consommations des deux modèles sont indépendantes. L’association de consommateur
ne dispose que d’un exemplaire de chaque modèle.
1. Pour un même usage, exprimer la probabilité que l’exemplaire du modèle 1 consomme
plus que l’exemplaire du modèle 2 à l’aide de FX1 et de fX2 .
2 Institut Mines-Télécom
Thème 1 : Probabilités Statistique pour ingénieur
2. Dans le cas où FX1 = FX2 , quelle est la valeur de cette probabilité ?
Solution :
1)
ZZ
P (X1 ≥ X2 ) = fX1 (x1 )fX2 (x2 )dx1 dx2 (v.a. indépendantes)
{x1 ≥x2 }
Z +∞ Z +∞
= fX1 (x1 )dx1 fX2 (x2 )dx2
−∞ x2
Z +∞
= 1− FX1 (x2 )fX2 (x2 )dx2
−∞
2) Si FX1 = FX2 , on a :
Z +∞
P (X1 ≥ X2 ) = 1 − FX2 (x2 )fX2 (x2 )dx2
−∞
On pose u = FX2 (x2 ) ⇒ du = fX2 (x2 )dx2 , alors
Z 1
1
P (X1 ≥ X2 ) = 1 − udu =
0 2
Exercice 4 : Transformation linéaire d’un vecteur gaussien
Soit X = (X1 ,X2 )T , un vecteur aléatoire 1 réel centré, à deux dimensions, de loi gaus-
sienne et de matrice de covariance
√ !
3 ρ 3
ΓX = √ ,
ρ 3 1
avec |ρ| < 1. On définit un nouveau vecteur aléatoire (Y1 ,Y2 )T avec :
X1
Y1 = √
3
− X2 ,
X1
Y2 = √
3
+ X2 .
1. Calculer la variance V (X1 ) de X1 et la covariance Cov (X1 ,X2 ) de (X1 ,X2 ) ?
2. Dans quel cas, les deux variables X1 et X2 sont-elles indépendantes ?
3. Calculer la covariance Cov (Y1 ,Y2 ) du couple (Y1 ,Y2 ). Calculer les variances des variables
aléatoires Y1 et Y2 .
4. Déterminer les densités de probabilités marginales de Y1 et Y2 .
5. Les deux variables Y1 et Y2 sont-elles indépendantes ? Justifier clairement votre réponse.
1. Reportez-vous à la vidéo 2 du thème 1 de ce MOOC pour la représentation d’un couple de variables
aléatoires sous forme vectorielle.
Institut Mines-Télécom 3
Statistique pour ingénieur Thème 1 : Probabilités
Solution :
1) Il suffit de lire la matrice de covariance. On √ a alors V (X1 ) = 3 et
Cov (X1 ,X2 ) = E ((X1 − E (X1 ))(X2 − E (X2 )) = ρ 3.
2) X1 ,X2 indépendantes si et seulement si Cov (X1 ,X2 ) = 0 car le vecteur X
est gaussien. Il y a donc indépendance si et seulement si ρ = 0 (coefficient de
corrélation).
3) E (Y1 ) = E (Y2 ) = 0. On calcule maintenant :
Cov (Y1 ,Y2 ) = E (Y1 Y2 )
! !!
X1 X1
= E √ − X2 √ + X2
3 3
1 1 1
= E X12 + √ E (X1 X2 ) − √ E (X1 X2 ) − E X22
3 3 3
1
= E X12 − E X22 = 1 − 1 = 0
3
On calcule maintenant les variances de Y1 et de Y2 . On obtient :
!2
X1
V (Y1 ) = E Y12 = E √ − X2
3
!
X12 2
= E + X22 − √ X1 X2
3 3
2 √
= 1 + 1 − √ ρ 3 = 2(1 − ρ)
3
et
!2
X1
V (Y2 ) = E Y22 = E √ + X2
3
!
X12 2
= E + X22 + √ X1 X2
3 3
2 √
= 1 + 1 + √ ρ 3 = 2(1 + ρ)
3
4) Le vecteur aléatoire Y est obtenu par transformation linéaire du vecteur
aléatoire gaussien X. Le vecteur aléatoire Y est donc lui-même gaussien. Par
conséquent, ses composantes sont gaussiennes et Y1 ∼ N (0,2(1 − ρ)) et Y2 ∼
N (0,2(1 + ρ)).
5) L’indépendance des composantes de Y équivaut à la décorrélation de celles-ci.
Comme Cov (Y1 ,Y2 ) = 0, la matrice de covariance de Y est diagonale. Il s’ensuit
que ses composantes Y1 et Y2 sont décorrélées et donc indépendantes.
Exercice 5 : Application non probabiliste du théorème central-limite
On considère une suite (Xn )n∈N∗ de variables aléatoires indépendantes, qui suivent
des lois de Poisson de paramètre unité : pour tout n = 1,2, . . ., Xn ∼ P(1). On pose
Sn = X1 + X2 + . . . + Xn .
4 Institut Mines-Télécom
Thème 1 : Probabilités Statistique pour ingénieur
Pour l’exercice, on admettra que la somme de deux variables aléatoires de Poisson
indépendantes X1 et X2 , telles que X1 ∼ P(λ1 ) et X2 ∼ P(λ2 ) suit une loi de Poisson :
X1 + X2 ∼ P(λ1 + λ2 ).
1. Quelle est la loi de Sn ? Soit Fn la fonction de répartition de la variable aléatoire Sn .
k
Montrer que Fn (n) = e−n nk=0 nk! .
P
n −n
2. Montrer que Zn = S√ n
converge en loi vers la loi normale centrée réduite.
n
nk
3. Déduire des questions précédentes que lim e−n
X
= 1/2.
k=0 k!
n→+∞
Solution :
1) Une récurrence immédiate du résultat sur la somme de variables aléatoires
de Poisson montre que Sn ∼ P(n). Par définition de la fonction de répartition,
on a Fn (n) = P (Sn 6 n). Donc, Fn (n) = nk=0 P (Sn = k). Puisque Sn ∼ P(n),
P
k
P (Sn = k) = nk! e−n , d’où le résultat.
2) Les variables aléatoires X1 ,...,Xn sont identiquement distribuées et indépen-
dantes. D’après le théorème de théorème central-limite, Sn√−nm nσ
converge en loi
2
vers N (0,1) avec m = E (Xi ) et σ = V (Xi ). Comme X1 ∼ P(1), on a
n −n
E (X1 ) = V (X1 ) = 1. On en déduit donc que Zn = S√ n
converge en loi vers
N (0,1). o
3) On a {Zn > 0 = {Sn > n}. Donc P (Zn > 0) = P (Sn > n). Comme Zn
converge en loi vers N (0,1), limn→∞ P (Zn > 0) = P (U > 0) avec U ∼ N (0,1)
car 0 est un point de continuité de la fonction de répartition de la loi N (0,1). Or
P (U > 0) = 1/2, ce qui permet de conclure.
Institut Mines-Télécom 5