INTRODUCTION A LA
STATISTIQUE ET
MODELISATION DES
PHENOMENES BIOCLINIQUES
Dr AKA Joseph
Maître de Conférences Agrégé
Département de Santé Publique et Spécialités
Unité Pédagogie et Recherche en Santé publique, Biostatistique et Informatique médicale
Laboratoire de Biostatistique, Méthode et Informatique médicale
UFR SMA /UFHB
1
OBJECTIFS
•Différencier les statistiques de la statistique
•Définir le but de la statistique
•Expliquer les fondements de la statistique
•Définir un phénomène déterministe et
un phénomène stochastique
• Citer les applications de la statistique en santé
2
PLAN
INTRODUCTION
I. HISTOIRE DE LA STATISTIQUE
II. STATISTIQUES ET STATISTIQUE
III. FONDEMENTS DE LA STATISTIQUE
IV. MODELISATION DES PHENOMENES
V. APPLICATIONS EN SANTE
CONCLUSION
3
INTRODUCTION
1. La statistique = science ou discipline
(dynamique) qui collecte des données
provenant de groupes d’individus et dont
l’objet est d’obtenir une meilleure
compréhension d’un phénomène observé
2. L’enseignement de la statistique donne les
bases nécessaires à la compréhension des
méthodes statistiques destinées à la
recherche (bioclinique)
3. La statistique est très ancienne et remonte au
18ème siècle
4
I - HISTOIRE DE LA STATISTIQUE (1/3)
• Dénombrement de populations humaines pour
les besoins de guerre et d’impôt
• Véritable début : 18ème siècle
- Arithmétique politique : Connaissance d’un Etat
- Première classification des causes de décès (John
Graunt : % d’enfants nés vivants et morts avant 6 ans)
- Calcul de probabilités (Blaise Pascal, Abraham de
Moivre, Jacques Bernoulli, Pierre-Siméon Laplace,
Carl Freidrich Gauss, Siméon-Dénis Poisson)
• 19ème siècle :
− 1853 : 1er Congrès de Statistiques mathématiques
modernes (Adolphe Quetelet, Charles Babbage)
5
I - HISTOIRE DE LA STATISTIQUE (2/3)
• Première moitié du 20ème siècle :
− Biométrie et Psychométrie
− 1920 : Plans expérimentaux (Ronald Aylmer Fisher)
− 1930 : Econométrie, Contrôle qualité industriel
− 1940 : Recherche opérationnelle
• Deuxième moitié du 20ème siècle :
− Développement de l’informatique
− Test de rang, test exact
− Analyse multivariée ou multidimensionnelle
− Méthodes bayesiennes
− Analyse de données
6
I - HISTOIRE DE LA STATISTIQUE (3/3)
• 21ème siècle :
Consacré aux applicatifs de la statistique
7
II - STATISTIQUES ET STATISTIQUE (1/3)
1. LES STATISTIQUES : Latin « Status » = Etat
• Proviennent d’un ensemble cohérent de données
relatives à un groupe d’individus
• Sont les résultats de dénombrement obtenus à
partir des données de routine (Registres, etc.)
• Exemples :
• Statistiques démographiques
• Statistiques annuelles des Etablissements Sanitaires
• Statistiques de santé
• Statistiques de chômage
• Rôle de l’INS ++++
8
II - STATISTIQUES ET STATISTIQUE (2/3)
2. LA STATISTIQUE :
• Ensemble de méthodes permettant de collecter, d’analyser
et d’interpréter des données
• Fait appel au raisonnement et aux probabilités
• Permet l’étude des phénomènes ++++
• Subdivisée en 3 méthodes statistiques de base :
• La statistique descriptive
• Le calcul de probabilité
• La statistique inductive (inférentielle)
9
II - STATISTIQUES ET STATISTIQUE (3/3)
3. BUT DE LA STATISTIQUE :
• Etudier un certain nombre d’objets de
même nature, présentant au moins une
caractéristique commune variable
susceptible d’être mesurée ou classée
10
III - FONDEMENTS DE LA STATISTQUE (1/5)
• La statistique s’est construite sur la base de
03 fondements :
− La variabilité
− L’incertitude
− La démarche statistique ou la méthode
11
III - FONDEMENTS DE LA STATISTQUE (2/5)
1. LA VARIABILITE
• Quantitative ou qualitative
• Intra-individu et inter-individu
• Nombreux exemples :
− L’oranger et ses oranges (nombre de pépins, quantité de jus, goût)
− Les individus dans la population (Poids, Taille, Comportements …)
− Les paramètres biologiques (PA, Glycémie, Hormones …)
− Les déterminants d’une maladie (Causes, facteurs …)
− Le temps d’incubation d’une maladie
12
III - FONDEMENTS DE LA STATISTQUE (3/5)
1. LA VARIABILITE
• Indépendante de l’erreur de mesure (notion de physique)
• Part du hasard (Aléa)
• = Fluctuation biologique + Fluctuation d’échantillonnage
• Exemple sur la « Fluctuation biologique » : PA moyenne
• Exemple sur la « Fluctuation d’échantillonnage » :
Population N = 1 000 000 hbts où sévie maladie à p = 20%.
On décide de tirer 30 échantillons aléatoires de taille n = 20.
Quelle est la fréquence de la maladie obtenue sur ces
échantillons formés?
Cette variabilité nous met dans l’incertitude de prédire une valeur
observée du caractère étudié tant que nous ne l’avons pas
expérimenté le terme de «variable aléatoire» utilisé en
statistique
13
III - FONDEMENTS DE LA STATISTQUE (4/5)
2. L’INCERTITUDE
• N’est pas la loi du « tout ou rien » comme en physique
• Présente des degrés (0-100%) qui lui confère la notion
de risque, de probabilité
• Risque fixé à 5% max Risque de se tromper
• Décision (estimation) toujours entachée d’erreur
Au total, Variabilité et IncertitudeNotion d’encadrement
de toute décision (estimation) prise par la mise en place
d’un intervalle de confiance au seuil fixé
14
III - FONDEMENTS DE LA STATISTQUE (5/5)
3. LA DEMARCHE STATISTIQUE OU LA METHODE
• Objet : minimiser la variabilité +++ par :
− La conception du projet
− La collecte des données
− L’apurement
− L’analyse statistique
− La modélisation
15
IV - MODELISATION DES PHENOMENES (1/4)
1. QUELQUES DEFINITIONS
• Modèle : ce qui sert de référence pour être reproduit
(lois de probabilité, modèles mathématiques, etc.)
• Modélisation : mise en équation d’un phénomène
complexe ou simple permettant de prévenir son
évolution (modélisations mathématiques,
informatiques, industrielles, météorologiques, etc.)
• Phénomène : fait/observation/évènement qui frappe
par son caractère exceptionnel
16
IV - MODELISATION DES PHENOMENES (2/4)
1. QUELQUES DEFINITIONS
• Essai/Epreuve : processus de jeu, qui lorsqu’il est
répété, génère un ensemble de résultats ou
observations
• Observation : résultat d’un essai lorsqu’il est
expérimenté ou réalisé
• Evènement : observation attendue. Les évènements
constituent l’ensemble des observations disponibles
au cours d’un essai/épreuve
17
IV - MODELISATION DES PHENOMENES (3/4)
2. ETUDE DES PHENOMENES
• Basée sur observations obtenues qui vont être
analysées en faisant appel à différentes méthodes
dans le but d’obtenir une description aussi juste
que possible du phénomène
• La répétition des observations issues du
phénomène dans le temps et dans l’espace
permettra d’approcher le problème réel grâce à
la modélisation (ex : prévision du temps)
18
IV - MODELISATION DES PHENOMENES (4/4)
2. ETUDE DES PHENOMENES
On distingue 02 types de phénomènes : déterministe et
stochastique)
• Phénomènes (modèles) déterministes que l’on
décrit à l’aide d’une loi mathématique et dont
l’évolution est prévisible (exemple de la physique)
• Phénomènes (modèles) stochastiques/aléatoires
que l’on décrit à l’aide d’une loi mathématique et dont
l’évolution est imprévisible (exemple de la bioclinique)
19
V - APPLICATIONS A LA SANTE
Nombreux domaines d’application :
• Epidémiologie, Médecine, Biologie
• Socio-anthropologie
• Administration, Gestion, Collectivité
• Environnement
• Politique
• Etc.
20
CONCLUSION (1/2)
• La statistique = outil ou instrument
incontournable à notre pratique quotidienne
• Sa bonne utilisation nécessite l’enseignement
des 03 méthodes statistiques (statistique
descriptive, calcul de probabilités, statistique
inductive)
21
CONCLUSION (2/2)
•Ces méthodes générales, utilisées dans un
contexte bioclinique et épidémiologique,
nécessitent la mise en place d’organisation
expérimentale rigoureuse afin d’éviter de
nombreux biais pouvant altérer les
estimations, de même que les tests
statistiques et par conséquent l’interprétation
de ces tests
22
MERCI POUR VOTRE
ATTENTION SOUTENUE
23