0% ont trouvé ce document utile (0 vote)
440 vues7 pages

Marquis Comparaison Methodes

Ce document compare deux méthodes analytiques en biologie clinique pour évaluer leur concordance. Il présente différentes méthodes pour comparer les résultats des méthodes, notamment des diagrammes de dispersion et des différences. Le critère le plus important est la commutabilité des méthodes, c'est-à-dire si les résultats restent dans la tolérance médicalement acceptable.

Transféré par

ELIASSE khadiri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
440 vues7 pages

Marquis Comparaison Methodes

Ce document compare deux méthodes analytiques en biologie clinique pour évaluer leur concordance. Il présente différentes méthodes pour comparer les résultats des méthodes, notamment des diagrammes de dispersion et des différences. Le critère le plus important est la commutabilité des méthodes, c'est-à-dire si les résultats restent dans la tolérance médicalement acceptable.

Transféré par

ELIASSE khadiri
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
Vous êtes sur la page 1/ 7

La comparaison des méthodes analytiques en

biologie clinique
Philippe Marquis, Service de biochimie
Centre hospitalier, Metz – France

On compare deux méthodes analytiques en biologie clinique pour évaluer leur concordance. Le
protocole expérimental est simple. Il faut d’abord rassembler des échantillons dont les
concentrations soient uniformément distribuées sur l’intervalle de mesure. Ces échantillons sont
ensuite fractionnés en deux parties afin de soumettre simultanément chaque échantillon aux deux
méthodes analytiques.
Le logiciel de contrôle de qualité MultiQC (www.multiqc.com) propose une méthode originale pour
l’analyse et la représentation des données. Il abandonne les tests statistiques au profit d’une
évaluation par rapport à l’erreur médicalement acceptable. Un diaporama de présentation (26
diapositives) est disponible sous deux formes :
• www.multiqc.com/MethCompDemo1.htm (Fichier Flash Shockwave)
• www.multiqc.com/MethCompDemo1.exe (Fichier exécutable indépendant)

1. Quand comparer ?
On est amené à comparer des méthodes analytiques chaque fois que l’on souhaite remplacer une
méthode usuelle par une nouvelle méthode. Le changement envisagé peut être :
• Définitif, si la nouvelle méthode possède des caractéristiques opérationnelles meilleures que
celles de l’ancienne.
• Temporaire, si la nouvelle méthode n’est qu’une méthode palliative destinée à remplacer la
méthode de routine en cas de panne d’un analyseur.
• Cyclique, si deux analyseurs dosent le même paramètre à des heures différentes du jour ou
de la nuit.
• Continu, si deux analyseurs en miroir dosent simultanément le même paramètre pour
accroître le débit analytique.
La comparaison de méthodes est classiquement recommandée à la mise en route de toute nouvelle
méthode analytique. En pratique, il est utile de répéter l’opération à intervalles réguliers pour
vérifier la concordance permanente entre deux analyseurs du même laboratoire ou de deux
laboratoires amenés à échanger leurs échantillons. La comparaison de méthodes devient ainsi une
partie intégrante du contrôle de qualité.

2. Critère de comparaison
Un changement de méthode analytique n’est possible que si les méthodes sont suffisamment
concordantes. On peut distinguer trois degrés de concordance : l’équivalence, la commutabilité et
l’incompatibilité.
• Deux méthodes sont équivalentes si elles donnent des résultats identiques à l’imprécision
analytique près. Elles peuvent être échangées sans perte d’exactitude.
• Deux méthodes sont commutables si elles donnent des résultats identiques à la tolérance
médicale près. Elles ne sont pas rigoureusement équivalentes mais peuvent être échangées
sans altération de la capacité diagnostique pour le patient.
• Deux méthodes sont incompatibles si elles produisent des résultats qui diffèrent plus que la
tolérance médicale autorisée pour le paramètre.

1
Les laboratoires de biologie clinique travaillent pour des malades. Un écart entre deux méthodes
analytiques est acceptable s’il ne modifie pas le diagnostic, le pronostic ou le suivi médical. Le
critère de comparaison, le plus économique, qui autorise l’échange de méthodes est donc la
commutabilité et non l’équivalence. L’erreur consécutive au changement n’est pas nulle mais reste
tolérable. On commet une erreur de non-equivalence qui s’ajoute à l’erreur analytique totale.

3. Comment comparer ?
Il existe deux méthodes graphiques pour comparer les concentrations des échantillons fractionnés :
• Le diagramme de dispersion : Les résultats de la nouvelle méthode sont reportés en
ordonnée et ceux de l’ancienne méthode en abscisse. Chaque échantillon est représenté par
un point. La relation mathématique entre les méthodes est estimée par la droite de
régression. On évalue la discordance entre les méthodes par l’écart entre la droite de
régression et la bissectrice des axes (la ligne d’identité).
• Le diagramme des différences : La différence des concentrations entre les deux fractions de
chaque échantillon est reportée en ordonnée. La moyenne des deux fractions est reportée en
abscisse. On évalue la discordance entre les méthodes par l’écart entre les points et
l’horizontale d’ordonnée nulle (ligne de différence nulle) .
160
2,0

Field - Ref (mmol/L)


Field method (mmol/L)

150
1,0

140
0,0

130
-1,0

120
-2,0

110
0

0
11

12

13

14

15

16

11

12

13

14

15

16
Ref method (mmol/L) Mean (mmol/L)

Comparaison des méthodes « Sodium » de deux automates en miroir.


Diagramme de dispersion à gauche et diagramme des différences à droite.

Les deux représentations graphiques ont chacune leurs avantages et leurs inconvénients. Elles
fournissent des informations complémentaires. Le CLSI (ancien NCCLS) a publié une directive
pour comparer les méthodes dans laquelle les deux diagrammes sont simultanément conseillés.

4. Polygone de tolérance
L’erreur médicalement acceptable est une donnée indispensable à l’exercice de la biologie clinique.
Sa connaissance est nécessaire à une gestion économique de la qualité. En termes d’ingénieur,
l’erreur médicalement acceptable s’appelle la tolérance autorisée sur le produit. Elle s’exprime soit
en valeur relative, soit en valeur absolue. Le plus souvent les deux sont associées. La tolérance
absolue s’applique alors aux basses concentrations tandis que la tolérance relative s’applique aux
concentrations plus élevées.
Le logiciel MultiQC maintient une liste des tolérances pour chacun des analytes qu’il contrôle. Il
permet de définir des schémas complexes de tolérance avec une erreur relative et/ou absolue
spécifique pour trois zones de concentration basse, moyenne et haute.

2
Le diagramme des différences
Pour chaque concentration en abscisse, la différence tolérable entre les méthodes est représentées
par un segment vertical centré sur l’horizontale d’ordonnée nulle. L’ensemble de ces segments
constitue un polygone symétrique par rapport à la ligne de différence nulle. Les bords supérieurs et
inférieurs du polygone sont parallèles pour une tolérance absolue. Ils divergent vers la droite pour
une tolérance relative.

6,0
Field - Ref (mmol/L)

Polygone de tolérance
5,0
Régression des
4,0 différences sur les
moyennes
3,0
Point hors tolérance
2,0
Points dans la tolérance
1,0
Tolérance ± 3 mmol/l
0,0
Tolérance ± 5 mmol/l
-1,0

-2,0

-3,0
Erreur totale
Concentrations
-4,0 autorisée
< 130 mmol/l 5 mmol/l
-5,0
130 to 150 mmol/l 3 mmol/l
-6,0
> 150 mmol/l 5 mmol/l
0

0
11

12

13

14

15

Mean (mmol/L)

Diagramme des différences: Comparaison des méthodes « Sodium » de


deux automates en miroir.

L’interprétation du diagramme des différences est


immédiate : Tout point intérieur au polygone satisfait
Field method (mmol/L)

160
à la tolérance. Tout point extérieur traduit la non-
commutabilité des deux méthodes pour l’échantillon 150
considéré. Le verdict final dépend du pourcentage de
points non-commutables comptés sur la totalité du 140

graphique.
130

Diagramme de dispersion 120


La construction du polygone de tolérance sur un
diagramme de dispersion est moins simple. Son rôle 110

est de délimiter les déviations acceptables de la droite


0

de régression par rapport à la droite d’identité.


11

12

13

14

15

16

Ref method (mmol/L)

Nous supposerons que les paramètres de la droite de


Diagramme de dispersion: Comparaison
régression (pente et ordonnée à l’origine) ont été des méthodes « sodium » de deux
estimés sur un échantillon d’effectif suffisant pour automates en miroir.
minimiser l’erreur aléatoire et la rendre négligeable (Arrière-plan agrandi ci-dessous)
devant l’erreur de non-équivalence.

3
Cette erreur de non-équivalence ne doit pas « consommer » à elle seule la totalité de la tolérance.
Elle ne doit représenter qu’une fraction de l’erreur totale. Le logiciel MultiQC applique un facteur
de réduction appelé budget d’erreur de non-equivalence. Il vaut par défaut 33%. Cela signifie que si
la tolérance est de 3 mmol/l, le critère autorisant l’échange des méthodes sera une erreur de non-
équivalence inférieure à 1%.
Le polygone de tolérance du diagramme de dispersion est construit avec la tolérance réduite selon le
budget d’erreur de non-équivalence. Il est centré sur la bissectrice (ligne d’identité).

Ligne d’identité
Field method (mmol/L)

160

Droite de régression

150 Polygone de tolérance

Erreur maximum de Point où la droite de


non-équivalence = régression sort du
140
± 1.7 mmol/l polygone de tolérance.

Budget d’erreur de non-


equivalence = 33%
130
Erreur maximum de
non-équivalence =
± 1.0 mmol/l Erreur autorisée
Concentrations sur la droite de
120 régression
< 130 mmol/l 1.7 mmol/l
130 to 150
1.0 mmol/l
110 mmol/l
> 150 mmol/l 1.7 mmol/l
0

0
11

12

13

14

15

16

Ref method (mmol/L)

Domaine de commutabilité

Diagramme de dispersion (sans les points) : Comparaison des méthodes « sodium » de


deux automates en miroir.

L’interprétation du diagramme de dispersion ne dépend pas de chaque point individuellement mais


uniquement de la droite de régression. Tout segment de la droite de régression intérieur au polygone
satisfait au critère de commutabilité. MultiQC recherche quelle portion de la droite de régression est
intérieure au polygone de tolérance. Le programme calcule d’abord les intersections entre la droite
de régression et les contours supérieurs et inférieurs du polygone de tolérance. Ces points
constituent les extrémités des segments « sous tolérance ». Leurs projections sur l’axe des abscisses
définissent le domaine de commutabilité. Ce domaine, qui peut associer plusieurs intervalles
disjoints, est souligné par une bande verte sur l’axe des abscisses.
Les méthodes sont commutables si le domaine de conformité est inclus dans le domaine de
commutabilité.

5. Quelle est le meilleur calcul de régression ?


La pratique démontre que la qualité des données est beaucoup plus importante que les modèles
statistiques. Tout le monde peut se faire sa propre opinion avec MultiQC qui peut instantanément

4
passer de la régression linéaire ordinaire à la régression de Deming, pondérée ou non, ou à la
régression non paramétrique de Passing-Bablok.
L’expérience démontrera à chacun l’inanité des discussions byzantines des statisticiens. Les
différences entre les estimations des paramètres de régression sont généralement négligeables
devant la tolérance, quand on traître des données réelles issues du laboratoire et couvrant toute
l’étendue analytique avec une répartition homogène.

6. Discordances entre diagrammes


Les figures suivantes montrent une comparaison entre deux méthodes de dosage du calcium
sérique : crésol phtaléine et arsenazo. Les graphiques sont dessinés pour une tolérance de 4% et un
budget d’erreur de non-equivalence de 33%.
Le diagramme de dispersion (à gauche) met en évidence un domaine de commutabilité de [74 à 120
mg/l]. Les deux méthodes seraient donc immédiatement commutables, au moins pour les calcémies
normales ou élevées. On pourrait étendre l’intervalle de commutabilité vers les hypocalcémies en
introduisant des facteurs de correction faciles à déduire des paramètres de la droite de régression.
Il y a cependant 5 points hors-tolérance dans le diagramme des différences (points bleus du
graphique). Cette mauvaise concordance entre les méthodes ne peut pas s’expliquer par
l’imprécision de l’une ou de l’autre. Les indices Cp calculés par MultiQC atteignent 2 pour les deux
méthodes. Elles sont donc largement capables de satisfaire individuellement à la tolérance.
Pourquoi les différences entre méthodes en sont-elles incapables ? Nous sommes en présence d’un
biais d’échantillon aberrant dont l’origine reste souvent inexpliquée : différence de spécificité, effet
matrice ou autre cause inconnue…

8
Cresol phtaleine cpx (mg/L)

Field - Ref (mg/L)

120
6

110
4

100 2

0
90

-2
80
-4

70
-6
70

80

90

70

80

90

0
10

11

12

10

11

12

Arsenazo (mg/L) Mean (mg/L)

La conclusion est que le diagramme de dispersion et le diagramme des différences sont


complémentaires. Le premier évalue la concordance globale moyenne de l’ensemble des points, le
second s’intéresse individuellement à chaque couple.

Le diagramme de dispersion est un outil pour rechercher une différence d’étalonnage.


Le diagramme des différences est un outil pour rechercher des couples aberrants.

5
7. Comparaison de méthodes et contrôle de qualité
Le logiciel de contrôle de qualité MultiQC (www.multiqc.com) contient un module capable de faire
l’analyse statistique des comparaisons de méthode. Il les archive parmi les événements propres à
chaque méthode analytique. Ces évènements comprennent, en plus, les étalonnages, les
changements de lot de réactif, les vérifications de linéarité et les tests répétabilité.
On peut visualiser à tout moment les événements analytiques en cliquant sur l’icône correspondant
de la barre d’évènements située sous les cartes de contrôle de qualité. Chacun peut ainsi accéder
facilement à l’ensemble de l’information indispensable à l’interprétation des anomalies des
contrôles de qualité interne et externe et à leur correction.

Evènements analytiques de MultiQC


Blanc réactif

Etalonnage

Nouveau lot de réactif

Commentaire

Vérification de linéarité

Vérification de répétabilité

Comparaison de méthodes

8. Commentaires

Le graphique de Bland et Altman


Bland et Altman ont publié un article dans The Lancet (1986) par lequel ils ont popularisé le
diagramme des différences dans le milieu de la recherche clinique. MultiQC ne reprend pas le
diagramme tel qu’il a été décrit parce qu’il ne convient pas à la biologie clinique :
• L’intervalle de mesure des méthodes analytiques est beaucoup plus étendu que celui des
méthodes cliniques. Le rapport des extrêmes dépasse souvent 10 en biologie clinique.
L’hypothèse d’homoscédasticité de Bland et Altman n’est jamais vérifiée même
approximativement. Il faudrait recourir systématiquement à une transformation
logarithmique qui rendrait la lecture du graphique beaucoup moins simple.
• Le biais entre méthodes analytiques est rarement constant. Le plus souvent une différence
d’étalonnage crée un biais proportionnel. C’est pourquoi le biais moyen, préconisé par
Bland et Altman, n’a aucune signification concrète.
• Les schémas de tolérance sont beaucoup plus complexes en biologie clinique que les
simples agreement limits de Bland et Altman.

Un préalable au diagramme des différences


Le diagramme des différences, tel qu’il est proposé par MultiQC, compare les écarts entre les
méthodes analytiques à la tolérance médicale. La comparaison n’a aucun sens si chaque méthode ne
satisfait pas elle-même à cette tolérance. Un préalable indispensable à la construction du diagramme
est donc de s’assurer que les indices d’aptitude Cp des deux méthodes sont supérieurs à 1,3 (valeur
minimum généralement retenue pour tout processus de fabrication).
Le célèbre article de Bland et Altman dans The Lancet (1986) fournit un remarquable exemple de
mauvaise interprétation d’un diagramme des différences. Les auteurs comparent deux débitmètres
expiratoires, un grand et un petit. Ils écrivent qu’ils seraient d’accord pour échanger les appareils si

6
les mesures ne différaient pas de plus d’une dizaine de l/mn. Mais ils précisent un peu plus loin que
le coefficient de répétabilité est 56,4 l/mn pour le petit débitmètre et 43,2 l/mn pour le grand.
Comment Bland et Altman peuvent-ils exiger que la différence entre les deux débitmètres n’excède
pas 10 l/mn alors que des mesures répétées avec le même appareil peuvent différer de plus de 50
l/mn ? La conclusion de Bland et Altman fut que le grand et le petit débitmètre ne sont pas
interchangeables. En réalité, si l’on adopte la tolérance de 10 l/mn, les deux débitmètres devraient
être mis au rebut parce qu’ils sont tous les deux incapables de satisfaire aux spécifications. Les
indices d’aptitude Cp sont tous les deux très largement inférieurs à 1.

Coefficient de corrélation
Le coefficient de corrélation doit être proscrit des comparaisons de méthodes analytiques.
• Le coefficient de corrélation mesure l’intensité de la liaison entre deux variables et non leur
concordance. Deux méthodes analytiques peuvent être fortement corrélées tout en présentant
un biais considérable qui les rend totalement incompatibles.
• La grandeur du coefficient de corrélation dépend de l’étendue des concentrations testées.
On peut le réduire en testant des échantillons de concentrations voisines. On peut
l’augmenter en sélectionnant des échantillons plus dispersés.
L’utilisateur du coefficient de corrélation commet une double erreur : 1- Ce coefficient ne répond
pas à la question posée, celle de la concordance entre méthodes ; 2- Il prend une valeur arbitraire
qui dépend du choix des échantillons. MultiQC ne calcule donc pas le coefficient de corrélation.

Pourquoi donc chaque numéro des Annales de Biologie Clinique nous gratifie-t-il
de son lot de « r = 0,99 », quand ce n’est pas, comble du ridicule, un « r »
supérieur à 1 (Boudaoud, juillet-août 2006) ?
La réponse fut donnée, il y a 20 ans, par Bland et Altman dans le dernier
paragraphe de leur article cité en référence : Trop nombreux sont les auteurs qui
n’abdiquent pas lorsqu’ils sont confrontés à un sujet qu’ils ne maîtrisent pas, mais
adoptent un comportement mimétique et grégaire qui perpétue les erreurs de
leurs prédécesseurs.

9. Référence
Bland JM, Altman DG. Statistical methods for assessing agreement between two methods of
clinical measurement: http://www-users.york.ac.uk/~mb55/meas/ba.htm

Vous aimerez peut-être aussi