Jump to content
Le forum de l'OFPN
  • DominiqueC
    DominiqueC

    Ces perfides centiles !


    Marylin Bowman s'est intéressée à l'utilisation des centiles en neuropsychologie. Il existe de nombreuses recommandations sur leur emploi, notamment dans les synthèses et retours destinés aux non-psychologues (comme Lezak , 1995). Certains auteurs vont jusqu'à conseiller l'exclusion des scores au profit des seuls percentiles (Tanner, 1993 ). Au final, les réserves sur l'utilisation des centiles sont très rares dans la littérature et la plupart des auteurs s'accordent sur l'utilité et la facilité de leur utilisation en pratique.

    Comme vous vous en doutez, ce n'est pas tout à fait l'avis de Marylin Bawman qui pense qu'il n'est pas si aisé d'utiliser à bon escient les centiles.

    La principale source d'erreurs serait liée, pour l'auteur, au sentiment erroné d'équivalence entre chaque intervalle.

    Bowman a constitué un groupe de participants, tous étudiants en 3eme année de psychologie. Elle a demandé aux étudiants d'estimer à partir d'un questionnaire en 12 items à choix multiples :

    -la valeur probable que prendrait un centile pour 6 scores QI standard (3 au-dessus de la moyenne, 3 en dessous)

    - la valeur probable que prendrait un score QI standard pour 6 centiles (3 au-dessus de la moyenne, 3 en dessous)

    Les réponses ont été classées en 3 catégories : sous-estimation, réponse correcte, sur estimation.

    Pour les scores de QI standard inférieurs à la moyenne, les erreurs ont majoritairement été dans le sens d'une sous estimation de la valeur supposée du centile correspondant (35%). Lorsque le score de QI standard était supérieur à la moyenne, la majorité des étudiants ont surestimé la valeur supposée du centile correspondant (78%).

    Lorsque les étudiants devaient se baser sur un centile supérieur à la moyenne, les participants ont commis une erreur de surestimation par rapport à la valeur supposée du QI standard (67%). Lorsque le centile était inférieur à la moyenne, les participants ont alors sous-estimé la valeur supposée du QI standard correspondant (84%).

    Les erreurs les plus importantes ont été commises pour les valeurs les plus faibles, aussi bien pour les scores de QI standard que pour les centiles.

    Pour Bowman, les résultats sont catastrophiques. Les centiles ont été interprétés comme s'ils étaient des valeurs égales se répartissant de manière linéaire, un peu comme des pourcentages. Pour l'auteur, ces résultats questionnent sérieusement la pratique bien établie qui consiste, en neuropsychologie, à utiliser des centiles afin de faciliter l'échange interprofessionnel. Il faut rappeler que ces résultats sont observés chez des étudiants raisonnablement bien formés en statistiques.

    Bowman invoque deux implications cliniques importantes :

    1-le risque d'erreur le plus important concerne les scores se répartissant jusqu'à moins un écart type en dessous de la moyenne. Sur cet intervalle, les centiles (19-50) sont répartis dans des unités de taille très inégales. L'impact de considérer une performance comme déficitaire alors qu'elle ne l'est pas peut être grave dans un contexte d'évaluation ou d'expertise judiciaire.

    2-les graphiques pour résumer les scores sont souvent présentés comme des solutions pratiques et certains exemples sont même fournis dans des ouvrages célèbres (Lezak, 1983; Spreen & Strauss , 1998). Ces graphiques permettent de transformer des scores bruts provenant de multiples tests afin de les regrouper dans une métrique commune comme les T scores, les Z scores, les déviations de QI ainsi que les percentiles. Quelle que soit la présentation retenue, le risque d'erreur d'interprétation augmente en faisait croire que les valeurs se distribuent de manière linéaire et égale entre elles. Le fait d'ajouter une courbe de Gauss comme l'a fait Strauss ne change rien puisqu’aucune explication ne figure à côté du graphique.

    Pour une valeur se situant sur un centile 25, la majorité des participants pourtant formés aux statistiques ont commis une erreur d'interprétation en indiquant que la performance était déficitaire. Tous les participants ont estimé qu'un centile 25 se situait en dessous d'une valeur de QI standard 90 et un tiers ont même placé cette valeur en dessous du QI standard 69 !

    Conclusion

    Pour l'auteur, la plupart des gens ne savent pas interpréter correctement l'information contenue dans un centile. Les erreurs d'interprétation peuvent être majeures et lourdes de conséquences.

    Des solutions existent toutefois pour améliorer ceci :

    -les scores peuvent être décrits dans un langage ordinaire afin de les caractériser dans des termes compréhensibles par tous.

    -l'utilisation de graphiques devrait privilégier une représentation d'intervalles égaux de type note standard sans afficher les centiles.

    -enfin, dans le cas où les données devraient être partagées afin de faciliter les comparatifs, l'auteur recommande l'utilisation d'une feuille récapitulative des données. Celle-ci devrait contenir les échelles métriques spécifiques aux tests employés sans effort d'homogénéisation particulière. Il s'agit là de garder le maximum de pertinence tout en évitant la possibilité d'interprétation pour d'autres utilisateurs non formés.

    Source: Bowman (2002). The perfidy of percentiles. Archives of Clinical Neuropsychology. Volume 17, Issue 3, Pages 295-303

    Page de l'auteur : http://www.sfu.ca/~bowman/

    User Feedback

    Recommended Comments

    Marylin Bowman s'inscrit clairement à contre courant avec cet article de 2002. Je le trouve intéressant car, personnellement, j'ai fait mes premiers pas avec des livres comme le Compendium et jusqu'à aujourd'hui j'utilise les percentiles dans mes communications. J'ai aussi expérimenté les graphiques, toujours sur le modèle de Strauss.

    J'ai déjà noté, chez certains étudiants, cette tendance à trouver une performance suspecte si elle prend une valeur de percentile 20 par exemple. Difficile parfois de faire comprendre que tout l'échantillon ne peut pas se retrouver sur le percentile 50 ! Pour être honnête, je dois aussi parfois me raisonner face à des petits percentiles... J'ai affiché une courbe de Gauss comme dans l'illustration dans mon bureau afin de ne pas me faire oublier ces questions de distributions !

    Peut être faudrait il faire le point avec nos collègues médecins sur cette question des percentiles pour ceux qui les utilisent ? Après tout, ça pourrait être un échange intéressant et constructif. Nous savons bien que certains d'entre eux ont parfois l'envie d'aller voir les scores brutes et les normes...

    Link to comment
    Share on other sites

    j'avoue avoir moi-même été plus "sévère" avec les percentiles qu'avec les écart-types (j'utilise -1.65 comme valeur seuil). A présent, le graphique de correspondance est toujours à portée de main.

    je pense que dans les dess également, pardon les master, il faudrait appronfondir la formation sur cette question. il est tellement facile de prendre de mauvaises habitudes !

    Link to comment
    Share on other sites

    Encore merci Dominique pour ce super partage de culture nécessaire à notre pratique! Tu es un neuropsy consciencieux et très professionnelle avec une approche exemplaire! si si je le pense! ceci mis à part, en bonne ancienne adepte du forum j'ai déjà ce tableau sous les yeux depuis plusieurs mois grâce à toi, ce qui ne m'empêche pas de découvrir cet article en complément et d'être ravie que tu aies partagé cette étude avec nous avec une super traduction! merci merci!

    Avant hier justement, une collègue me disait qu'elle avait comparé deux tests similaires auxquelx un enfant n'avait pourtant pas eu les mêmes résultats..elle considérait le 2ème comme patho et le 1er ok alors qu'en fait l'enfant a eu une NS de 10 au 1er et un résultat en pc 10 au 2ème. Pour moi il a "seulement" eu plus de difficulté pour l'autre version, c'est juste proche du seuil limite mais ça n’en fait pas partie et ce n’est donc pas déficitaire (1,5 pour moi est le seuil où je considère les résultats comme "fragiles" (c’est il me semble le seuil MCI pour les personnes âgées) et après 1,6 donc comme patho)

    Sinon donc justement je me posais la question : utilisez vous tous l'écart-type de 1,65 comme seuil? comme le font VDLinden pour la RLRI? ce qui fait que le pc limite serait bien 5. je veux juste m'assurer qu'on est bien sur la même interprétation, sinon tout cela ne sert à rien

    Surtout qu’en fait sur le tableau les auteurs ont l’air d’indiquer les scores de -1,4 à -1,9 comme limites (« borderline », ce que j’appelle moi « fragile » ;-) ..alors patho à -2 net ou dès -1,65 ?

    Le dernier paragraphe sur la figuration d’une feuille récapitulative dans les CR est intéressant aussi..j’aimerais bien développer et échanger avec vous là-dessus..ce serait sans doute plus adapté dans le forum à la suite de nos posts sur les feuilles de résultats justement. Je garde l’idée en tête pour un prochain moment de temps utilisable ;-)

    Link to comment
    Share on other sites

    Encore une fois avec un peu de retard ... J'ai trouvé également cet article très intéressant. Je me sens méga concernée par ces précautions, d'ailleurs, je suis toujours mal à l'aise avec les centiles. Je considère également le score patho en desous du 5è centile. n'empèche. Il y a environ 5% de la population générale qui a ce score. devant un patient donné, on considère la probabilité que Ce patient aie Ce score trop faible pour l'attribuer à autre chose que sa pathologie. Je ne suis pas sûre d'être claire.

    Je trouve les écart-types plus clairs... En même temps, je considère les centiles plus fiables, déjà, il faut un nombre suffisant de patients pour ramener tout cela en centile... Et il faut que la distribution suive la loi normale, ça fait quand même beaucoup de conditions sérieuses.

    Sinon, pour les écart-types, je me base aussi sur 1.65, j'ai lu quelque part que c'est bien...

    Voili voilou, sympas sympas ces échanges.

    Céline

    Link to comment
    Share on other sites

    moi aussi je souhaite revenir sur ce sujet mais pour aborder l'écart-type !

    pour ma part je me base sur -2 écart-type = pathologique, après un score à -1,7 ou -1,8 peut être considéré comme faible à la limite de la normes. D'ailleurs pour le MCI les scores mnésiques doivent se situer à plus de -1,5 écart-type de la moyenne... selon mes sources

    qu'en pensez-vous ?

    Link to comment
    Share on other sites

    Quant à moi, la pathologie débute à -1,65 écart-type de la moyenne. Entre la moyenne et -1 écart-type, c'est dans la moyenne ; entre -1 et -1.64, c'est différent de la moyenne mais pas patho au-delà de 1.65, c'est patho.

    D'autres avis?

    Link to comment
    Share on other sites

    Dans l'Handbook of Normative Data de Maura Mitrushina, il est dit qu'une peformance est borderline entre le 8eme et le 2eme percentile et déficitaire en dessous du 2eme percentile (ce qui correspond à -2SD). Dans le Compendium de Spreen & Strauss, il est dit qu'une performance borderline correspond à un score s'étalant de -1 à -1.9 SD (soit du 16eme au 3eme percentile) et déficitaire à partir de -2SD.

    Les auteurs s'accordent donc pour dire que -2SD est un écart à la moyenne valide pour poser comme déficitaire une performance observée. La question des performances subnormales reste, vraisemblablement, à l'appréciation du clinicien (à partir de -1SD pour Strauss et de -1.4SD pour Mitrushina).

    Je crois qu'il faut ajuster cette valeur en fonction des données normatives que nous possédons et du contexte d'évaluation. Rien n'est fixe en définitive mais vous avez au moins deux références "mondiales" pour cette question des seuils

    Link to comment
    Share on other sites


    Guest
    Add a comment...

    ×   Pasted as rich text.   Paste as plain text instead

      Only 75 emoji are allowed.

    ×   Your link has been automatically embedded.   Display as a link instead

    ×   Your previous content has been restored.   Clear editor

    ×   You cannot paste images directly. Upload or insert images from URL.


×
×
  • Create New...