Dossier : journal des psychologues n°253
Auteur(s) : Gregoire Jacques
Présentation
Les nouvelles échelles de Wechsler nous conduisent à abandonner un modèle de mesure de l’intelligence en deux échelles au profit d’un autre basé sur quatre indices. Jacques Grégoire, responsable de l’adaptation française de cette nouvelle version, présente par le détail des hypothèses d’interprétation et les perspectives offertes par cette nouvelle organisation.
Mots Clés
Détail de l'article
L’abandon, dans le WISC-IV (Wechsler, 2005), du QI Verbal (QIV) et du QI de Performance (QIP) et leur remplacement par quatre indices (Compréhension verbale – ICV–, Raisonnement perceptif – IRP –, Mémoire de travail – IMP – et Vitesse de traitement – IVT) ont causé un choc à de nombreux praticiens. Les QIV et QIP constituaient, en effet, une des caractéristiques essentielles des échelles de Wechsler depuis la publication du Wechsler-Bellevue, en 1939. La comparaison de ces deux QI faisait partie de l’interprétation routinière des protocoles de toutes les échelles de Wechsler. Cette comparaison apparaît d’ailleurs dans un nombre impressionnant d’articles scientifiques publiés depuis plus de soixante ans. Privés des QIV et QIP, beaucoup de cliniciens sont quelque peu désorientés. Ils ont du mal à faire leur deuil de ces QI et à investir les indices qui les remplacent. Dans cet article, nous détaillerons les raisons qui ont conduit à l’abandon des QIV et QIP et à leur remplacement par des indices. Nous examinerons ensuite les caractéristiques intellectuelles et non intellectuelles que mesurent ces indices. Nous terminerons par la présentation de quelques principes méthodologiques qui devraient régir une interprétation valide et prudente des indices et de leur dispersion.
Pourquoi avoir abandonné les QIV et QIP ?
Les QIV et QIP, aujourd’hui regrettés, n’étaient pas exempts de toute critique. Loin de là ! D. Wechsler les a introduits dès la première version de son test sur la base de son expérience de psychologue dans l’armée américaine, où il avait utilisé les Army Tests Alpha et Beta. Le premier était un test d’intelligence verbale, alors que le second permettait de mesurer l’intelligence sans utiliser le langage. Jugeant la comparaison de ces deux mesures utiles d’un point de vue clinique, D. Wechsler décide d’inclure dans son test de nombreuses épreuves provenant des Army Tests et de les organiser en deux sous-échelles. Construits sur une base purement pragmatique, les QIV et QIP rencontrent de suite un grand succès auprès des cliniciens. Mais les études empiriques montrent rapidement qu’il s’agit de constructions relativement hétérogènes, dont l’interprétation psychologique est loin d’être aisée. Bien que l’échelle Verbale soit la plus homogène des deux échelles, l’épreuve d’Arithmétique qui en fait partie n’est que modérément corrélée avec les autres épreuves de cette échelle. En plus du raisonnement verbal, cette épreuve fait appel au raisonnement numérique et à la mémoire de travail. L’échelle de Performance est, quant à elle, nettement plus hétérogène. En particulier, l’épreuve de Code n’est que faiblement corrélée avec les autres épreuves. De plus, le rôle important que joue la vitesse dans la majorité des épreuves rend délicate l’interprétation de faibles performances. Le nom même de l’échelle de Performance pose problème, car il ne rend pas compte de ce que mesure le QIP. Les praticiens qualifient souvent ce dernier de mesure de l’intelligence non verbale. Mais cette dénomination négative ne permet pas, malheureusement, de déterminer ce que mesure effectivement le QIP.
Depuis longtemps, les analyses factorielles des échelles de Wechsler ont montré que d’autres regroupements des épreuves étaient possibles. Sur la base d’une analyse factorielle des données d’étalonnage du Wisc-r (seconde édition de l’échelle de Wechsler pour enfants), A. S. Kaufman (1975) montre qu’une organisation des épreuves en trois composantes est plus cohérente que l’organisation en deux échelles. Dans l’organisation proposée par A. S. Kaufman, une première composante rassemble les épreuves d’intelligence verbale, une seconde rassemble les épreuves mesurant l’intelligence visuo-spatiale et une troisième, appelée « Attention/Concentration », rassemble les épreuves Arithmétique, Code et Mémoire de chiffres. Le constat fait par A. S. Kaufman influence le développement de la troisième édition de l’échelle de Wechsler pour enfants (WISC-III). Les concepteurs de cette échelle décident de renforcer la troisième composante mise en évidence par A. S. Kaufman en introduisant une nouvelle épreuve : Symboles. Ils ont toutefois la surprise de constater que cette nouvelle épreuve conduit à l’apparition d’un quatrième facteur, rassemblant Code et Symboles, qu’ils dénomment « Vitesse de traitement ». Le troisième facteur ne comprend plus, dès lors, qu’Arithmétique et Mémoire de chiffres. Ce troisième facteur se révèle, par ailleurs, instable selon les adaptations du WISC-III. Ainsi, l’adaptation française ne permet pas de mettre en évidence ce facteur, car l’épreuve d’Arithmétique apparaît plus saturée par le premier facteur, mesurant l’intelligence verbale, que par le troisième facteur (Grégoire, 2003).
Lors du développement de la troisième édition de l’échelle de Wechsler pour adulte (WAIS-III), une nouvelle épreuve est introduite afin de renforcer une organisation du test en quatre sous-échelles. Cette épreuve, Séquence lettres-chiffres, remplace l’épreuve d’Arithmétique au sein du troisième facteur et permet le calcul d’un indice plus robuste, à présent appelé « Mémoire de travail ». La WAIS-III voit également l’apparition de l’épreuve Matrices destinée à étoffer la mesure de l’intelligence fluide au sein du QI. La possibilité offerte par la WAIS-III de calculer quatre indices factoriels solides ne rencontre toutefois guère de succès auprès des cliniciens. La conservation dans la WAIS-III des traditionnels QIV et QIP dissuade, en effet, de nombreux praticiens de modifier leurs habitudes.
Ce constat conduit les concepteurs du WISC-IV à opérer un choix radical en abandonnant l’option d’un calcul des QIV et QIP au profit du seul calcul des indices. Les quatre indices du WISC-IV et les épreuves qui les composent sont présentés dans le tableau 1. Les analyses factorielles des données d’étalonnage américaines et françaises du WISC-IV démontrent que l’organisation des épreuves en quatre indices est pertinente, car ces derniers sont nettement plus cohérents que les QIV et QIP. Leur interprétation devrait, par conséquent, être plus facile puisque les caractéristiques mesurées sont plus homogènes.
Compréhension verbale | Mémoire de travail |
Similitudes | Mémoire de chiffres |
Vocabulaire | Séquence lettres-chiffres |
Compréhension | |
Raisonnement perceptif | Vitesse de traitement |
Cubes | Code |
Identification de concepts | Symboles |
Matrices |
Tableau 1. Composition des quatre indices du WISC-IV.
Que mesurent les indices ?
Soutenus par des résultats d’analyse factorielle, les indices du WISC-IV ne sont pas pour autant des mesures simples. Les concepteurs du WISC-IV ne sont, en effet, pas partis d’un modèle théorique qui aurait servi de référence pour développer des mesures précises de leurs composantes. Ils ont suivi le chemin inverse, partant de mesures relativement homogènes auxquelles ils ont, après coup, tenté de faire correspondre des composantes de certains modèles de l’intelligence.
Actuellement, deux modèles exercent une grande influence dans le domaine des tests d’intelligence : celui de J. B. Carroll (1993) et celui de R. B. Cattell et J. L. Horn (1997). Ces deux modèles se ressemblent beaucoup du point de vue des grandes facettes de l’intelligence (les facteurs de groupe) qu’ils prennent en compte. Leur différence essentielle tient à l’existence d’un facteur général (le facteur g) qui chapeaute tous les facteurs de groupe dans le modèle de J. B. Carroll, alors que ce facteur est absent du modèle de R. B. Cattell et J. L. Horn. Le tableau 2 met en correspondance les quatre indices du WISC-IV et les facteurs de groupe des modèles de J. B. Carroll et de R. B. Cattell et J. L. Horn. Cette correspondance est approximative et demande à être nuancée. Nous l’analysons dans les sections suivantes indice par indice.
Indice Compréhension verbale
Les trois épreuves qui composent cet indice sont communes avec celles de l’ancien QIV. La corrélation entre l’ICV du WISC-IV et le QIV du WISC-III est d’ailleurs élevée (0,82). L’ICV peut être considéré comme une version purifiée du QIV dont a été retirée l’épreuve la moins bien corrélée avec les autres, en l’occurrence Arithmétique. L’ICV est un bon index de l’intelligence cristallisée, c’est-à-dire de cette facette de l’intelligence déterminée par l’éducation et la scolarité dans laquelle dominent le langage et les connaissances acquises. C’est le meilleur indice de prédiction des apprentissages scolaires. Toutefois, si l’ICV permet de prédire les performances scolaires, il est aussi l’indice le plus dépendant des opportunités d’apprentissage et du milieu social. Dans l’échantillon d’étalonnage français du WISC-IV, on observe d’ailleurs une différence moyenne de 14 points entre l’ICV des enfants de cadres et ceux d’ouvriers (Grégoire, 2006). Cette différence est moins due à la faiblesse des enfants d’ouvriers, dont les performances à l’ICV ne sont que légèrement inférieures à la normale, qu’aux performances nettement supérieures à la moyenne des enfants de cadres qui profitent d’opportunités d’apprentissage particulièrement favorables. L’ICV est également sensible aux troubles de la lecture qui privent l’enfant d’un canal important d’apprentissage des connaissances verbales.
Indices | Carroll | Cattell-Horn | Sigle |
ICV | Intelligence cristallisée | Intelligence cristallisée | GC |
IRP | Intelligence fluide | Intelligence fluide | GF |
Perception visuelle | Traitement visuel | GV | |
IMT | Mémoire générale | Mémoire à court terme | GSM |
IVT | Rapidité cognitive | Vitesse de traitement | GS |
Tableau 2. Correspondance entre les indices du WISC-III-IV et les facteurs de groupe des modèles de J. B. Carroll et de R. B. Cattell et J. L. Horn.
Indice Raisonnement perceptif
La nature de l’IRP est nettement plus complexe que celle de l’ICV. L’IRP partage une seule épreuve avec l’ancien QIP, celle de Cubes. La corrélation entre l’IRP du WISC-IV et le QIP du WISC-III est d’ailleurs modérée (0,62). De toute évidence, si l’IRP mesure certaines caractéristiques cognitives communes avec celles mesurées par l’ICV, il mesure aussi des caractéristiques spécifiques. Une différence importante entre l’IRP et le QIP est la réduction de l’impact de la vitesse sur les notes aux épreuves. Seule l’épreuve de Cubes permet encore d’obtenir des bonus de points pour réponse rapide. Afin d’identifier l’impact de la vitesse sur la note à cette épreuve, des normes ne tenant pas compte des bonus sont à présent fournies. Par ailleurs, les trois épreuves qui composent l’IRP ne sont que modérément saturées par le facteur qui sous-tend cet indice (autour de 0,50), ce qui laisse supposer que chaque épreuve mesure, pour une part assez importante, des caractéristiques spécifiques. Des quatre indices, l’IRP est d’ailleurs celui où l’hétérogénéité des performances des sujets de l’échantillon d’étalonnage est la plus importante. Plus de 25 % de ces sujets tout-venant présentent, en effet, un écart de 6 points ou plus entre leur note standard la plus basse et leur note standard la plus élevée aux épreuves de l’IRP (Grégoire, 2006).
L’épreuve de Cubes est une mesure typique de Gv (Carroll, 1993). Elle demande d’analyser, d’encoder et de manipuler mentalement des formes spatiales. L’épreuve de Matrices, quant à elle, est une mesure classique de l’intelligence fluide (Gf). Toutefois, la composante visuo-spatiale de cette épreuve est importante. Enfin, l’épreuve d’Identification de concept fait d’évidence appel à la capacité de catégorisation et à la flexibilité mentale, car le sujet doit pouvoir inhiber les réponses erronées induites par certaines images. Il semble que Gv soit la composante commune aux trois épreuves de l’IRP. Mais la note totale à cet indice est une mesure composite où interviennent également l’intelligence fluide, l’intelligence cristallisée (reconnaissance des formes et des images) et diverses capacités spécifiques comme la catégorisation et la flexibilité.
Figure 1. Analyse de la dispersion des indices (d’après Grégoire, 2006).
Indice Mémoire de travail
Le facteur qui sous-tend cet indice sature bien l’épreuve de Séquence lettres-chiffres, mais plus modérément l’épreuve de Mémoire de chiffres. Un tel constat n’est pas étonnant. Tous les items de Séquence lettres-chiffres sollicitent la mémoire de travail, car le sujet doit gérer une double tâche en conservant l’information en mémoire immédiate et en la manipulant mentalement. De ce point de vue, Mémoire de chiffres est une épreuve plus hétérogène, car la mémoire de chiffres en ordre direct ne fait appel qu’à la mémoire immédiate, alors que la mémoire de chiffres en ordre inverse demande de gérer une double tâche.
Même s’il mesure indubitablement la mémoire de travail et, en particulier, l’efficacité du gestionnaire central, l’imt n’en est cependant qu’une mesure très incomplète. Les deux épreuves ne testent, en effet, que la mémorisation de stimuli auditifs verbaux. La mémorisation de stimuli auditifs non verbaux, de stimuli visuels et de stimuli multisensoriels n’est pas évaluée. L’imt ne peut donc être considéré comme une mesure générale de la mémoire de travail, mais seulement comme une mesure très partielle de celle-ci. Par ailleurs, cette mesure est sensible à la connaissance des symboles numériques et, surtout, de l’alphabet. Pour cette raison, cet indice peut être déprimé chez des sujets souffrant de troubles de la lecture, mais dont la mémoire de travail est pourtant fonctionnelle. Enfin, l’imt est sensible aux troubles de l’attention. En effet, ces derniers peuvent perturber l’encodage des informations auditives et leur traitement mental.
Indice Vitesse de traitement
Les deux épreuves qui composent cet indice sont bien saturées par le facteur sous-jacent. Elles mesurent toutes les deux une facette de la vitesse de traitement limitée aux stimuli visuels asémantiques et aux réponses motrices manuelles. Dans les deux cas, il s’agit d’analyser rapidement et de distinguer des stimuli relativement simples, sans signification particulière. On ne peut donc pas considérer la note à l’ivt comme une mesure générale de la vitesse de traitement mental. Ainsi, la vitesse de traitement d’informations auditives n’est pas du tout évaluée par cet indice. Par ailleurs, celui-ci peut être influencé par des caractéristiques indépendantes de la vitesse de traitement mental, comme la vitesse de la performance graphomotrice et la maîtrise de l’écriture. L’ivt peut également être parasité par les troubles de l’attention et la dépression.
Indice | Seuil (.05) | Score | Différence |
ICV | 11,07 | 105 | 7 |
IRP | 11,44 | 85 | -13 |
IMP | 11,34 | 103 | 5 |
IVT | 12,52 | 99 | 1 |
Moyenne | 98 |
Tableau 3. Exemple d’analyse de la dispersion des indices (d’après Grégoire, 2006).
Comment interpréter les indices ?
L’interprétation des QIV et QIP était relativement simple, reposant sur la comparaison de ces deux mesures. L’interprétation des quatre indices est nettement plus complexe, car elle implique de comparer six paires d’indices. Afin de simplifier cette comparaison, nous avons mis au point une procédure d’analyse de la dispersion des indices à la fois aisée et rigoureuse. Son principe est représenté graphiquement dans la figure 1.
Le point de départ est le calcul d’une ligne de base égale à la moyenne des quatre indices (somme des quatre indices divisée par quatre). Ensuite, la différence entre chaque indices et cette ligne de base peut être calculée. Une part des écarts entre les indices et la ligne de base est due aux erreurs de mesure qui affectent inévitablement les notes obtenues. Il est, dès lors, nécessaire de déterminer un seuil à partir duquel il est raisonnable de considérer que les différences observées sont le reflet d’une différence réelle d’efficience d’une composante de l’intelligence. Le seuil choisi représente le risque de se tromper que le praticien est prêt à accepter. Une illustration de cette procédure d’analyse de la dispersion des indices est présentée dans le tableau 3, où nous avons utilisé le seuil de .05 qui est le plus courant, car il représente un risque raisonnable d’erreur (5 %). Dans l’exemple, nous pouvons constater que la personne examinée présente un seul indice (IRP) s’écartant significativement de sa moyenne. Seul cet indice mérite d’être interprété. Les autres différences sont considérées comme la conséquence de variations aléatoires dues aux erreurs de mesure et ne méritent pas que l’on s’y attarde. Par conséquent, les indices ICV, IMT et ivt seront considérés comme se situant globalement au même niveau.
Un indice qui s’écarte significativement de la ligne de base représente une force ou une faiblesse du sujet par rapport à l’ensemble de ses propres performances au WISC-IV. Toutefois, une force ou une faiblesse n’ont pas nécessairement de caractère pathologique. Par exemple, un sujet peut avoir une ligne de base égale à 133 et un IVT égal à 118. Son ivt sera donc de 15 points inférieur à la ligne de base, ce qui est statistiquement significatif et représente une faiblesse au sein du profil de performance de ce sujet. Pourtant, la note de 118 est très supérieure à la performance moyenne des sujets du même âge (égale à 100) et ne peut être considérée comme le signe d’un trouble cognitif.
Lorsque l’on analyse la dispersion des indices d’une personne, outre la référence à son niveau général de performance, il importe de prendre aussi en compte la dispersion des indices chez les individus tout-venant. Chez des personnes sans problème cognitif, l’observation d’un profil d’indices plat est loin d’être la règle. Au contraire, de nombreux individus ne souffrant d’aucune pathologie présentent une relative dispersion de leurs résultats. Il importe, par conséquent, de relativiser la dispersion des indices chez les individus examinés au regard de ce que l’on observe couramment chez les individus tout-venant. Le tableau 4 présente le pourcentage de sujets de l’échantillon d’étalonnage présentant de 0 à 4 indices s’écartant significativement de la moyenne de leurs indices. On peut constater que plus de 60 % des sujets tout-venant présentent au moins un indice qui s’écarte significativement de leur ligne de base.
Enfin, l’analyse de la dispersion des indices nécessite de prendre également en compte la dispersion au sein de chaque indice. En effet, un indice composé de notes standard très hétérogènes ne signifie plus grand-chose. Dans ce cas, la comparaison de l’indice en question avec les autres indices n’a guère de sens. Par exemple, si un enfant obtient une note de 7 en Code et de 13 en Symboles, sa note à l’ivt sera de 10 points, mais cette note n’aura pas d’intérêt, car elle ne correspond à aucune des performances observées aux épreuves. Dans ce cas, l’interprétation devra se situer au niveau de la différence entre les notes standard et non plus au niveau de la note totale à l’indice. Des informations plus détaillées à propos de l’analyse de la dispersion au sein des indices peuvent être trouvées dans l’ouvrage de J. Grégoire (2006).
Nombre d’indices | % de sujets |
0 | 39,6 |
1 | 26,7 |
2 | 29,0 |
3 | 3,6 |
4 | 1,1 |
Tableau 4. Nombre d’indices s’écartant significativement de la ligne de base chez les sujets tout-venant (d’après Grégoire, 2006).
L’analyse de la dispersion des indices vise à mettre en évidence ceux d’entre eux qui méritent une interprétation approfondie. Cette interprétation n’est jamais automatique. En effet, les performances observées au WISC-IV sont le fruit de processus complexes où interviennent de multiples caractéristiques intellectuelles et non intellectuelles (attention, émotions, motivation…). Leur interprétation ne peut se faire qu’à la lumière des performances observées dans l’ensemble du protocole de WISC-IV. Les informations fournies plus haut à propos de chacun des indices ont pour seule ambition d’aider les praticiens à élaborer des hypothèses d’interprétation. Il est de la responsabilité de chaque praticien d’utiliser ces informations de manière critique et de les compléter par des observations, un entretien et, le cas échéant, des examens complémentaires. Par ailleurs, notre connaissance actuelle des indices est encore parcellaire. Seul l’ICV nous est réellement familier, car il correspond en grande partie à l’ancien QIV. En revanche, les trois autres indices nécessitent des recherches complémentaires pour être mieux compris. De quelles pathologies sont-ils les indicateurs ? Quelles variables peuvent affecter les performances aux épreuves qui les composent ? Quels examens complémentaires et quelles interventions permettent-ils de recommander ? Les réponses à ces questions restent actuellement incomplètes, mais nous pouvons espérer obtenir des informations plus précises dans un proche avenir.