Validation d’une mesure d’autovalorisation
Le Questionnaire Français de Surestimation des Connaissances (French Over-Claiming Questionnaire)
p. 221-225
Texte intégral
Introduction
1Produire des évaluations sur soi est un exercice coutumier pour lequel nous excellons. Cependant, ces évaluations sont fréquemment distordues en ce sens qu’elles peuvent se révéler positivement biaisées. Cette tendance, l’autovalorisation ou AV (Sedikides & Strube, 1997), pourrait avoir des conséquences diverses, notamment sur l’ajustement psychologique. La nature positive ou négative de ces conséquences reste largement conditionnée par les méthodes employées pour la mesurer. Il est alors difficile de tirer des conclusions claires sur son impact étant donné la confusion entre mesures et conséquences. Les mesures de comparaison sociale (CS) impliquant des mesures autorapportées montrent ce biais comme protecteur de la santé mentale, alors que les mesures de divergence lient ce biais à des conséquences néfastes. Ces dernières présentent l’avantage d’outrepasser les biais inhérents aux mesures autorapportées mais n’en restent pas moins critiquées, notamment de par leur complexité de mise en œuvre. Afin de répondre aux limites de ces opérationnalisations, Paulhus, Harms, Bruce & Lysy (2003) ont proposé une méthode indirecte, facile à mettre en place, qui permet de mesurer une forme d’AV représentée par la tendance à surestimer ses connaissances (over-claiming). Cette technique se base sur un questionnaire de connaissances (OCQ-150) composé d’items abérants/n’existants pas (e.g. pseudo-verbe) et d’items existants effectivement (e.g. aphorisme) et sur la théorie de la détection du signal (qui permet le calcul d’un score de fausses alarmes (FA), i.e. lorsque le participant déclare connaître un item inexistant, et d’un score de détections correctes (DC), i.e. lorsque le participant déclare connaître un item existant). La théorie de la détection du signal permet de calculer un indice d’AV ou biais de réponses (consistant approximativement en la somme des FA et des DC, voir Paulhus et al. (2003) pour plus de détails) et un indice de précision (mesure des connaissances, consistant approximativement en la soustraction des DC aux FA). Disposer de ces indices présente un autre avantage : l’indice de précision peut être contrôlé statistiquement lors du test d’hypothèses impliquant l’indice d’AV. Étant donné les intérêts méthodologiques de cette approche, nous avons entrepris d’adapter cette technique au contexte culturel français. Le but de notre travail a d’abord été d’élaborer un questionnaire francophone de surestimation des connaissances (QFSC) composé d’items inexistants et existants. Puis nous avons mené deux études afin de sélectionner les items et d’entreprendre la validation du QFSC.
Étude 1
Méthode
Participants
2Soixante-quatorze étudiants (68 femmes) en licence 3 de psychologie (âge moyen = 22,24 ; ET = 4,41).
Matériel et mesures
Générations des items existants du QFSC
3L’OCQ-150 étant un questionnaire anglophone, nous avons ajusté son contenu à la culture française. Les items le composant ont ainsi été sélectionnés dans divers ouvrages traitant de culture générale et classés à l’intérieur des 10 catégories de connaissance suivantes : noms et événements historiques, beaux-arts, langage, livres et poèmes, auteurs et personnages, sciences sociales et droit, sciences physiques, sciences de la vie, noms culturels du xxe siècle et produits de consommation. Au total 18 items existants ont été inclus dans chaque catégorie
Générations des items inexistants du QFSC
4La construction des items inexistants (leurres) s’est faite selon les recommandations de Paulhus et al. (2003) et Paulhus & Harms (2004), à savoir qu’ils devaient paraître vraisemblables pour un non-expert et capables de « piéger » les individus ayant tendance à la surestimation. Ces leurres consistaient en mots/noms ou groupes de mots/noms partageant certaines ressemblances avec des mots/noms existants effectivement (e. g. symposium espace temps, l’association de ces termes produisant un concept en soi aberrant). Pour les catégories impliquant des noms de personnes, les leurres ont été composés de noms et prénoms existants (e. g. Paul Lavandier). Six items inexistants par catégorie ont été intégrés au QFSC.
Échelle
5Le participant devait évaluer sa familiarité avec chacun des items sur une échelle allant de 0 (« jamais entendu parlé ») à 4 (« très familier »).
Résultats
Sélection des items
6Les indices de biais et de précision des réponses ont été calculés selon les formules définies par Paulhus & Harms (2004). Le but de la sélection d’items a été d’élaborer une version avec 12 items existants et 3 items inexistants par catégorie. Étant donné l’absence d’une procédure formelle de sélection des items, les moyennes, écarts types et tableaux de fréquences ont été examinés. Le principe de la sélection a été de retirer les items inexistants trop peu discriminants. Un équilibre était recherché entre les items afin que leur association produise un score de fausse alarme sensiblement identique en moyenne pour chacune des catégories. Pour les items existants, nous avons sélectionné des items très familiers (e.g. Robespierre), moyennement familiers (e.g. massacre de la Saint Barthélémy) et peu familiers (e.g. Henri Dunant) en nous basant sur les scores de DC.
Score de précision et de biais après sélection
7Le score moyen pour l’indice de précision (α = 0,75) a été de 0,26 (ET = 0,08). Le score moyen pour l’indice de biais (α = 0,92) a été de 0,55 (ET = 0,22). À noter que les scores de biais et de précision s’avéraient corrélés après sélection des items (r = 0,24 ; p < 0,05).
Analyse factorielle exploratoire
8Une analyse factorielle a été appliquée aux scores de biais par catégorie avec méthode d’extraction des axes principaux suivie d’une rotation oblique. Nous avons utilisé une analyse parallèle afin de déterminer le nombre de facteurs à conserver. Nous avons retenu une solution en un facteur expliquant 47 % de la variance, la saturation la plus faible ayant été de 0,71.
Discussion
9Bien qu’une méthode systématique de sélection des items soit nécessaire, les résultats obtenus n’en restent pas moins encourageants. Notre mesure a révélé une bonne consistance interne et une structure claire en un facteur avec des items fortement saturés par le facteur. La seconde étude devrait nous permettre de confirmer ces résultats et d’entreprendre le processus de validation du QFSC.
Étude 2
Méthode
Participants
10Quatre-vingts étudiants (67 femmes) en licence 1 de psychologie (âge moyen = 19,16 ans ; ET = 4,41).
Matériel et mesures
11Six mesures reconnues pour mesurer au moins en partie l’AV ont été utilisées. Nous avons employé une mesure de l’optimisme comparatif ou OC (α = 0,70), de l’effet meilleur que la moyenne ou MQM (α = 0,76), du narcissisme (Beck & Beck (1995), cités par Bouvard (2002), α = 0,65) et de l’autoduperie (DS-36, Tournois, Mesnil & Kop (2000), α = 0,70). Une mesure de l’hétéroduperie (DS-36) a été utilisée afin d’examiner la validité divergente (α = 0,78).
Résultats
Score de précision et de biais
12Le score moyen de l’indice de précision (α = 0,60) a été de 0,25 (ET = 0,08). Le score moyen pour l’indice de biais (α = 0,89) a été de 0,55 (ET = 0,19). Les scores de biais et de précision n’étaient pas significativement corrélés (r = - 0,08 ; p = 0,48).
Analyse factorielle confirmatoire
13Une analyse factorielle confirmatoire a été appliquée aux scores de biais des items du QFSC afin de vérifier la structure en un unique facteur. L’ajustement du modèle s’est révélé insuffisant : X2(35) = 66,93 ; p < 0,001 ; CFI = 0,91 ; RMSEA = 0,11 ; SRMR = 0,07.
14Un modèle post hoc alternatif auquel était ajouté une covariance entre les variances d’erreurs des scores observés pour les catégories sciences physiques et sciences de la vie a donné un meilleur ajustement : X2(34) = 52,6 ; p = 0,02 ; CFI = 0,95 ; RMSEA = 0,08 ; SRMR = 0,06. La consistance interne de notre mesure a été de 0,88.
Validité convergente
15Afin de tester le lien entre le biais et les autres mesures de l’AV tout en contrôlant la précision des individus, nous avons effectué une série de régressions multiples. Les variables indépendantes ont été les scores de biais et de précision du QFSC et les variables dépendantes chacun des scores aux mesures d’AV. Nous reportons ci-dessous les coefficients de régression standardisés (bz) issus de ces analyses.
16La mesure du biais des réponses a permis de prédire significativement le narcissisme (bz = 0,24 ; t (78) = 2,2 ; p < 0,05) et l’auto-duperie (bz = 0,23 ; t (78) = 2,02 ; et p < 0,05). La mesure du biais des réponses n’a permis que tendanciellement de prédire le MQM (bz = 0,19 ; t (78) = 1,71 ; p = 0,09) et n’a pas permis de prédire l’OC (bz = 0,03 ; t (78) = 0,28 ; p = 0,78).
17La mesure de la précision des réponses n’a pas été significativement reliée au narcissisme (bz = 0,02 ; t (78) = 0,18 ; p = 0,86), à l’autoduperie (bz = 0,08 ; t (78) = 0,70 ; p = 0,49), au MQM (bz = - 0,13 ; t (78) = - 1,13 ; p = 0,26) et à l’OC (bz = - 0,11 ; t (78) = - 0,94 ; p = 0,35).
Validité divergente
18Afin de tester l’absence de lien entre le biais et la mesure d’hétéroduperie tout en contrôlant la précision, nous avons effectué une régression multiple. La mesure du biais des réponses (bz = 0,18 ; t (78) = 1,61 ; p = 0,11) tout comme le score de précision (bz = 0,05 ; t (78) = 0,46 ; p = 0,65) n’a pas permis de prédire l’hétéroduperie.
Discussion / conclusion
19Les critiques des diverses mesures de l’AV nous ont conduits à entreprendre la validation du QFSC. La sélection des items nous a permis de construire des indices fiables et a révélé une structure en un facteur pour l’indice de biais (AV). L’absence d’une procédure formelle de sélection des items constitue néanmoins une faiblesse qu’il conviendrait de corriger. Les résultats de l’analyse factorielle confirmatoire ont été partiellement satisfaisants, le fait que l’ajustement du modèle soit amélioré par l’ajout d’une covariance entre deux erreurs n’étant pas attendu. Il est possible que cela traduise une spécificité de l’AV pour les matières dites des « sciences dures ». Il est aussi possible que les items inexistants utilisés pour ces deux catégories contiennent des propriétés plus similaires entre elles qu’avec les autres catégories. Cette question reste à étudier. Quant à la validité, la validité divergente a été satisfaisante mais les résultats concernant la validité convergente ont été mitigés. En effet, les liens postulés ont été retrouvés en partie significatifs, mais les tailles d’effets ont été faibles. Cela pourrait provenir du fait que l’AV mesurée par le QFSC serait spécifique aux domaines de la connaissance et de la compétence, contrairement aux mesures de narcissisme et d’autoduperie, plus générales. Cela pourrait aussi expliquer le très faible lien avec le MQM et l’absence de lien avec l’OC. Si l’on accepte cette hypothèse, il est possible d’envisager l’AV non pas comme une tendance globale, mais bien comme un phénomène dont la compréhension passerait nécessairement par l’étude des interactions entre domaines d’évaluations spécifiques et intérêts des individus.
20En conclusion, nous pensons que le processus de la validation du QFSC est bien initié. Il reste cependant à poursuivre ce travail, notamment par la confrontation avec d’autres échelles, ainsi qu’à mieux cerner la nature de l’AV mesurée par le QFSC.
Bibliographie
Références
Bouvard, M. (2002). Questionnaires et échelles d’évaluation de la personnalité. Paris : Masson.
Paulhus, D.L., & Harms, P.D. (2004). Measuring cognitive ability with the over-claiming technique. Intelligence, 32, 297-314.
Paulhus, D.L., Harms, P.D., Bruce, M.N., & Lysy, D.C. (2003). The over-claiming technique : Measuring self-enhancement independent of ability. Journal of Personality and Social Psychology, 84, 890-904.
Sedikides, C., & Strube, M.J. (1997). Self-evaluation : to thine own self be good, to thine own self be sure, to thine own self be true, and to thine own self be better. In M. P. Zanna (Ed.), Advances in experimental social psychology (Vol. 29, p. 209-269). New York : Academic Press.
Tournois, J., Mesnil, F. & Kop, J.-L. (2000). Autoduperie et hétéroduperie : Un instrument de mesure de la désirabilité sociale. Revue Européenne de Psychologie Appliquée, 50, 219-232.
Auteurs
florian.dufour@unige.ch
Faculté de Psychologie et des Sciences de l’Éducation, Université de Genève, Suisse.
Faculté de Psychologie, Formation universitaire à distance, Sierre, Suisse.
Laboratoire interuniversitaire de Psychologie, EA 4145, Université de Savoie, France.
olivier.desrichard@univ-savoie.fr
Laboratoire interuniversitaire de Psychologie, EA 4145, Université de Savoie, France.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Vive(nt) les différences
Psychologie différentielle fondamentale et applications
Pierre-Yves Gilles et Michèle Carlier (dir.)
2012
L’éducation thérapeutique du patient
Méthodologie du « diagnostic éducatif » au « projet personnalisé » partagés
Aline Morichaud
2014