Analyse différentielle des performances bayésiennes de collégiens et lycéens français
Apport d’une démarche transversale et longitudinale
p. 73-78
Texte intégral
Introduction
1Émettre des inférences bayésiennes, c’est-à-dire réviser son jugement quant à l’apparition d’un événement, et passer d’une probabilité a priori à une probabilité a posteriori est une activité quotidienne qui, en théorie requiert le théorème de Bayes. Toutefois, en pratique, l’être humain est sensible à différents biais et n’utilise pas toujours à bon escient les informations dont il dispose. Zhu & Gigerenzer (2006) ont montré qu’un contexte en fréquences naturelles favorisait davantage une révision de jugement qu’un contexte présenté en probabilités conditionnelles, les fréquences rendant explicite le taux de base (Hoffrage, Gigerenzer, Krauss & Martignon, 2002).
Théorème de Bayes
2L’utilisation de ce théorème permet d’obtenir la réponse correcte à un problème de probabilités conditionnelles. Par exemple, d’après cette formule, parmi les 60 personnes ayant des maux de tête, 42 vont souffrir d’un rhume (cf. Figure 1), soit 7 sur 10, ou 70 %. Le choix d’une stratégie est conditionné par l’utilisation de certaines données de l’énoncé. Ainsi, huit types de réponses sont décrits. Les différentes stratégies utilisées, et rangées par ordre de pertinence, sont les suivantes :
- Bayesienne : d/ (d+f) ⭢ jugement révisé
- Pré-Bayesienne : b/ (d+f) ⭢ surestimation de l’intersection des 2 événements positifs
- Fonction de vraisemblance : d/b ⭢ inversion des deux événements
- Apparition conjointe : d/a ⭢ ne considère que les événements positifs et ne tient pas compte de l’information non p (faux-positifs)
- Évidence : (d+f)/a ⭢ ne tient plus compte de la probabilité a priori mais uniquement de la nouvelle information
- Conservatisme : b/a ⭢ ne révise pas son jugement
- Aléatoire ⭢ aucune des stratégies précédentes
- Non réponse
3Sorel, Pennequin, et Fontaine (2010) ont préconisé une approche mixte (quantitative et qualitative) pour décrire le développement du raisonnement bayésien. En effet, leurs résultats montrent que le développement du raisonnement bayésien se fait dans un premier temps de façon qualitative, puis, dans un second temps, de façon quantitative : 1°) conformément au modèle en ondes qui se chevauchent de Siegler (2000), les participants abandonnent les stratégies les moins efficaces et utilisent des stratégies de plus en plus élaborées, sans pour autant donner les réponses bayésiennes ; 2°) ils répondent correctement à de plus en plus de problèmes présentés en fréquences naturelles. Le principal élément de discussion réfère à la difficulté intrinsèque de la formule de Bayes en probabilités conditionnelles.
4L’objectif de notre recherche est d’affiner la description du développement du raisonnement bayésien en appréhendant les performances heuristiques, à savoir la compréhension que le participant se fait du problème sans avoir à calculer la réponse. Nous avons donc dissocié les performances bayésiennes quantitatives (nombre de bonnes réponses), les performances bayésiennes qualitatives (stratégies utilisées) et les réponses bayésiennes heuristiques (estimations sur un continuum), cela pour des problèmes présentés en deux formats : probabilités conditionnelles et fréquences naturelles.
Méthode
Participants
5L’échantillon total est composé de 60 participants répartis en six groupes de dix élèves de la sixième à la première. Les participants ont été rencontrés deux fois, à dix-neuf mois d’intervalle. Lors de la première session, tous les participants ont été rencontrés en début d’année scolaire, tandis que lors de la seconde session, tous les participants ont été rencontrés en fin d’année scolaire. Ainsi, par exemple, un participant en début de classe de sixième lors de la session 1 est en fin de cinquième en session 2. Chaque groupe comporte autant de garçons que de filles.
Matériel
6Dix problèmes bayésiens équivalents ont été utilisés pour chaque participant : cinq en probabilités conditionnelles et cinq en fréquences naturelles. Pour chaque problème, les participants doivent placer une croix représentant leur estimation de la réponse sur un continuum, puis donner une réponse chiffrée (cf. Figure 2).
Exemple de problème sous les deux formats
Format probabiliste
7Dans un hôpital, 60 % des patients ont un rhume. Parmi ces 60 % de patients qui ont un rhume, 70 % ont des maux de tête. Parmi les 40 % de patients sans rhume, 30 % ont aussi des maux de tête. Tu rencontres les patients avec des maux de tête, quelle est la probabilité qu’une personne ait un rhume ?
Format fréquentiste
8Dans un hôpital, 60 des 100 patients ont un rhume. Parmi ces 60 patients qui ont un rhume, 42 ont des maux de tête. Parmi les 40 patients qui n’ont pas de rhume, 12 ont aussi des maux de tête. Tu rencontres les patients avec maux de tête, Combien d’entre eux ont un rhume ?…… sur……
9Les performances quantitatives correspondent au nombre de problèmes résolus, dont la solution donnée correspond à celle trouvée en utilisant le théorème de Bayes. Les performances qualitatives réfèrent aux différentes stratégies utilisées pour résoudre les problèmes. Enfin, les performances heuristiques sont évaluées sur un continuum. La borne de gauche signifie une fréquence naturelle de zéro sur un nombre quelconque ou une probabilité de 0 %, selon le format utilisé dans l’énoncé. La borne de droite signifie une fréquence de x / x (numérateur et dénominateur égaux), ou une probabilité de 100 %, selon que l’énoncé est fréquentiste ou probabiliste. Une croix au milieu équivaut à une probabilité de 50 %. Le continuum est utilisé comme une variable continue. La réponse bayésienne est calculée par nos soins et placée sur un continuum repère qui n’est pas présenté aux participants. La distance entre la croix théorique et la croix placée par les participants est mesurée (cf. Figure 2). Cette distance est utilisée comme mesure de la performance bayésienne intuitive des participants. Ainsi, plus la distance est petite, plus le participant s’approche d’un raisonnement bayésien.
Procédure
10Les participants doivent répondre aux cinq problèmes en probabilités conditionnelles puis aux cinq problèmes en fréquences naturelles de façon heuristique (placer une croix sur le continuum). Ensuite, ils doivent répondre aux mêmes problèmes contrebalancés de façon quantitative et qualitative (donner un chiffre).
Résultats
11Pour l’ensemble des résultats, les participants sont présentés selon leur classe lors de la première session. Par exemple, un participant de sixième à la première session apparaît dans le groupe des sixièmes, même s’il est en fin de cinquième à la session 2.
Analyses des performances quantitatives
12Lors de la première session, aucun problème en probabilités conditionnelles n’a été réussi. Lors de la seconde session, quatre participants ont correctement résolu les cinq problèmes proposés en probabilités conditionnelles. Un d’entre eux est un élève de première, et les trois autres sont des élèves de terminale. Ces quatre participants étaient tous bayésiens, c’est-à-dire répondaient de façon correcte à l’ensemble des problèmes, lors de la session 1 lorsque les problèmes étaient présentés en fréquences naturelles.
13Les participants donnent de plus en plus de réponses bayésiennes en fréquences naturelles avec l’avancée du niveau scolaire.
Analyses des performances qualitatives
14Avec l’avancée du niveau scolaire, les participants utilisent de moins en moins de stratégies différentes. Ces résultats vont dans le sens du modèle en ondes qui se chevauchent de Siegler (2000). Ceci se manifeste par une diminution de la variabilité intra-individuelle des stratégies utilisées.
Analyses des performances heuristiques
15Les participants ont toujours une croix plus éloignée de celle de la réponse correcte en probabilités conditionnelles qu’en fréquences naturelles. Avec l’avancée du niveau scolaire, les estimations des participants sont de moins en moins éloignées de la réponse bayésienne, et donc de plus en plus précises.
Discussion
16Les performances bayésiennes heuristiques s’améliorent avec l’augmentation du niveau scolaire, tant avec des problèmes présentés en probabilités conditionnelles qu’en fréquences naturelles. Les participants semblent donc être en mesure d’améliorer leur représentation du problème avant d’être réellement capables de le résoudre, tant en probabilités conditionnelles qu’en fréquences naturelles.
17Nous proposons un modèle du développement du raisonnement bayésien en quatre étapes :
- Diminution de la variabilité intra-individuelle : les participants utilisent de moins en moins de stratégies différentes et deviennent constants dans leur choix de stratégie.
- Sélection de stratégies plus élaborées au détriment de stratégies moins efficaces, conformément au modèle de Siegler (2000).
- Les participants affinent leur représentation du problème. Nous pensons qu’ils raisonnent davantage selon le système 1, intuitif, holistique et expérientiel (Epstein, 1998), dans le sens où ils n’améliorent ni leurs performances quantitatives, ni leurs performances qualitatives, mais uniquement leurs performances heuristiques, relatives à leur représentation du problème.
- Maîtrise d’un raisonnement bayésien, dans un premier temps pour les contextes fréquentistes et, dans un second temps, dans un contexte probabiliste. Les participants sollicitent le système 2, plus analytique et logique (Epstein, 1998).
Bibliographie
Des DOI sont automatiquement ajoutés aux références bibliographiques par Bilbo, l’outil d’annotation bibliographique d’OpenEdition. Ces références bibliographiques peuvent être téléchargées dans les formats APA, Chicago et MLA.
Format
- APA
- Chicago
- MLA
Références
Epstein, S., Lipson, A., Holstein, C., & Huh, E. (1992). Irrational reactions to negative outcomes : evidence for two conceptual systems. Journal of Personality and Social Psychology, 62, 328-339.
Hoffrage, U., Gigerenzer, G., Krauss, S., & Martignon, L. (2002). Representation facilitates reasoning : What natural frequencies are and what they are not. Cognition, 84, 343-352.
10.1111/1467-8624.00115 :Siegler, R.S. (2000). The rebirth of children’s learning. Child Development, 71, 26-35.
Sorel, O., Pennequin, V., & Fontaine, R. (2010). Effet facilitateur du format fréquentiste sur les performances bayésiennes de collégiens et lycéens français. In A. De Ribaupierre, P. Ghisletta, T. Lecerf, & J. L. Roulin, Identité et spécificités de la psychologie différentielle, (p. 129-134). Rennes : Presses Universitaires de Rennes.
10.1016/j.cognition.2004.12.003 :Zhu, L. & Gigerenzer, G. (2006). Children can solve Bayesian problems : The role of representation in mental computation. Cognition, 98, 287-308.
Auteurs
olivier.sorel@univ-tours.fr
Laboratoire EA 2114, Psychologie des Âges de la Vie, Université François Rabelais, Tours, France.
pennequin@univ-tours.fr
Laboratoire EA 2114, Psychologie des Âges de la Vie, Université François Rabelais, Tours, France.
rfontaine@univ-tours.fr
Laboratoire EA 2114, Psychologie des Âges de la Vie, Université François Rabelais, Tours, France.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Vive(nt) les différences
Psychologie différentielle fondamentale et applications
Pierre-Yves Gilles et Michèle Carlier (dir.)
2012
L’éducation thérapeutique du patient
Méthodologie du « diagnostic éducatif » au « projet personnalisé » partagés
Aline Morichaud
2014