Modèles pour données longitudinales
p. 285-308
Texte intégral
Introduction
1Le terme « longitudinal » renvoie à plusieurs concepts, selon la discipline ou sous-discipline considérée. Nous nous référons ici au chapitre précurseur à la naissance de la psychologie dite du développement « lifespan » de Baltes et Nesselroade (1979). Selon ces auteurs, le but principal de la méthodologie longitudinale est l’étude de phénomènes dans leur constance et changement à travers le temps. Cette définition, sciemment large, permet d’inclure de nombreuses études sous le terme longitudinal : des études de type panel de la sociologie, des mesures répétées liées à l’âge typiques dans la psychologie du développement, différentes formes d’études de cas uniques dans la psychologie cognitive de l’apprentissage, des séries temporelles de l’économétrie ou politologie, entre autres. Dans toutes ces disciplines, l’intérêt porte sur la stabilité et le changement ; on cherche à comprendre comment et pourquoi un phénomène est constant ou variable au cours du temps.
2Du point de vue méthodologique, toutes ces études longitudinales partagent la particularité que l’unité d’observation (le plus souvent, en psychologie, l’être humain) est observée au minimum deux fois dans le temps. Par conséquent, les variations dans le temps et les observations répétées sont nécessairement des aspects indispensables de la recherche longitudinale. Singer et Willett (2003) ajoutent deux points importants Premièrement, que le passage du temps soit conçu le long d’une métrique théoriquement significative. Autrement dit, que le temps ne soit pas uniquement échantillonné par des valeurs d’utilité pratique au chercheur, sans que ces valeurs ne correspondent à des moments importants du processus étudié. Dans l’idéal, les temps de mesure auront été échantillonnés avec le même soin que les personnes constituant l’échantillon de mesure. Ainsi, les valeurs de la variable temps auront une signification intrinsèque. Ou alors, l’analyse permettra de réorganiser la structure temporelle des données de telle sorte qu’il soit possible d’estimer une relation d’intérêt entre la variable étudiée 285 et le temps (nous en parlerons davantage par la suite). Deuxièmement, il est bien évidemment souhaitable que le processus étudié change d’une manière systématique, faute de quoi il est illusoire d’espérer qu’un modèle mathématique puisse décrire, voire prédire, le phénomène d’étude.
Les objectifs de la recherche longitudinale
3En plus de poser un cadre de discussion pour la recherche longitudinale, le chapitre de Baltes et Nesselroade (1979) explicite les objectifs clés de la recherche longitudinale. Les modèles pour données longitudinales dont nous discuterons devront ainsi expliciter des paramètres capables d’opérationnaliser ces objectifs.
Identification directe du changement intra-individuel
4Le premier objectif est l’identification directe du changement intraindividuel. Le terme de changement intra-individuel peut impliquer deux composantes majeures. Premièrement, il peut inclure le changement du niveau (ou fréquence, ou taux) de la même classe de comportement au travers le temps. Cette composante est probablement celle qui constitue le plus fréquemment le sujet des recherches portant sur le changement intra-individuel. La deuxième composante se réfère au changement inter-comportemental. Par exemple, un changement de l’agressivité à l’anxiété, ou d’une classe d’opérations cognitives à une autre, comme dans la conception piagétienne du développement. Ce premier objectif stipule que la seule manière d’identifier le changement intra-individuel est d’observer la même entité de façon répétée. Le seul écart possible à ce postulat implique de pouvoir disposer d’un ensemble d’entités parfaitement identiques, soumises aux mêmes conditions à travers le temps développemental, de sorte à pouvoir les remplacer sans aucune perte d’information. Évidemment, tant que l’entité nous concernant est l’être humain, cette condition ne sera pas respectée. Ainsi, toute étude se focalisant sur le changement intra-individuel n’utilisant pas la méthode longitudinale, par exemple la méthode transversale, devra se contenter d’approximations imparfaites. En effet, pour que le raccourci méthodologique transversal puisse remplacer la méthode longitudinale les conditions suivantes doivent être respectées : (1) les individus d’âge différents doivent provenir de la même population à leur naissance ; (2) il doit être possible d’apparier les sujets sur la base de leur âge ; (3) les sujets d’âges différents doivent avoir vécu des histoires de vie identiques. Par conséquent, la méthode transversale ne constitue pas une approche directe de l’étude du changement intra-individuel chez l’être humain.
Identification directe de différences (similarités) interindividuelles dans le changement intra-individuel
5Ce second objectif implique la comparaison de processus de changement pour des entités différentes dont le développement est étudié. La question centrale concerne le degré d’homogénéité dans le parcours du changement intraindividuel de différents individus. Dans cette perspective, l’évaluation de différences ou similarités dans le changement entre entités nécessite la quantification valable de changement longitudinal au niveau de l’analyse des entités. Ce n’est qu’après avoir satisfait le premier but, et avoir ainsi obtenu l’identification directe du changement intra-individuel, qu’il sera possible d’examiner les différences interindividuelles, en comparant, par exemple, les fonctions de croissance ou trajectoires de changement (taux, forme, timing) entre les individus. Ce but n’invalide pas du tout l’étude de cas unique. Au contraire, il serait souhaitable de pouvoir disposer de davantage d’études de cas unique, car elles permettent une plus fine compréhension du changement intra-individuel.
Analyse des interrelations dans le changement comportemental
6L’objectif est ici de représenter la constance et le changement de l’entité examinée dans plusieurs domaines, dans une perspective multivariée. Cela présuppose l’analyse précise de chaque comportement en relation avec le temps chez chacun des individus, surtout dans une approche holistique ou structuraliste de l’étude du développement. Néanmoins, sans devoir adopter une vision métathéorique, il est fort utile d’examiner le degré relatif de similarité intra-individuelle du processus de changement dans différents comportements pour affiner le processus inductif. Historiquement par exemple, il a été intéressant d’étudier le développement conjoint de la croissance physique et des capacités cognitives, ou des structures neurophysiologiques et des capacités perceptives et sensorielles. Seule la recherche longitudinale, impliquant des observations répétées de plusieurs comportements, peut fournir une base empirique directe pour élaborer des représentations multivariées des interrelations dans les changements de plusieurs comportements. Des observations statiques (transversales) ne contiennent pas de preuve directe des interrelations entre des changements comportementaux. Des observations multivariées obtenues dans des plans transversaux fournissent de l’information structurelle sur des ensembles de relations statiques de différences interindividuelles, mais n’en apportent pas sur les changements de ces relations. Souvent, la concentration conjointe sur plusieurs comportements est vue comme le précurseur d’analyse causale du changement, si ces comportements sont ordonnées dans le temps (l’un précède l’autre). Des changements séquentiels et systématiques dans des comportements distincts peuvent être vus comme des indices de changement précurseurs ou de liens de causalité entre comportements, ce qui nous amène au quatrième objectif.
Analyse des causes (déterminants) du changement intra-individuel
7Le changement intra-individuel s’étend dans le temps. L’explication d’un phénomène qui s’étend dans le temps exige d’établir des liens entre des variables de critère (outcome variables ou phénomènes conséquents) et des facteurs déterminants, qui eux aussi s’étendent dans le temps et qui, en tant qu’antécédents, précèdent le phénomène étudié. Ainsi, une approche ordonnée dans le temps dédiée à l’étude descriptive du changement doit être complétée par une étude des déterminants explicatifs. Ce raisonnement est valable également pour l’étude de la stabilité. Ces antécédents peuvent être internes ou externes à l’entité étudiée. Soulignons que la mesure d’antécédents temporels est une condition nécessaire, mais pas suffisante, à l’établissement d’inférences de type causal. L’approche longitudinale pour identifier des antécédents est d’autant plus importante que la conception théorique sur les déterminants du changement stipule que ces antécédents ont un impact direct et impliquent non seulement des influences proximales mais également distales. Dans ce cas, il se peut que l’on doive recourir à des méthodologies longitudinales plus élaborées que les simples mesures répétées, par exemple en adoptant des mesures décalées dans le temps (time-lagged measurements). De plus, l’analyse longitudinale des facteurs déterminants devient plus complexe lorsque l’on s’éloigne de paradigmes unidirectionnels, cumulatifs, et unifactoriels. Si, par exemple, le processus de causalité implique de la multidirectionnalité, de la discontinuité ou des ensembles de relations multivariées, il sera nécessaire d’implémenter des analyses longitudinales élaborées des déterminants comportementaux. En effet, il est possible que des causes multiples ne s’accumulent pas d’une façon additive, elles peuvent très bien opérer en synergie ou même en opposition. La reconnaissance de modèles pluralistes de causalité requiert que les décisions en rapport avec la méthodologie longitudinale soient accompagnées de considérations théoriques et de connaissances préalables sur le phénomène développemental étudié.
Analyse des causes (déterminants) des différences interindividuelles dans le changement intra-individuel
8Ce cinquième objectif est lié au simple fait que les causes du changement intra-individuel peuvent varier en fonction des entités d’intérêt. La compréhension des causes des différences interindividuelles exige la disponibilité d’explications précises de la situation causale de chaque entité de comparaison. Bien qu’un processus de changement intra-individuel d’un comportement donné, comme l’augmentation avec l’âge du score sur un trait de personnalité, puisse suivre une évolution identique chez plusieurs individus, ce processus de changement n’est pas forcément le résultat des mêmes déterminants. Pour clarifier une telle situation, il est nécessaire de disposer de relations antécédent-conséquent pour chacun des individus étudiés. Par conséquent, les comportements de chaque individu doivent être observés et analysés longitudinalement. Il est aussi raisonnable de supposer que de telles différences interindividuelles dans les changements intra-individuels sont issues de différentes influences causales. Ces différences peuvent émerger de variations dans l’intensité ou dans le timing du même processus causal, comme de différences plus importantes du processus causal.
9L’analyse des objectifs de la recherche longitudinale nous a guidés dans le choix des modèles à discuter dans ce chapitre. Évidemment, une classe très large de modèles pourrait faire l’objet d’une discussion ici, car beaucoup de modèles mathématiques sont à la disposition des chercheurs qui étudient le changement intra-individuel. Plusieurs livres de référence existent à ce sujet. Nous nous limitons ici à un choix, forcément subjectif, d’ouvrages didactiques traitant, dans leur ensemble, des modèles majeurs dans la littérature empirique sur la méthodologie longitudinale (et provenant de plusieurs disciplines empiriques telles que la psychologie, la biologie, les sciences forestières, la zoologie, l’économétrie, etc.) : Collins & Horn, 1991 ; Collins & Sayer, 2001 ; Davidian & Giltinan, 1995 ; Diggle, Liang & Zeger, 1994 ; Fitzmaurice, Davidian, Verbeke & Molenberghs, 2009 ; Motulsky & Christopoulos, 2003 ; Skrondal & Rabe-Hesketh, 2004 ; Verbeke & Molenberghs, 2000 ; Verbeke, Davidian, Fitzmaurice & Molenberghs, 2008 ; Vonesh & Chinchilli, 1997 ; Walls & Schafer, 2006.
10Les modèles que nous discuterons ici sont ceux qui, à notre avis, se prêtent bien à plusieurs situations empiriques typiquement rencontrées dans beaucoup de domaines de la psychologie, à savoir : (a) une taille d’échantillon relativement modeste (autour d’une centaine, voire bien moins dans des situations expérimentales) ; (b) un nombre réduit de mesures répétées (souvent entre deux et six, rarement plus de dix, sauf, encore une fois, dans certaines situations expérimentales) ; (c) la présence de plusieurs variables censées mesurer le même construit psychologique (par ex., questionnaires ou plusieurs tâches portant sur la même capacité).
Le modèle des scores latents de changements (MSLC)
11Nous commençons par la situation minimaliste qui peut, selon la discussion de Baltes et Nesselroade (1987), être qualifiée de longitudinale : un échantillon mesuré sur la même variable à deux temps de mesure. Comme nous le verrons, cette situation a priori peu gratifiante, peut révéler, si elle est analysée d’une façon appropriée, plusieurs facettes intéressantes d’un processus de changement. Pour faciliter la communication nous utilisons les diagrammes issus des modèles à équations structurales (MES), qui, avec leurs règles de cheminement (Wright, 1918, 1934), permettent l’explicitation des calculs des espérances statistiques des variables du modèle représenté.
Le MSLC appliqué à une variable manifeste
12La figure 1 représente le Modèle à scores latents de changement (MSLC ; Latent change score model), élaboré par McArdle et Nesselroade (1994 ; 2003 ; voir également McArdle, 2009). Cette situation sert d’introduction didactique à la situation multivariée qui suit, mais n’est pas per se utile. Imaginons une variable Y mesurée à deux temps de mesure, Y0 et Y1. L’approche intuitive pour parler de changement dans cette situation minimaliste consiste à calculer le score de différence Δ = Y1 – Y0. Nous pourrons ainsi estimer des caractéristiques liées au changement pour chaque personne, c’est-à-dire des caractéristiques du changement intra-individuel. Plutôt que de calculer ce score de différence, qui est latent dans le sens où il n’a pas été directement mesuré, nous pouvons estimer les paramètres du MSLC représentés sur la figure 1. Ici, les variables manifestes qui ont véritablement été mesurées sont représentées par des carrés ou rectangles, tandis que les variables latentes (une seule dans ce modèle) sont représentées par des cercles ou des ellipses. Les flèches à une pointe représentent des effets directionnels, celles à deux pointes des effets nondirectionnels. Les flèches marquées par un chiffre (comme par exemple celle entre Y0 et Y1 marquée par un 1) représentent des paramètres qui ne sont pas estimés durant l’optimisation mais qui sont plutôt fixés aux valeurs spécifiées. Ainsi, les deux flèches à une pointe marquées par un 1 entre Y0 et Y1 et entre ΔY et Y1 représentent des poids de régression de valeur 1 dans la régression de Y1 sur ΔY. On peut en déduire l’équation structurale suivante concernant Y1, pour l’individu i :
13Y1i = 1* Y0i + 1*ΔYi = Y0i + ΔYi,
14ce qui implique que
15ΔYi = Y1i – Y0i
16Par conséquent, ΔY représente véritablement la différence (changement intra-individuel) en Y entre les deux temps de mesure. Notons également que le modèle stipule que Y0 et ΔY sont deux variables indépendantes, dont la variance σ2Y0 et σ2ΔY, respectivement, ne dépendent pas d’autres variables. La covariance entre les deux variables est représentée par la flèche à deux têtes indiquée par σY0,ΔY. Enfin, les moyennes du score initial et du changement sont représentées par les flèches à une tête provenant du triangle indiqué par1 et marquées par µY0 et µΔY, respectivement. Ce MES n’a pas pour tâche comme la grande majorité des MES, de reproduire la structure (variances, covariances, et éventuellement moyennes) des variables examinées avec précision et parcimonie, car ce modèle n’a aucune parcimonie et est exact dans sa prédiction de la structure des données. En fait, ce modèle épuise tous les éléments d’information disponibles pour l’analyse (5 : la moyenne et la variance de Y0 et de Y1, ainsi que leur covariance) afin d’estimer les paramètres portant sur le score initial Y0 et le score de changement ΔY de chaque entité analysée (5 : leur moyenne et variance ainsi que leur covariance). En effet, la moyenne de Y1 est prédite dans ce modèle uniquement par Y0 et ΔY :1*µY0 +1* µΔY. De manière similaire, la variance de Y1 est prédite uniquement par Y0 et ΔY :12*σ2Y0 + 12*σ2Y1 + 2*σY0,ΔY (ces prédictions peuvent être facilement dérivées en appliquant à la figure1 les règles de cheminement de Wright, 1918, 1934).
Le MSLC appliqué à une variable latente
17Le MSLC appliqué à une variable manifeste n’a aucune utilisation pratique pour le chercheur, qui, pour estimer les paramètres du modèle, aurait simplement pu calculer la différence entre Y1 et Y0, et calculer ensuite la moyenne et variance de ce score, ainsi que sa covariance avec Y0 de façon habituelle. Le modèle devient véritablement intéressant lorsqu’une variable latente, définie comme un facteur commun à plusieurs variables manifestes, est spécifiée aux deux temps de mesures. Cette situation est fréquente, par exemple, quand on administre un questionnaire portant sur une dimension, ou plusieurs tâches portant sur la même capacité. Imaginons, comme représenté dans la figure 2, un facteur commun f sous-jacent aux scores manifestes X, Y, Z, W aux temps t=0 et t=1. Les quatre variables manifestes sont en lien avec le facteur commun par le biais des poids de régression les unissant, qui s’appellent, dans ce cas particulier, des saturations. Ces coefficients sont estimés pour toutes les variables sauf une, que l’on appelle communément marqueur ou variable d’ancrage (ici X). Cette opération technique est indispensable pour identifier la variable latente, c’est-à-dire pour spécifier la métrique de mesure du facteur, qui correspondra à la métrique de la variable d’ancrage (par conséquent, en connaissant l’échelle de mesure de X on pourra interpréter des scores factoriels de f ; Bollen, 1989). À noter que pour s’assurer que la signification du facteur commun ne change pas dans le temps, il est nécessaire d’imposer que les saturations soient identiques dans le temps (d’où l’absence des sous-indices 0 ou 1 aux coefficients λY, λZ, λW). Cette contrainte d’égalité des saturations dans le temps s’appelle l’invariance métrique temporelle (Meredith, 1964).
18Techniquement, la variance du facteur commun est définie par les covariances entre les variables manifestes, ce qui signifie que la variance totale de chaque variable manifeste est scindée en deux parties : la partie commune « expliquée » par le facteur commun et la partie unique, ou résiduelle, de chaque variable manifeste. En termes d’interprétation, on peut imaginer quatre questions portant sur l’efficacité de soi, dont chacune se focalise sur une manifestation particulière (sociale, cognitive, spirituelle, physique). Alors que naturellement les réponses aux quatre questions devraient corréler positivement entre elles, la concordance ne sera pas parfaite. Ainsi, la réponse à chaque question sera le fruit d’un score général d’efficacité de soi (le facteur commun f), mais également de l’influence particulière due au domaine questionné. Ces particularités sont représentées par les résidus, eux aussi des variables latentes, nommés r. Théoriquement, ces résidus contiennent également l’erreur de mesure due au fait que n’importe quel attribut est mesuré avec une certaine erreur (que l’on espère la moindre possible). Ainsi, la variance totale d’une variable manifeste, selon le modèle en facteur commun, est la somme pondérée de la variance commune et de la variance résiduelle. Par exemple, la variance totale de Y0 est égale à λY2*σ2f0 + σ2Y0. Si l’on admet une systématicité de la variance résiduelle de chaque variable manifeste à chaque temps de mesure, il est souhaitable de laisser corréler ces variances résiduelles dans le temps, mais seulement pour une même variable (par exemple, pour la variable Y, σY0,Y1).
19Une fois que le modèle en facteur commun est défini aux deux temps de mesure, on peut imposer aux facteurs la même structure que celle du MSLC, et définir ainsi le score latent de changement entre ces derniers, indiqué par Δf. On notera ainsi immédiatement la similarité entre les Figures 1 et 2 quant à la partie centrale des modèles. Comme dans le cas du MSLC appliqué à une seule variable manifeste, on pourra estimer la moyenne et la variance du facteur au temps initial (µf0 et σ2f0) et du changement (µΔf et σ2Δf) dans le facteur, ainsi que leur covariance (σf0,Δf).
20Ces paramètres permettent déjà de satisfaire les deux premiers objectifs de la recherche longitudinale énoncés par Baltes et Nesselroade (1979). Le paramètre µΔf porte ainsi directement sur le changement intra-individuel au niveau de l’échantillon. Si ce paramètre n’est pas statistiquement différent de zéro cela signifie qu’en moyenne (au niveau de l’échantillon) il n’y a pas de changement. Encore plus intéressant dans l’analyse des différences interindividuelles dans le changement intra-individuel est le paramètre σ2Δf, qui représente la variabilité entre les entités analysées dans le changement intra-individuel. Si ce paramètre est statistiquement différent de zéro cela signifie que le changement moyen (µΔf) ne s’applique pas à chaque individu. Différents scénarii sont ainsi possibles : du changement moyen et de la variabilité dans le changement (µΔf et σ2Δf sont différents de zéro), pas de changement moyen ni de variabilité dans le changement (ni µΔf ni σ2Δf ne sont significatifs, ce qui laisse conclure qu’aucune entité n’a subi de changement intra-individuel), du changement moyen mais pas de variabilité dans ce changement (µΔf est différent de zéro mais σ2Δf ne l’est pas, donc chaque entité change de la même quantité), et encore pas de changement moyen mais de la variabilité dans le changement (µΔf n’est pas différent de zéro alors que σ2Δf est statistiquement significatif ; dans ce cas, en moyenne on n’observe pas de changement intra-individuel, mais il existe des entités qui changent dans le temps). Il est très important de souligner que ces deux paramètres doivent être considérés comme indépendants l’un de l’autre. Trop souvent on présuppose que l’évidence du changement doive exister au niveau général, moyen, de l’échantillon, et au niveau individuel, des entités de l’échantillon, alors que les quatre scenarii sont admissibles.
21Le paramètre σ2Δf revêt un rôle particulièrement intéressant dans moult applications de ce modèle. En effet, souvent la question théorique subsidiaire à l’existence de changement intra-individuel porte sur la prédiction de ce dernier. Qui profite au mieux d’un traitement ? Qui améliore le plus sa performance suite à un entraînement spécifique ? Pour qui les performances cognitives se détériorent-elles le plus suite à un accident vasculaire cérébral ? Si la variabilité dans le changement intra-individuel existe (si σ2Δf est significatif), on pourra prédire cette variabilité. Le MSLC pourra être étendu pour inclure un prédicteur des différences interindividuelles dans le changement intra-individuel, et probablement aussi des différences interindividuelles dans les scores initiaux. Cette extension satisfait le cinquième objectif de la recherche longitudinale de Baltes et Nesselroade (1979). On pourra ainsi identifier des déterminants des différences interindividuelles dans le changement intra-individuel on ajoutant un prédicteur invariant dans le temps. Le quatrième objectif, qui porte sur l’identification des déterminants du changement intra-individuel, peut être atteint dans ce modèle de deux manières. Premièrement, en testant l’effet d’un prédicteur qui varie dans le temps et qui se déroule en parallèle à la variable d’intérêt entre le temps 0 et le temps 1. Ainsi, en comparant les paramètres µΔf et σ2Δf avant et après l’insertion de ce prédicteur, il est possible de comprendre l’effet de ce dernier sur le processus de changement. La deuxième manière consiste à tester l’effet d’un prédicteur ou processus temporellement antécédent à celui considéré, ce qui le plus souvent amène à une extension multivariée du MSLC.
22L’extension multivariée du MSLC est directe. Considérons un deuxième processus concernant la variable latente g, lui aussi mesuré à seulement deux temps de mesure, qui soit se déroule en parallèle à celui mesuré par les variables X, Y, Z, W, donc aussi aux temps 0 et 1, soit est antécédent, mesuré à deux temps de mesures antérieurs à 0 et 1. Ce deuxième processus peut lui aussi faire l’objet d’application d’un MSLC, pour ainsi définir deux variables latentes d’intérêt, les scores factoriels au temps t, gt et les scores latents de changement Δg. Ces derniers pourront ainsi soit corréler avec f0 et Δf, si les indicateurs de f et g sont mesurés aux mêmes temps de mesure, soit les prédire, si les indicateurs de g ont été mesurés avant ceux de f et que cette relation est théoriquement plausible.
23Comme illustration considérons le travail de Raz, Lindenberger, Ghisletta, Rodrigue, Kennedy, et Acker (2008). Dans ce travail les auteurs ont analysé, chez 87 adultes âgés entre 20 et 77 ans au début de l’étude, le volume de douze régions cérébrales et la performance cognitive à des tâches d’intelligence fluide. Les variables ont été mesurées à deux reprises, à cinq ans d’écart. L’analyse a consisté à appliquer un MSLC pour étudier le processus du changement de volume cérébral et un MSLC pour le changement de performance cognitive. Comme les deux processus ont été mesurés en parallèle, l’extension bivariée spécifiée pour chaque région cérébrale a permis au facteur indiquant le volume initial (marqué par les deux mesures hémisphériques), celui indiquant l’intelligence fluide initiale et les deux facteurs de changement de corréler. Les résultats ont indiqué que, surtout pour les régions frontales, les personnes ayant subi un rétrécissement naturel plus marqué du volume cérébral avaient tendance à plus décliner dans leur performance fluide que les individus avec un volume cérébral plus stable.
24Si le processus d’investigation est mesuré plus que deux fois et si l’on suppose que ce processus est irrégulier, le MSLC peut être étendu pour inclure des mesures additionnelles. Par exemple, si on étudie l’effet d’un traitement on est souvent intéressé par la comparaison entre une mesure pré-traitement à t=0 et une mesure post-traitement à t=1. Souvent on ajoutera aussi une deuxième évaluation post-traitement à t=2, plusieurs semaines, mois ou années plus tard, pour évaluer si l’effet du traitement est maintenu à long terme. Dans cette situation il n’est pas plausible de considérer le processus de changement comme régulier, car le traitement n’a duré que jusqu’à t=1, et pas jusqu’à t=2. Il est possible dans ce genre de situation de définir deux scores latents de changement, le premier entre t=0 et t=1 (qui définit Δ0-1 = Y1 – Y0), le deuxième entre t=1 et t=2 (définissant Δ1-2 = Y2 – Y1). On pourra ainsi estimer le score moyen à t=0 et la moyenne de Δ0-1 et de Δ1-2, ainsi que les trois variances et les trois covariances. Si, par contre, un processus est mesuré plus de deux fois et que l’on suppose qu’il est régulier, on pourra étendre le MSLC afin d’obtenir le modèle de courbe latente.
Le modèle de courbe latente (MCL)
25Le modèle de courbe latente (MCL ; McArdle & Epstein, 1987 ; Meredith & Tisak, 1990) est un type de modèle plus avancé qui permet la modélisation du changement au travers de nombreux temps de mesure (au moins trois). Ce modèle peut être considéré dans le cadre des MES ou dans le cadre des modèles multi-niveaux (MMN), parfois appelés aussi modèles hiérarchiques, modèles mixtes ou modèles à effets aléatoires (Laird & Ware, 1982 ; Bryk & Raudenbush, 1987). Pour des références en français, voir Marivain (2003) pour l’approche MES et Courgeau et Baccaïni (1997) pour l’approche MMN.
26Dans cette partie, nous commencerons avec une description simple de l’utilité et des questions auxquelles le MCL peut permettre de répondre. Avec ces premières notions en tête, nous aborderons ensuite les aspects plus techniques de ce modèle, d’abord dans le cadre des MES, puis dans le cadre des MMN. Enfin, nous verrons un exemple détaillé d’application de ce modèle, ainsi que plusieurs extensions possibles. Tout au long de cette section, et en particulier dans l’exemple, nous nous attacherons également à mettre en relation les paramètres estimés par le MCL avec les cinq objectifs de la recherche longitudinale introduits au début de ce chapitre.
Principes de base et paramètres clés
27Le MCL peut d’abord être vu comme une généralisation du MSLC discuté ci-dessus. Il s’agit donc toujours de modéliser le changement d’une variable quantitative continue. Toutefois, du point de vue de la structure des données, nous aurons maintenant au moins trois temps de mesure (et même souvent plus) au lieu de simplement deux. L’idée de base va donc être d’estimer des paramètres relatifs au changement au travers de nombreux temps de mesure, plutôt qu’une seule différence entre un premier temps de mesure et un second.
28Prenons l’exemple (artificiellement simplifié ici) de la croissance des enfants. Si on étudie ce phénomène avec un modèle de différence, on pourrait mesurer deux fois un échantillon d’enfants, disons à un an d’intervalle. Imaginons qu’au premier temps de mesure, leur taille moyenne soit de 140 cm et de 145 cm au deuxième temps de mesure. La différence moyenne est donc de 5 cm. Si on généralise maintenant à trois temps de mesure, avec le même intervalle de un an entre chaque mesure, on pourrait avoir le cas de figure suivant : 140 cm la première année, 145 la deuxième, 150 la troisième. Dans ce cas de figure, la croissance est toujours de 5 cm ; chaque année, les enfants grandissent de 5 cm. Grâce aux trois temps de mesure et à la régularité de la croissance de 5 cm observée au travers de ces derniers, on a plus d’information sur la nature de ce changement, qui est ici linéaire (bien évidemment la croissance physique n’est pas un phénomène linéaire). Comme nous le verrons, des extensions du MCL permettent d’implémenter des fonctions mathématiques plus complexes, comme la fonction logistique triple (Bock & Thissen, 1976 ; Ghisletta & McArdle, 2001) pour mieux modéliser la croissance physique humaine.
29À travers cette modélisation de nombreux temps de mesure, le MCL permet de répondre à plusieurs questions qui sont au cœur de la recherche longitudinale. Existe-il un changement (linéaire) moyen ? Ce changement est-il le même pour tous les individus ? Pour aller plus loin, des applications plus avancées du MCL permettent d’investiguer ces questions plus en profondeur : Le changement est-il vraiment linéaire ? Est-il associé à d’autres caractéristiques individuelles ? Ou alors à d’autres phénomènes qui changent eux aussi ? Ces questions correspondent à des paramètres spécifiques qui peuvent être estimés par le MCL et ses extensions, que nous allons maintenant considérer en détails.
Approche en modèle à équations structurales
30Dans la perspective des MES, le MCL avec changement linéaire donne lieu à l’estimation de deux facteurs. Comme représenté sur la figure 3, et comme dans tout modèle en facteur commun, les deux facteurs sont extraits à partir des variables observées, qui sont ici le même phénomène observé de manière répétée. Dans la figure 3 nous avons cinq variables observées (Y0 à Y0), donc un phénomène qui a été mesuré cinq fois. L’extraction des deux variables latentes propres au MCL se fait grâce à une spécification particulière des saturations. Ces deux variables latentes permettent de distinguer la partie constante et le changement.
31Le facteur d’Intercept ou ordonnée à l’origine (I dans la figure, appelé aussi parfois Niveau) est spécifié en fixant toutes ses saturations à 1. Ce facteur représente le score au temps 0, celui qui correspond au moment de la première mesure. La moyenne de ce facteur (µI) correspond au niveau moyen de l’échantillon ; la variance (σ2I) correspond aux différences interindividuelles autour de ce niveau moyen. Si l’on reprend l’exemple des enfants utilisé ci-dessus, la moyenne de l’Intercept est 140. La variance pourrait être plus ou moins importante selon que la taille des enfants diffère beaucoup ou non. Dans un cas extrême, si tous les enfants font la même taille lors de la première mesure, cette variance est de 0 ; à l’inverse, si les différences de taille entre les enfants sont importantes, la variance estimée par le modèle sera grande.
32Le second facteur est celui de la Pente (P dans la figure, appelé aussi Changement). Ce facteur est généralement estimé en fixant les saturations de façon à rendre compte de l’influence du temps sur Y, c’est-à-dire en leur imposant des valeurs qui correspondent aux différents temps de mesure. Dans le cas du changement linéaire, le vecteur Bt qui définit ses saturations en fonction du temps t sera [0,1,2,3,4].
33Cette Pente représente la quantité de changement que l’on observe sur Y pour une augmentation d’une unité de temps. Cette spécification est linéaire du fait des chiffres 0, 1, 2, 3 et 4 pour les mêmes valeurs de t, spécification qui implique que l’intervalle de temps entre tous les temps de mesure est constant (nous verrons plus loin que d’autres spécifications de ces saturations permettent de tester des effets non-linéaires.) Comme pour l’Intercept, ce facteur Pente a une moyenne et une variance. La moyenne (µP) représente le changement moyen au travers de tout l’échantillon ; elle correspond à l’identification directe du changement intra-individuel. Dans notre exemple des enfants, cela correspond à l’incrément moyen de 5 cm observé chaque année. La variance de cette Pente (σ2P) représente la variabilité de ce changement et renvoie donc à l’identification directe de différences (similarités) interindividuelles dans le changement intra-individuel. Si ces différences sont très faibles, la variance sera quasi nulle ; on pourra conclure que tous les individus changent globalement d’une façon très similaire. S’il y a beaucoup de différences, par exemple si certains individus changent beaucoup et d’autres très peu, cette variance sera importante. Comme pour le MSLC les paramètres de moyenne et de variance de l’Intercept et de la Pente doivent être considérés comme indépendants et, de ce fait, testés indépendamment l’un de l’autre.
34Un autre paramètre d’intérêt est naturellement la covariance entre l’Intercept et la Pente (σI,P). Ce paramètre représente la relation qui peut exister entre le niveau de départ et la quantité de changement subséquente. Pour illustrer les deux cas typiques où cette corrélation est non nulle, prenons une dernière fois l’exemple des enfants. Premier cas : ceux qui sont les plus grands au premier temps de mesure sont aussi ceux qui ont tendance à grandir le plus par la suite ; la covariance sera alors positive. Deuxième cas : à l’inverse, ce sont les plus petits qui grandissent le plus vite ; la covariance sera alors négative.
35Enfin, le dernier paramètre du MCL est celui qui correspond aux résidus (r0 à r4). Sur la figure 3, comme c’est le cas dans les applications courantes, il n’y a qu’un seul paramètre concernant les résidus, à savoir leur variance (σ2r), ce qui présuppose que la variance résiduelle est toujours la même au fil du temps.
36Nous pouvons maintenant expliciter les prédictions du MCL, toujours en suivant les règles de Wright (1918, 1934), pour voir comment, selon le modèle, l’Intercept et la Pente influencent les variables manifestes représentant les mesures répétées. En général :
37Yti = 1*Ii + Bt*Pi + rti,
38ce qui donne, à chaque temps de mesure t = 0,1,2,3,4,
39Y0i = 1*Ii + 0*Pi + r0i =Ii + r0i
40Y1i = 1*Ii + 1*Pi + r1i =Ii + Pi + r1i
41Y2i = 1*Ii + 2*Pi + r2i =Ii + 2*Pi + r2i
42Y3i = 1*Ii + 3*Pi + r3i =Ii + 3*Pi + r3i
43Y4i = 1*Ii + 4*Pi + r4i =Ii + 4*Pi + r4i
Approche en modèles multi-niveaux
44À certains égards, l’approche MNN est comparable à l’approche en MES. En fait, les paramètres classiques du MCL peuvent être estimés de manière strictement équivalente dans les deux approches sous certaines conditions. Malgré cette équivalence, nous avons jugé utile de présenter l’une et l’autre approche pour deux raisons. D’abord pour une raison très terre à terre : le fait que certains logiciels d’usage courant favorisent une approche plutôt que l’autre (voir à la fin du chapitre pour plus de détail sur les logiciels). L’autre raison est qu’il existe des possibilités d’applications avancées différentes dans l’une ou l’autre approche, ce que nous verrons plus en détail dans la section suivante.
45Au-delà des similitudes pouvant être mises en évidence, les objectifs de base des MNN sont, d’une manière générale, assez différents de ceux des MES. Alors que les MES se distinguent par leur conceptualisation de variables latentes, les MMN reconnaissent que souvent les données sont groupées, par exemple des élèves dans des classes, des ménages dans des voisinages, etc. On parle également de hiérarchie des données en ce sens qu’elles se situent sur différents niveaux4. Dans le cas des mesures répétées, nous pouvons considérer deux niveaux : le niveau 1, qui est celui des temps de mesure (les valeurs de t pour Yti), et le niveau 2, qui est celui des individus (les valeurs de i pour Yti). L’implication de cette façon de modéliser est qu’il y aura deux jeux d’équations, un pour chaque niveau. Une autre distinction, qui s’applique aux deux niveaux, est celle entre effets fixes et aléatoires. Les effets fixes correspondent aux effets moyens, qui ne changent pas entre les entités d’un niveau ; les effets aléatoires, par contre, changent entre les entités d’un niveau. Les effets fixes sont associés à des covariées qui ne se généralisent pas à d’autres valeurs que celles mesurées dans l’échantillon, tandis que les effets aléatoires sont associés à des covariées généralisables à des valeurs autres que celles de l’échantillon.
46Formellement, au niveau 1 l’équation est la suivante :
47Yti = β0i + β1i*tempsti + eti
48Dans cette équation, les Yti représentent toutes les mesures (le suffixe i renvoie aux individus et le t aux temps de mesure). Le paramètre β0i est l’intercept (score moyen à t0) et correspond à la variable latente Intercept dans les MES ; le paramètre β1i est l’effet moyen du temps et correspond à la variable latente Pente dans les MES. Le temps est représenté par les tempsti ; il peut s’agir simplement des temps de mesure comme nous l’avons vu dans le cadre des MES ou d’un autre indicateur de temps, comme l’âge. Enfin, les eti correspondent aux résidus dans les MES.
49Au niveau 2, on spécifie les deux équations suivantes :
50β0i = γ00 + u0i
51β1i = γ10 + u1i
52Ces équations décomposent l’estimation de l’intercept (β0i) et la pente (β1i), qui figurent tous deux dans l’équation de niveau 1. Le paramètre de l’effet fixe γ00 représente l’intercept moyen (score moyen du groupe à t0) et est équivalent à µI ; le u0i représente les effets aléatoires de β0i, qui estime la variabilité individuelle autour de cet intercept et est équivalent à σ2I. Le paramètre de l’effet fixe γ10 représente la pente moyenne (changement moyen au niveau du groupe) et est équivalent à µP ; enfin, le u1i représente les effets aléatoires de β1i, qui estime la variabilité individuelle autour de cette pente et est équivalent à σ2P. À noter que pour les effets aléatoires on n’obtient pas la valeur individuelle de chaque unité d’analyse, mais plutôt une estimation de la variance globale. Ainsi, on n’obtiendra pas une valeur u1i pour chaque individu i, mais plutôt leur variance σ2P.
53En résumé, les effets fixes en MNN correspondent aux moyennes des variables latentes en MES ; ces effets résument la prédiction du groupe et permettent l’identification du changement intra-individuel moyen au travers de plusieurs personnes. Les effets aléatoires correspondent aux variances des variables latentes ; ces effets rendent compte des différences entre les individus, c’est-à-dire les différences interindividuelles dans le changement intra-individuel.
Comparaison entre approches MES et MMN
54Bien que le MCL soit souvent présenté comme équivalent dans les MES et les MMN, il existe des différences importantes, surtout d’implémentation, entre les deux approches. Nous nous limitons ici à un bref résumé de ces points ; pour une comparaison plus approfondie, voir par exemple Ghisletta et Lindenberger (2004) ou Hox et Stoel (2005). (Pour un résumé des aspects techniques liés aux logiciels, voir la fin du chapitre.)
55Commençons par les avantages de l’approche MES sur l’approche MMN. Premièrement, nous avons vu que la variance résiduelle (σ2r dans les MES, σ2e dans les MMN) est souvent spécifiée comme étant constante au travers le temps. Dans le cadre de MES, cette contrainte peut être facilement relâchée, alors que dans les MMN seulement un nombre limité de structures préétablies des résidus peut être implémenté. Pour des variations intéressantes de la structure des résidus dans les MES voir, par exemple, Curran et Bollen (2001). Deuxièmement, dans les MES il est possible d’estimer les saturations Bt du facteur de Pente, et donc d’inférer la forme du changement à partir des données, plutôt que d’imposer une forme prédéfinie (par exemple linaire, polynomiale, exponentielle), comme le requiert l’approche MMN. Il faut néanmoins fixer deux saturations de la Pente pour estimer correctement le modèle (Ghisletta & McArdle, 2001). Troisièmement, les MES permettent d’étudier le changement non pas uniquement de variables manifestes, comme présenté ici, mais également de variables latentes, elles-mêmes définies par plusieurs variables manifestes. Il est ainsi possible d’étudier, par exemple, le changement dans la conception de l’image de soi, construit mesuré avec un questionnaire et défini comme variable latente (Ghisletta & Trickett, 2007). Quatrièmement, dans des extensions multivariées, si par exemple on étudie le changement de deux processus, il est possible dans les MES de spécifier les propriétés saillantes d’un processus comme antécédents et celles d’un autre processus comme conséquents c’est-à-dire d’analyser des interrelations dans le changement comportemental. On pourra ainsi estimer, par exemple, comment l’Intercept et la Pente d’un premier processus d’entraînement mnésique de quelques minutes peuvent influencer la perte de mémoire vérifiée sur une durée de plusieurs années. Dans les MMN ces relations se limitent à des simples covariances.
56L’approche MMN a elle aussi ses avantages spécifiques. Ces modèles permettent en particulier de mieux gérer les cas où il y a beaucoup de données manquantes. De prime abord, ceci peut paraître réservé à des usages très particuliers, mais en fait ce cas de figure est très fréquent. Un cas typique est celui de la modélisation du changement en fonction de la variable âge. Dans les applications de ce type, on veut généralement modéliser le temps en utilisant cette variable âge plutôt que les temps de mesure comme nous l’avons vu jusqu’ici (i. e., saturations du facteur Pente ci-dessus fixées à 0,1,2,3,4). Or, dans cette perspective il est fréquent que les individus de l’échantillon ne soient pas mesurés aux mêmes âges. Par exemple, on pourrait avoir un cas où l’étendue d’âge de l’échantillon va de 7 à 13 ans et où chaque personne a été mesurée trois fois, disons à deux ans d’intervalle. On obtiendrait ainsi une base de données qui ressemble à celle représentée dans le tableau 1. On voit clairement que sous cette forme, chaque observation a beaucoup de données manquantes. Par exemple le sujet i=1 n’a pas été mesuré à 8 ans, ni à 10, ni à 12, ni à 13. Si on modélisait les données en fonction du temps de mesure, on n’aurait pas ce problème ; tous les individus auraient une valeur Y0, Y1 et Y2. Toutefois, cette définition du temps est rarement intéressante du point du vue théorique : si la variable âge est celle d’intérêt, c’est celle-ci qu’il faut utiliser dans la modélisation pour représenter le temps.
Exemple d’application avancée
57Nous allons maintenant considérer en détail un exemple d’application du MCL appliqué à des données réelles. Nous commencerons par un modèle simple, strictement équivalent à celui décrit ci-dessus, avec une modélisation flexible du temps similaire à celle que nous avons mentionnée pour la variable âge. Puis nous verrons quelques applications plus avancées : l’estimation d’un changement de forme non-linéaire (effet quadratique du temps) ; l’estimation d’un MCL bivarié, qui permet d’étudier les relations entre le changement de deux phénomènes ; enfin, la prédiction du changement par d’autres variables. Tout au long de cet exemple, nous rendrons également explicite en quoi les effets discutés représentent tour à tour les cinq objectifs de la recherche longitudinale.
58Avant tout, quelques mots sur les données et le contexte dans lequel elles ont été recueillies. Il s’agit d’une recherche sur la créativité réalisée par Fürst, Ghisletta, et Lubart (2012). Plus spécifiquement, on s’intéresse ici à deux processus supposés centraux pour la créativité : la Génération d’idée et la Sélection d’idées. Ces deux processus ont été mesurés de manière répétée à l’aide de courts questionnaires de six items chacun ; pour chacune de ces deux variables, les scores observés (Yti) correspondent à la moyenne de ces items, donnant lieu à une distribution bornée entre 1 et 5, qui s’avère proche d’une normale. Ces variables ont été mesurées dans le cadre de quatre ateliers donnés dans des écoles d’arts appliqués en Suisse romande ; il s’agissait d’ateliers de photographie, d’illustration, de design et de décoration. Après chaque jour de travail dans le cadre de l’atelier, les participants remplissaient le questionnaire mesurant Génération et Sélection, afin d’indiquer leur utilisation des deux processus.
59Pour analyser ces données, le temps a été traité de manière flexible. Comme les quatre ateliers n’avaient pas la même durée (le plus court étant d’une semaine et le plus long de dix), le temps a été exprimé en fraction de la durée totale de l’atelier, plutôt qu’en simple temps de mesure ou en jours. Concrètement, cela signifie que pour un atelier de dix séances (et ce, quelle que soit sa durée en jours), la première séance correspondait au temps 0/9 = 0 et la dernière au temps 9/9 = 1. Pour un atelier de huit semaines, la première séance correspondait au temps 0/7, la dernière à 7/7. Nous sommes donc dans une situation comparable à celle décrite dans le tableau 1. Ce traitement flexible de la variable temps permet à la fois de comparer directement les groupes et d’avoir une conceptualisation du temps qui est parlante d’un point de vue théorique (i.e., la durée totale du processus créatif dans le cadre d’un atelier).
60L’ensemble des résultats est présenté dans le tableau 2. Ces résultats incluent les paramètres de deux MCL (un pour Génération et un pour Sélection) dans chacun des quatre ateliers. Dans un premier temps, nous allons nous focaliser sur les paramètres en gras dans le tableau 2 ; ces paramètres correspondent au MCL de Génération dans le groupe des photographes (l’équation complète du modèle est présentée plus loin). Parmi ces paramètres on retrouve : la moyenne de l’intercept (2,66) et de la pente du groupe (0,94, non significative, p=0,525), ce qui suggère qu’il n’y a pas de changement moyen. On retrouve également la variance de l’intercept (0,194) et la variance de la pente (5,08) ; ces deux paramètres sont (marginalement) significatifs (p<0,10), ce qui indique la présence de différences interindividuelles dans le changement intra-individuel, en ce qui concerne le changement (pente). La corrélation négative entre intercept et pente (-0,69) signifie que les personnes avec des scores élevés de Génération au début de l’atelier étaient aussi celles dont le score avait tendance à diminuer le plus ensuite.
61Considérons maintenant de plus près l’équation complète de ce modèle, en commençant par l’équation de niveau 1 :
62Yti = β0i + β1i*tempsti + β2i*temps2ti + eti
63Par rapport à l’équation équivalente que nous avons vue plus haut, il y a maintenant une pente supplémentaire (β2i) qui correspond à l’effet quadratique du temps. Ces résultats figurent également dans le tableau 2. Si l’on continue de s’intéresser pour l’instant seulement au groupe de photographes, on voit que la moyenne de cette pente (γ20) est estimée à-1,39 et sa variance (u2i) à 3,64. Ces deux paramètres ne sont pas significatifs, ce qui indique qu’il y a très peu de changement curvilinéaire dans ce groupe.
64Afin d’interpréter les résultats des autres groupes, détaillons les équations de niveau 2 :
65β0i = γ00 + γ01*Décorateurs + γ02*Illustrateurs + γ03*Designers + u0i
66β1i = γ10 + γ11*Décorateurs + γ12*Illustrateurs + γ13*Designers + u1i
67β2i = γ20 + γ21*Décorateurs + γ22*Illustrateurs + γ23*Designers + u2i
68Ces trois équations représentent l’intercept (β0i), la pente linéaire (β1i) et la pente quadratique (β2i), qui figurent toutes trois dans l’équation précédente (de niveau 1). Ces équations contiennent chacune, comme nous l’avons déjà vu, plusieurs effets fixes (les γ••) et un effet aléatoire (les u•i). Ce qui est nouveau ici, ce sont les prédicteurs propres à chaque groupe qui sont en fait ajoutés comme dans une équation de régression linéaire classique. Ainsi, par exemple, le paramètre γ11 représente la différence de pente du groupe de décorateurs, par rapport au γ10, qui correspond ici à la pente des photographes. Selon la même logique, tous les paramètres des groupes Décorateurs, Illustrateurs et Designers représentent des déviations par rapport aux estimations faites pour le groupe de référence, celui des photographes. Dans les équations β1i et β2i, ces effets représentent les déterminants du changement intra-individuel. Par exemple, alors que nous avons vu précédemment qu’il y avait peu de changement moyen chez les photographes, le changement moyen chez les illustrateurs est assez important. Les illustrateurs ont une différence de pente linéaire moyenne (γ12), par rapport aux photographes, qui est de-4,75, ainsi qu'une différence de pente quadratique (γ22) de 4,4. Ceci signifie que les illustrateurs ont, en moyenne, une trajectoire curvilinéaire fortement décroissante.
69Enfin, la dernière extension que nous allons considérer est celle du MCL bivarié. Ceci renvoie principalement à la partie droite du tableau 2, en italique, qui concerne le processus de Sélection. Un MCL similaire à celui de Génération a été estimé pour ce processus. Notons d’abord une différence importante : il n’y avait pas pour ce processus de variance de pente significative (au travers de tous les groupes). Ce paramètre a donc été fixé à 0 (i.e., @0 dans le tableau), ainsi que par extension les covariances qui l’impliquent. Du point de vue théorique, ceci indique que la variance dans le changement de ce processus n’était pas très importante, assimilable à 0 ; tous les individus avaient donc un changement relativement similaire. Indépendamment de cette absence de variance, les résultats pour Sélection mettent en évidence une forte tendance moyenne. La trajectoire de ce processus est caractérisée (dans tous les groupes et pour tous les individus) par une décroissance linéaire (γ10 = 2,14) et quadratique (γ20 = –1,96). Cet effet représente l’identification directe de similarités interindividuelles dans le changement intra-individuel. Pour finir, notons encore un effet qui représente une interrelation dans le changement comportemental (quoique dans une modeste mesure), celui de la corrélation entre le niveau de Génération et celui de Sélection (rSu0i-Gu0i = 0,69). Cet effet indique que les personnes avec des scores initiaux élevés de Génération étaient aussi celles avec des scores élevés de Sélection. Pour aller plus loin dans l’analyse du changement à proprement parler, il aurait fallu que la pente de Sélection soit plus importante et significative, ou alors qu’un autre phénomène changeant soit inclus dans les analyses, comme par exemple une variable d’humeur. Notons encore que l’on aurait pu également aller plus loin dans l’analyse des déterminants des différences interindividuelles dans le changement intra-individuel en incluant par exemple des variables de personnalité, afin de tester leurs relations avec les trajectoires des processus.
Note sur l’implémentation et les logiciels
70Le logiciel AMOS (Arbuckle, 2006) offre une approche facilitée avec les MES. Le logiciel R (R Development Core Team, 2012) permet les deux approches, mais les développements récents les plus importants sont plutôt faits en MNN (Bates, 2010). Enfin, le logiciel Mplus (Muthén & Muthén, 2010) permet également les deux approches et même leur intégration. Dans ce logiciel, l’approche en MES est facilitée grâce à une syntaxe simplifiée pour spécifier le MCL. Ce logiciel offre également des possibilités d’extensions importantes, telle que la généralisation du MCL aux données ordinales (Muthén, 2004). Finalement, l’estimation bayésienne des paramètres du MCL est possible directement dans les logiciels AMOS et Mplus, ainsi que via le logiciel spécifique Bugs.
Conclusions
71Il existe une grande variété de modèles pour données longitudinales. Souvent, ces modèles émergent suite aux besoins et réalités spécifiques à un champ de recherche donné. Nous nous sommes limités ici à deux classes de modèles qui se prêtent bien à la discussion des objectifs de la méthodologie longitudinale, énoncées par Baltes et Nesselroade (1979), dans plusieurs recherches en psychologie. Évidemment, nous aurions pu décrire beaucoup d’autres modèles, plus spécifiques à certaines sous-disciplines de la psychologie.
72Les modèles discutés ici peuvent être étendus. Par exemple, le MCL peut être adapté pour estimer des fonctions de changement qui sont non-linéaires dans leurs paramètres (voir Browne, 1993, pour la théorie et Ghisletta et al., 2010, pour une application), ou pour étudier des liens dynamiques entre plusieurs variables, ce qui permet d’établir si le changement entre les temps t-1 et t d’une variable est influencé par l’état au temps t-1 d’une autre variable (voir McArdle & Hamagami, 2001 et Ghisletta & Lindenberger, 2003).
73La méthodologie longitudinale est la seule à même de répondre aux questions en lien avec le changement intra-individuel. Et les bons choix méthodologiques exigent un solide socle de connaissances théoriques. Il en va de même pour les bons choix de modèles d’analyse statistique. Nous espérons que ce chapitre pourra aider à choisir le bon modèle d’analyse pour aboutir à une recherche heuristique centrée sur le changement intra-individuel.
Bibliographie
Des DOI sont automatiquement ajoutés aux références bibliographiques par Bilbo, l’outil d’annotation bibliographique d’OpenEdition. Ces références bibliographiques peuvent être téléchargées dans les formats APA, Chicago et MLA.
Format
- APA
- Chicago
- MLA
Références
Arbuckle, J. L. (2006). Amos (Version 7.0) [Computer Program]. Chicago: SPSS.
Baltes, P. B., & Nesselroade, J. R. (1979). History and rationale of longitudinal research. In J. R. Nesselroade & P. B. Baltes (Eds.), Longitudinal research in the study of behavior and development (pp. 1-39). New York, NY : Academic Press.
Bates, D. (2010). lme4 : Mixed-effects modeling with R. Consulté à l’adresse http://lme4.r-forge.r-project.org/lMMwR/lrgprt.pdf
Bock, R. D., & Thissen, D. (1976). Fitting multi-component models for growth in stature. Proceedings of the 9th International Biometric Conference, 1, 432-442.
10.1002/9781118619179 :Bollen, K. A. (1989). Structural equations with latent variables. New York, N.Y.: John Wiley and Sons.
10.1016/B978-0-444-81531-6.50016-7 :Browne, M. W. (1993). Structured latent curve models. In C. M. Cuadras & C. R. Rao (Eds.), Multivariate analysis : Future directions 2 (pp. 171-197). Amsterdam, The Netherlands : Elsevier Science Publisher.
10.1037/0033-2909.101.1.147 :Bryk, A. S., & Raudenbush, S. W. (1987). Application of hierarchical linear models to assessing change. Psychological Bulletin, 101, 147-158.
Collins, L. M., & Horn, J. L. (1991). Best methods for the analysis of change. Washington, DC.: American Psychological Association.
10.1037/10409-000 :Collins, L. M., & Sayer, A. G. (Eds.). (2001). New methods for the analysis of change. Washington, DC.: American Psychological Association.
10.2307/1534616 :Courgeau, D., & Baccaïni, D. (1997). Analyse multi-niveaux en sciences sociales. Population, 4, 831-864.
10.1037/10409-000 :Curran, P. J., & Bollen, K. A. (2001). The best of both worlds. Combining autoregressive and latent curve models. In L. M. Collins & A. G. Sayer (Eds.), New methods for the analysis of change (pp. 107-135). Washington, D. C. : American Psychological Association.
10.1201/9780203745502 :Davidian, M., & Giltinan, D. M. (1995). Nonlinear models for repeated measurement data. London, U.K.: Chapman & Hall.
10.2307/2533983 :Diggle, P. J., Liang, K.-Y., & Zeger, S. L. (1994). Analysis of longitudinal data. Oxford, U.K.: Clarendon Press.
10.1201/9781420011579 :Fitzmaurice, G. M., Davidian, M., Verbeke, G., & Molenberghs, G. (2009). Longitudinal data analysis. Boca Raton, FL.: Taylor & Francis Group.
Fürst, G., Ghisletta, P., & Lubart, T. (2012). The Creative Process in Visual Art: A Longitudinal Multivariate Study. Creativity Research Journal, 24(4), 283-295.
Ghisletta, P., Kennedy, K. M., Rodrigue, K. M., Lindenberger, U., & Raz, N. (2010). Adult age differences and the role of cognitive resources in perceptual-motor skill acquisition: Application of a multilevel negative exponential model. Journal of Gerontology: Psychological Sciences, 65, 163-173.
10.1037/0882-7974.18.4.696 :Ghisletta, P., & Lindenberger, U. (2003). Age-based structural dynamics between perceptual speed and knowledge in the Berlin Aging Study: Direct evidence for ability dedifferentiation in old age. Psychology and Aging, 18, 696-713.
10.1159/000074383 :Ghisletta, P., & Lindenberger, U. (2004). Static and Dynamic Longitudinal Structural Analyses of Cognitive Changes in Old Age. Gerontology, 50(1), 12-16.
10.1207/S15328007SEM0804_02 :Ghisletta, P., & McArdle, J. J. (2001). Latent growth curve analyses of the development of height. Structural Equation Modeling, 8, 531-555.
10.1093/oso/9780195172188.001.0001 :Ghisletta, P., & Trickett, P. K. (2007). Application of latent growth analyses to health outcomes of adolescent girls. In A. D. Ong & M. van Dulmen (Eds.), Oxford handbook of methods in positive psychology (pp. 453-466). Oxford, U.K. : Oxford University Press.
10.1002/9781118445112.stat06603 :Hox, J.J., & Stoel, R.D. (2005). Multilevel and SEM approaches to growth curve modeling. In B. S. Everitt & D. C. Howell (Eds.). Encyclopedia of Statistics in Behavioral Science (pp. 1296-1305). Chicester, UK : Wiley.
10.2307/2529876 :Laird, N. M., & Ware, J. H. (1982). Random-effects models for longitudinal data. Biometrics, 38, 963–974.
Marivain, T. (2003). Analyser les différences interindividuelles dans le changement intraindividuel lors des apprentissages scolaires : Une illustration simple à partir des modèles en équations structurales. Psychologie et Psychométrie, 24, 41-56.
10.2307/1130295 :McArdle, J. J., & Epstein, D. B. (1987). Latent growth curves within developmental structural equation models. Child Development, 58, 110-133.
McArdle, J. J., & Hamagami, F. (2001). Latent difference score structural models for linear dynamic analyses with incomplete longitudinal data. In L. M. Collins & M. Sayer (Eds.), New methods for the analysis of change (pp. 139-175). Washington, D.C. : American Psychological Association.
10.4324/9781315792712 :McArdle, J. J., & Nesselroade, J. R. (1994). Using multivariate data to structure developmental change. In S. H. Cohen & H. W. Reese (Eds.), Life-span developmental psychology : Methodological contributions (pp. 223-267). Hillsdale, NJ : Lawrence Erlbaum Associates.
10.1002/0471264385.wei0218 :McArdle, J. J., & Nesselroade, J. R. (2003). Growth curve analysis in contemporary psychological research. In J. Schinka & W. Velicer (Eds.), Comprehensive handbook of psychology, Vol. 2 : Research methods in psychology (pp. 447-480). New York, N.Y. : Wiley.
10.1007/BF02289699 :Meredith, W. (1964). Notes on factorial invariance. Psychometrika, 29, 177-185.
10.1007/BF02294746 :Meredith, W., & Tisak, J. (1990). Latent curve analysis. Psychometrika, 55, 107-122.
Motulsky, H., & Christopoulos, A. (2003). Fitting models to biological data using linear and nonlinear regression : A practical guide to curve fitting (2nd ed.). San Diego, CA.: GraphPad Software Inc. Retrieved from www.graphpad.com
10.4135/9781412986311 :Muthén, B. (2004). Latent variable analysis : Growth mixture modeling and related techniques for longitudinal data. In D. Kaplan (Ed.), Handbook of quantitative methodology for the social sciences (pp. 345-368). Newbury Park, CA : Sage Publications.
Muthén, L. K., & Muthén, B. O. (2010). Mplus v6. Los Angeles, CA : Muthén & Muthén.
R Development Core Team. (2012). R: A language and environment for statistical computing. Vienna, Austria: R Foundation for Statistical Computing, www.R-project.org.
10.1093/cercor/bhm108 :Raz, N., Lindenberger, U., Ghisletta, P., Rodrigue, K. M., Kennedy, K. M., & Acker, J. D. (2008). Neuroanatomical correlates of fluid intelligence in healthy adults and persons with vascular risk factors. Cerebral Cortex, 18, 718-726.
10.1093/acprof:oso/9780195152968.001.0001 :Singer, J. D., & Willett, J. B. (2003). Applied longitudinal data analysis. Oxford, U.K.: Oxford University Press.
Skrondal, A., & Rabe-Hesketh, S. (2004). Generalized latent variable modeling: Multilevel, longitudinal, and structural equation models. Boca Raton, FL.: Chapman & Hall/CRC.
10.1007/978-1-4612-2294-1 :Verbeke, G., & Molenberghs, G. (2000). Linear mixed models for longitudinal data. New York, N.Y.: Springer.
Verbeke, G. N., Davidian, M., Fitzmaurice, G. M., & Molenberghs, G. (Eds.). (2008). Longitudinal data analysis. Chapman & Hall/CRC.
10.1201/9781482293272 :Vonesh, E. F., & Chinchilli, V. M. (1997). Linear and nonlinear models for the analysis of repeated measurements. New York, NY: Dekker.
10.1093/acprof:oso/9780195173444.001.0001 :Walls, T. A., & Schafer, J. L. (2006). Models for intensive longitudinal data. Oxford, U.K.: Oxford University Press.
10.1093/genetics/3.4.367 :Wright, S. (1918). On the nature of size factors. Genetics, 3, 367-374.
10.1214/aoms/1177732676 :Wright, S. (1934). The method of path coefficients. Annals of Mathematical Statistics, 5, 161-215.
Notes de bas de page
4 Attention à ne pas confondre l’usage de niveau des MNN avec la variable latente de Niveau évoquée dans le cadre des MES. Malgré l’homonymie, ces deux concepts sont bien différents.
Auteurs
Formation universitaire à distance, Suisse.
Université Paris Descartes, France, faculté de psychologie et des sciences de l'éducation, université de Genève.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
À quoi sert aujourd'hui la psychologie sociale ?
Demandes actuelles et nouvelles réponses
Gérard Guingouain et François Le Poultier (dir.)
1994
Psychologie sociale et formation professionnelle
Propositions et regards critiques
Jacques Py, Alain Somat et Jacques Baillé (dir.)
1998
La maîtrise du langage
Textes issus du XXVIIe symposium de l’Association de psychologie scientifique de langue française (APSLF)
Agnès Florin et José Morais (dir.)
2002
L'apprentissage de la lecture
Perspectives comparatives
Mohamed Nouri Romdhane, Jean Emile Gombert et Michèle Belajouza (dir.)
2003
Réussir à l'école
Les effets des dimensions conatives en éducation. Personnalité, motivation, estime de soi, compétences sociales
Agnès Florin et Pierre Vrignaud (dir.)
2007
Lire-écrire de l'enfance à l'âge adulte
Genèse des compétences, pratiques éducatives, impacts sur l'insertion professionnelle
Jean-Pierre Gaté et Christine Gaux (dir.)
2007
L’apprentissage de la langue écrite
Approche cognitive
Nathalie Marec-Breton, Anne-Sophie Besse, Fanny De La Haye et al. (dir.)
2009
Musique, langage, émotion
Approche neuro-cognitive
Régine Kolinsky, José Morais et Isabelle Peretz (dir.)
2010