Chapitre 2. Attrition et déformation de l’échantillon au fil des vagues de l’enquête Érfi
p. 53-85
Note de l’auteur
Les auteurs tiennent à remercier Laurent Toulemon (Ined) pour ses conseils et suggestions d’analyses, ainsi que les deux relecteurs anonymes de ce chapitre.
Texte intégral
Introduction
1La question de la non-réponse est un enjeu majeur dans les enquêtes par questionnaire, le taux de participation présageant de la représentativité des données. Dans le cas des enquêtes longitudinales, l’enjeu est d’autant plus important que le risque de déperdition s’accroît à mesure que le nombre de vagues augmente. L’attrition consiste en cette érosion continue et sélective de l’échantillon initial au fil des vagues. Ce phénomène est « continu » dans la mesure où la probabilité qu’un individu sorte du champ d’observation augmente mécaniquement à mesure que les passages se répètent, le risque de mobilité géographique et de lassitude du répondant s’ajoutant aux facteurs de non-réponse des enquêtes transversales (Laurie, Smith et Scott 1999) ; il est « sélectif » car la probabilité de réinterrogation diffère en fonction des caractéristiques sociodémographiques des répondants et des conditions dans lesquelles les questionnaires précédents ont été administrés. Outre le problème manifeste de la diminution de l’effectif qui peut compromettre la robustesse des tests statistiques, l’attrition peut engendrer une déformation de la structure de l’échantillon de départ et aller jusqu’à biaiser les résultats et l’interprétation qui en est faite (Razafindratsima et Kishimba, 2004).
2Cette question de l’attrition se pose particulièrement dans l’enquête Generations and Gender Survey en cours dans une vingtaine de pays. Celle-ci prévoit en effet d’interroger à trois reprises les mêmes personnes, à trois ans d’intervalle entre les vagues, afin de permettre à terme des comparaisons internationales. Nous proposons ici un bilan de la déperdition observée dans l’enquête française (Érfi), sur laquelle repose l’essentiel du présent ouvrage1.
3Après avoir proposé une revue de la littérature sur le sujet et présenté les données, cette recherche mesure l’attrition observée entre les différentes vagues de l’enquête française, en prenant soin de distinguer différents types de sortie d’échantillon : refus, perte de contact, sortie du champ. On caractérise dans un deuxième temps l’attrition, en considérant différentes familles de facteurs explicatifs : variables sociodémographiques, lieu de vie des personnes, état de santé et sociabilité des personnes, déroulement des entretiens précédents. Enfin, l’enquête comptant trois vagues, nous cherchons à voir si la déperdition observée entre les deux premières vagues de l’enquête et entre les deux dernières tient aux mêmes facteurs. Dit autrement, nous souhaitons voir si la déformation de l’échantillon s’accentue au fil des vagues.
4Si l’étude de l’attrition et des facteurs qui y sont associés est cruciale en aval de la collecte puisqu’elle sert de base au calcul des variables de pondération longitudinales (en particulier lors de l’étape de correction de la non-réponse2), il est également intéressant de s’y attarder dans un contexte où les enquêtes longitudinales tendent à se développer. L’objectif de ce chapitre n’est donc pas de mesurer les biais occasionnés par l’attrition sur les variables d’intérêt de l’enquête (trop nombreuses, comme l’illustre la variété des études proposées dans cet ouvrage)3, mais d’apporter des éléments visant à mieux comprendre l’érosion de l’échantillon observée au fil des vagues de l’enquête Érfi, dans la perspective de futures enquêtes à passages répétés. Ces éléments pourront être mobilisés afin de mieux définir le tirage initial d’un échantillon. Les préconisations internationales de l’enquête Generations and Gender Survey présentaient par exemple la manière de déterminer la taille initiale de l’échantillon à interroger en vague 1 pour parvenir à l’objectif d’au moins 3 000 femmes en âge reproductif (18-44 ans en vague 1) réinterrogées en vague 3. Cette estimation s’appuyait sur un taux d’attrition attendu de 10 % entre chaque vague (UNECE, 2005, p. 11). Ce chapitre offre des éléments chiffrés plus précis. Par ailleurs, le repérage de certaines situations liées au refus de participer aux vagues successives pourrait permettre d’affuter l’argumentaire pour convaincre plus efficacement ces personnes de participer. De même, mieux connaître le profil des personnes perdues de vue entre les vagues pourrait permettre la mise en place d’un suivi plus individualisé des personnes (avec par exemple l’envoi plus régulier de courriers pour les personnes les plus mobiles). Plus globalement, le repérage des profils de personnes pour lesquelles l’attrition est la plus forte peut permettre de sur-échantillonner de manière raisonnée certaines catégories de population, dans la perspective de disposer in fine d’une bonne représentativité des répondants au terme des différentes vagues d’enquête.
I. Brève revue de la littérature sur les déterminants de la participation à une enquête
5Lorsqu’une personne appartient à l’échantillon d’une enquête, deux étapes conditionnent sa participation : la prise de contact (réussite ou échec à entrer en contact avec elle) et, si le contact est établi, la coopération de l’enquêté(e) (acceptation ou refus de répondre). Si les études portant sur l’attrition se sont longtemps restreintes à comprendre le phénomène dans son ensemble, la plupart des chercheurs s’accordent aujourd’hui sur le fait que les déterminants de l’attrition diffèrent selon que la non-réponse provienne d’une perte de contact ou d’un refus explicite à participer de nouveau à l’enquête (Groves et Couper, 1998 ; Watson et Wooden, 2009). La richesse des travaux menés sur la déperdition dans les enquêtes longitudinales permet d’appréhender le phénomène dans toute sa complexité. Deux catégories de facteurs sont habituellement mobilisées pour comprendre l’attrition. Il y a, d’une part, les caractéristiques du répondant, de son ménage ou de sa zone de résidence et, d’autre part, les spécificités de l’enquête : la nature du questionnaire, mais aussi les caractéristiques de l’enquêteur et la qualité de la relation qui s’établit entre lui et l’enquêté, notamment autour de la question fondamentale de la confiance. Pour chacune de ces catégories, il est essentiel de distinguer ce qui joue sur la perte de contact de ce qui influe sur le refus de coopération, en gardant à l’esprit qu’un même facteur peut jouer sur les deux tableaux et que l’effet peut alors se faire dans des sens opposés.
1. Les déterminants sociodémographiques de la prise de contact
6On observe traditionnellement que la prise de contact se fait plus facilement auprès des femmes, des personnes âgées et des parents de jeunes enfants : ces individus passent en moyenne plus de temps à leur domicile (Groves et Couper, 1998). Le contact est plus souvent établi dans les ménages comptant plusieurs adultes qu’auprès de personnes vivant seules en raison d’une probabilité accrue qu’au moins l’un des habitants du logement soit présent au moment du passage de l’enquêteur. En revanche, les personnes résidant dans des zones à forte densité urbaine sont plus difficiles à appréhender. Ces zones concentrent une plus forte proportion de locataires, vivant en appartement dans des ensembles parfois très sécurisés et difficiles d’accès (Uhrig, 2008 ; Blom, de Leeuw et Hox, 2011). Les habitants des grandes villes ont également une plus faible probabilité d’être trouvés chez eux car ils y passent en moyenne moins de temps en raison de durées de transport plus longues que dans les petites villes ou à la campagne, mais aussi d’une plus grande offre d’activités sociales et culturelles (Groves et Couper, 1998).
7Dans le contexte d’enquêtes longitudinales, la probabilité de perdre le contact avec un répondant augmente à mesure que le risque de mobilité géographique s’élève. Une étude conduite à partir du Panel européen des ménages montre que le principal facteur explicatif de l’attrition tient à la difficulté à suivre des personnes qui déménagent (Breuil-Genier et Valdelièvre, 2001). Ce risque est accru chez les répondants qui déclarent envisager un déménagement, qui n’aiment pas leur quartier ou qui ont déjà connu un déménagement dans les années précédant l’enquête (Uhrig, 2008). Enfin, Philippe Collomb (1979) puis, à sa suite, Benoît Riandey (1988) ont montré le poids prépondérant joué par la détermination des enquêteurs à retrouver la trace des répondants perdus de vue. Dans le cas d’un changement d’adresse, la qualité du suivi dépend alors essentiellement de l’investissement des enquêteurs dans ce qui peut devenir une véritable enquête.
2. Les déterminants sociodémographiques de la coopération
8Les recherches sur l’attrition montrent en outre qu’une fois le contact établi entre le répondant et l’enquêteur, la propension à accepter de répondre varie en fonction des caractéristiques sociodémographiques de la personne sollicitée.
9Le niveau social et le niveau d’éducation peuvent s’avérer déterminants dans le suivi des enquêtés (Uhrig, 2008), les plus diplômés se montrant plus souvent coopératifs. L’investissement cognitif est parfois plus lourd pour les personnes moins diplômées qui peuvent être moins à l’aise pour répondre à un questionnaire. Les habitants des grandes villes, en plus d’être plus difficiles à contacter, se montrent aussi moins enclins à répondre en raison d’un sentiment diffus d’insécurité et d’un contexte de moindre cohésion sociale dans les zones de grande densité urbaine. Cette peur de l’inconnu permet aussi d’expliquer une moindre coopération des personnes âgées (Holbrook, Green et Krosnick 2003 ; Uhrig, 2008). Les étrangers refusent aussi plus souvent d’être réinterrogés (Watson et Wooden, 2009) : ils ont une moindre facilité à s’exprimer en français lorsqu’il ne s’agit pas de leur langue maternelle et peuvent aussi se sentir moins concernés par une enquête nationale. Par ailleurs, la participation à des activités sociales, l’implication politique ou associative sont autant de facteurs liés positivement au suivi des répondants (Uhrig, 2008 ; Stoop, 2005 ; Lipps, 2007). Enfin, plusieurs chercheurs se sont intéressés au lien entre le fait de connaître des changements dans sa vie et le taux de réponse aux enquêtes. Il semblerait que l’instabilité conjugale, professionnelle ou géographique soit liée positivement au refus de participer. Outre l’effet mécanique d’un déménagement qui peut rendre plus difficile la prise de contact, ces personnes sont moins susceptibles de répondre à une enquête parfois intrusive et coûteuse en temps (Voorpostel et Lipps, 2011). L’effet est d’autant plus marqué que le changement se fait dans un sens défavorable : une rupture conjugale, une période de chômage ou une baisse de salaire par exemple (Fitzgerald, Gottschalk et Moffit, 1998).
3. Les caractéristiques du questionnaire et de l’enquêteur sur la réinterrogation
10Les conditions de déroulement de l’enquête influent également sur la probabilité d’accepter d’être réinterrogé. C’est ainsi que la thématique abordée dans le questionnaire, la qualité des passations précédentes et les caractéristiques de l’enquêteur peuvent ainsi être déterminantes sur le risque qu’un individu sorte de l’échantillon.
11D’abord, les personnes plus éloignées du sujet de l’enquête peuvent se sentir peu concernées par l’étude et donc moins disposées à y consacrer du temps. Dans l’enquête Intentions de fécondité (Ined, 1998-2003), l’étude de la déperdition a ainsi mis en évidence que les répondants les plus éloignés des questions liées à un projet d’enfant, à savoir ceux sans enfant et n’en souhaitant pas, avaient une plus grande probabilité de refuser d’être recontactés (Mazuy et al., 2005).
12La part des données manquantes aux vagues précédentes peut être un indicateur de ce moindre intérêt porté à l’enquête, si ce n’est d’une certaine attitude de défiance de la part de l’enquêté. Uhrig (2008), Lipps (2007), mais aussi Watson et Wooden (2009) ont ainsi montré que les répondants qui refusent de renseigner les questions sur leur salaire ont une plus grande probabilité de sortir de l’échantillon à la vague suivante. Plus globalement, Loosvedt, Pickery et Billiet (2002) montrent que la non-réponse aux questions dites « sensibles » est liée à une moindre coopération à la vague suivante.
13De même, la durée du questionnaire peut présager de la probabilité de réponse aux vagues suivantes. Un questionnaire plus court ou plus long que la moyenne peut augmenter le risque de refus à la vague suivante. Dans le premier cas, il peut traduire un manque d’intérêt ou une moindre proximité du répondant avec la thématique de l’enquête ; dans le second cas, il s’accompagne d’une augmentation du coût d’opportunité en nécessitant un investissement plus lourd de la part du répondant (Watson et Wooden, 2009).
14Dans un autre registre, l’obtention d’adresses-relais à la fin d’un questionnaire peut être décisive. Non seulement cela permet de retrouver plus facilement les nouvelles coordonnées du répondant en cas de déménagement mais, au-delà de cet effet mécanique, l’acceptation de fournir ces renseignements peut aussi s’interpréter comme un indicateur d’une disposition d’esprit plus favorable à l’enquête et, par là, d’une plus grande propension à accepter le suivi (Riandey, 1988 ; Laurie, Smith et Scott, 1999).
15Enfin, certains auteurs ont montré que l’enquêteur lui-même avait un impact sur le taux de réponse. Au-delà de sa capacité à retrouver l’enquêté, les stratégies mises en œuvre dans l’argumentaire déployé pour le convaincre de répondre sont décisives. Cet effet se retrouve dans l’âge et le niveau d’expérience de l’enquêteur, tous deux liés positivement au taux de participation des répondants (Blom, De Leeuw et Hox, 2011), mais aussi dans ses traits de personnalité, les enquêteurs les plus ouverts et les plus extravertis obtenant de meilleurs résultats (Jäckle et al., 2013).
II. Les données et la méthode
1. Quelques rappels sur l’enquête
16La France a réalisé à l’automne 2005 la première vague de l’Étude des relations familiales et intergénérationnelles, laquelle a été reconduite trois et six ans plus tard (automne 2008 et automne 2011) auprès des mêmes répondants (voir chapitre 1 pour une présentation détaillée de l’enquête), avec néanmoins une érosion de l’échantillon au fil des vagues. Dans la mesure du possible, les mêmes enquêteurs étaient sollicités pour les différentes vagues, le rôle positif de cette continuité dans des enquêtes longitudinales en face-à-face ayant été démontré (voir par exemple Behr et al., 2005 ; Nicoletti et Peracchi, 2005 ; Burricand et Lorgnet, 2014). Malheureusement, il est impossible ici de déterminer la part d’enquêteurs ayant participé aux différentes vagues, aucune information n’ayant été collectée en ce sens dans l’enquête.
17Suite à la première vague d’enquête, seules les personnes ayant donné leur accord écrit (formulaire signé de leur part, sur lequel figurait leur adresse et d’éventuelles informations complémentaires : téléphone, coordonnées de personnes-relais) pour qu’un enquêteur reprenne contact avec elles trois ans plus tard étaient éligibles pour les vagues suivantes. L’actualisation de leurs coordonnées entre les vagues était assurée « artisanalement » par le service des Enquêtes et sondages de l’Ined (aucun rapprochement avec des fichiers administratifs n’était possible). La probabilité d’avoir été perdu de vue entre l’une des vagues d’enquête a été bien moindre pour les répondants pour lesquels nous disposions d’au moins une personne-relais (sans toutefois qu’il n’y ait de différences significatives entre le fait de ne disposer des coordonnées que d’une seule personne-relais ou de deux4). En outre, le nombre de numéros de téléphone laissés par la personne (jusque trois : domicile, professionnel, portable) s’avère positivement corrélé à la probabilité de garder le contact au fil des vagues5.
18Au final, 10079 personnes ont répondu à la première vague de l’enquête (2005), 6534 à la deuxième (2008) et 5781 à la troisième (2011).
2. Les objectifs de l’étude et la méthode choisie
19Cette recherche poursuit différents objectifs. Après avoir rappelé les stratégies mises en œuvre afin de limiter la déperdition de l’échantillon entre les vagues, le premier objectif vise à décrire précisément l’ampleur de l’attrition entre chacune d’elles. Nous veillons en particulier à distinguer les différentes sources d’attrition : les refus de prendre part à la vague suivante, la perte de contact, les personnes sortant du champ de l’enquête6 mais aussi la part de l’attrition imputable à la mortalité.
20Notre deuxième objectif consiste à repérer différents facteurs liés à l’attrition. En nous appuyant sur la littérature existante sur le sujet et en fonction des données disponibles dans l’enquête, nous avons formulé différentes hypothèses de recherche que nous avons ensuite éprouvées, d’abord de manière descriptive, puis en construisant des modélisations afin de repérer l’effet des différents facteurs, ceteris paribus (modèles logit). Nous avons considéré différentes familles de facteurs. En premier lieu, les caractéristiques sociodémographiques des personnes : sexe, âge, nationalité, niveau d’études, situation d’activité, situation familiale. Deuxièmement, leur situation résidentielle : taille de l’unité urbaine, type d’habitat (maison ou appartement), statut d’occupation du logement (propriétaire, locataire, etc.) et intention de déménager, avec l’hypothèse d’une mobilité géographique plus ou moins forte et une facilité d’accès au logement par l’enquêteur différente selon les situations. Troisièmement, des facteurs liés à la santé du répondant et à sa sociabilité, que l’on peut approcher dans l’enquête par la fréquence des échanges de confidences avec l’entourage. Enfin, les spécificités du déroulement de l’entretien lors de la première vague représentent une quatrième famille de facteurs : durée du questionnaire, mais aussi attitude de défiance par rapport au questionnaire (mesurée par le refus de répondre à certaines questions) et intérêt porté à l’étude (mesuré par le souhait de recevoir ou non les premiers résultats de l’enquête). Dans cette partie, notre analyse porte principalement sur l’attrition observée entre la première et la dernière vague afin de proposer un bilan général de l’enquête.
21Afin de répondre au troisième objectif de notre recherche, nous décomposons ensuite l’attrition en comparant les facteurs explicatifs de l’attrition entre les deux premières vagues de l’enquête et entre les deux dernières. Cette décomposition nous permet de voir si les mêmes facteurs se rejouent d’une vague à l’autre, renforçant alors la déformation de la structure de l’échantillon au fil des vagues, ou si au contraire un « effet de sélection » peut être mis à jour (l’attrition serait sélective dans la première période inter-vagues, moins voire plus du tout dans la seconde). Toutefois, si la comparaison des seuils de significativité entre ces deux modèles est éclairante, elle est discutable puisque chacun des modèles ne porte pas sur les mêmes effectifs. En outre, si l’effet d’un facteur est le même dans les deux modélisations, il se peut toutefois qu’il ne soit pas de même ampleur. Ainsi, un modèle unique a ensuite été construit après avoir empilé dans un même fichier les échantillons des vagues 1 et 2 (10079 + 6534). On estime, pour ces 16613 observations, leur probabilité d’avoir participé à la vague suivante en fonction des mêmes variables explicatives présentes dans les modèles disjoints mais, d’une part, en contrôlant par l’échantillon d’origine (indicatrice « vague 1 » ou « vague 2 ») et, d’autre part, en incluant un facteur d’interaction entre cette indicatrice et chacune des dimensions explicatives. C’est le résultat de ces interactions qui nous intéresse alors en premier lieu : une interaction statistiquement significative indique que l’effet de la variable est différent entre les vagues 1 et 2 et entre les vagues 2 et 3 ; un effet non significatif indique au contraire que l’effet est du même ordre entre les différentes vagues. Nous posons ici l’hypothèse d’une moindre influence entre les vagues 2 et 3 des facteurs liés au refus de répondre (les personnes plus méfiantes par rapport à l’enquête ou qui se sentent peu concernées par la thématique seront sorties de l’échantillon dès la fin de la première vague : par exemple, celles ayant refusé de répondre à certaines questions ou n’ayant pas souhaité recevoir les résultats), mais d’un effet cumulatif au fil des vagues pour les facteurs davantage liés à la perte de contact (c’est-à-dire à la mobilité géographique, au temps de présence dans le logement, au risque de sortir du champ de l’enquête : départ en institution ou décès).
III. Les résultats
1. Taux de réponse et attrition : une vue d’ensemble
22Le tableau 1 présente la taille de l’échantillon initial et les différentes sources d’attrition (refus, perte de contact, etc.) au fil des trois vagues de l’enquête. Parmi les 18019 fiches-adresses (FA) échantillonnées en 2005, 15 % n’étaient pas utilisables ou n’ont pas été mobilisées car le nombre total de répondants attendus (10000) avait été atteint (soit 2688 FA)7 ; 12 % ont donné lieu à un refus de participer (2242). Les autres sont des personnes hors champ, impossibles à joindre (dont sans doute certaines correspondent à des refus déguisés), des absences de longue durée ou des personnes inaptes à répondre (problème de santé, non francophones) ; enfin, certaines ont donné lieu à la description du ménage mais l’enquête n’a pas été réalisée ensuite (refus de la personne sélectionnée parmi les membres du ménage de répondre).
Tableau 1. Détail du taux de réponse et de l’attrition entre les trois vagues de l’enquête Érfi

Note : classification issue des données brutes de l’enquête ; regroupements opérés par les auteurs. Parmi les 5781 répondants de 2011, 8 ont été au final retirés car ils ne correspondaient pas aux individus « panel » (répondants assurément différents par rapport aux vagues précédentes).
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
23Parmi les 10079 répondants à la première vague, 88 % (8949) avaient accepté que l’on reprenne contact avec eux trois ans plus tard pour la deuxième vague. Un courrier de remerciements-relance a été adressé à celles et ceux qui ne souhaitaient pas poursuivre. On leur demandait alors si « vraiment » ils refusaient que l’on reprenne contact avec eux dans trois ans : 150 ont finalement accepté. Outre ce premier courrier de « relance », une procédure plus générale de suivi et d’actualisation des adresses avait été appliquée sur l’ensemble de la période d’enquête (encadré 1).
24Au total, 758 personnes ont été perdues de vue (y compris décès et hors champ, c’est-à-dire personnes parties vivre en institution ou à l’étranger) entre la vague 1 et la vague 2. L’échantillon pour la réalisation de la vague 2 (2008) était donc constitué de 8341 personnes.
25Parmi elles, 165 étaient « hors champ » lors du passage de l’enquêteur en 2008 (parties en institution, à l’étranger ou décédées), 794 ont refusé de répondre au questionnaire en 2008 et 547 n’ont pu être jointes (absence longue durée, déménagement, etc.), 42 personnes ayant répondu au questionnaire de la deuxième vague ont été identifiées comme n’étant pas le même répondant qu’à la première vague (proxy comme le conjoint par exemple, ou personne sans lien avec le ménage) et ont donc été supprimées de la base de données de la deuxième vague (s’ajoute, à cela quelques situations minoritaires : personnes inaptes à répondre, abandon en cours d’entretien). Celle-ci compte au final 6534 observations et, parmi elles, 96 % avaient accepté que l’on reprenne contact pour la troisième vague.
Encadré 1. Procédure de suivi et d’actualisation des adresses entre les vagues
Entre 2005 et 2011, chaque répondant était destinataire de deux courriers par an (liste des envois ci-dessous), avec pour objectif de garder le contact avec le répondant, de l’intéresser à l’objet de l’étude et d’actualiser ses coordonnées. Ainsi, différents types de courriers ont été envoyés : remerciements pour avoir participé à la vague précédente, premiers résultats, cartes de vœux, lettre d’annonce de la vague suivante. En voici le détail :
– mars 2006 : lettre de remerciements(1) avec trois modèles de courrier : 1) une relance pour les personnes ayant « refusé » de poursuivre l’enquête ; 2) des remerciements avec demande de coordonnées de personnes-relais à contacter en cas de déménagement, si nous n’en disposions pas pour le répondant ; 3) des remerciements « simples » pour les personnes ayant accepté d’être recontactées et ayant donné les coordonnées d’au moins une personne-relais ;
– décembre 2006 : envoi des premiers résultats de l’enquête sur la fréquence des rencontres entre parents et enfants, sous la forme d’un « 4 pages »(2) ;
– juin 2007 : envoi de nouveaux résultats sur la répartition des tâches domestiques au sein du couple, sous la forme d’un « 8 pages »(3) ;
– janvier 2008 : envoi d’une carte de vœux à l’effigie de l’enquête et accompagnée d’un petit sachet de graines de fleurs à semer chez soi ;
– juin 2008 : envoi d’un courrier d’annonce de la deuxième vague de l’enquête suivi, fin 2008, d’une lettre-avis annonçant le passage prochain d’un enquêteur ;
– mars 2009 : lettre de remerciements selon deux déclinaisons : 1) si nous n’avions pour le répondant aucune coordonnée de personnes-relais (50 % des cas environ), le courrier rappelait l’importance d’en disposer, son rôle, et était accompagné d’une fiche à compléter ; 2) si l’on disposait des coordonnées d’au moins une personne-relais, la lettre envoyée était un remerciement « simple » ;
– décembre 2009 : courrier accompagnant les premiers résultats utilisant les données longitudinales et montrant l’évolution de la répartition des tâches domestiques suite à la naissance d’un enfant(4) ;
– juin 2010 : courrier accompagné d’une brochure de présentation de l’ouvrage Portraits de familles (ouvrage collectif publié à partir des données de la première vague sur les différentes thématiques abordées dans l’enquête) et d’un marque-page sous forme d’un « QCM » ;
– janvier 2011 : envoi d’une carte de vœux à l’effigie de l’enquête, accompagnée d’un sachet de graines de tomates-cerises ;
– juin 2011 : courrier d’annonce de l’enquête, avec deux versions : 1) l’une adressée aux participants aux deux premières vagues ; 2) l’autre aux non-répondants à la deuxième vague, dans laquelle était précisé le moyen de prévenir l’Ined si toutefois la personne refusait d’être sollicitée pour la troisième vague.
Dans chacun de ces courriers, il était rappelé à la personne l’importance de nous communiquer sa nouvelle adresse si toutefois elle avait déménagé ou envisageait de le faire : un coupon-réponse était systématiquement joint au courrier (remboursement des frais postaux sur demande), mais la personne pouvait aussi nous informer de son changement de situation par téléphone ou par mail (boîte électronique créée pour l’enquête).
Lorsque le courrier n’arrivait pas à destination (la personne avait déménagé sans faire suivre son courrier), il était alors automatiquement retourné au Service des enquêtes et sondages de l’Ined. Une procédure de recherche des nouvelles coordonnées du répondant était alors mise en œuvre : utilisation des informations disponibles sur la fiche de suivi (numéro de téléphone, contact auprès des personnes-relais, recherche dans l’annuaire). Si la recherche était infructueuse, le courrier suivant était cependant renvoyé à l’ancienne adresse. Au bout de trois retours de courrier avec la mention « n’habite plus l’adresse indiquée », la personne était sortie de l’échantillon pour la collecte de la deuxième vague. Pour la troisième vague en revanche, il avait été décidé d’envoyer dans tous les cas un enquêteur sur place : il lui était alors demandé de procéder à une recherche auprès du voisinage, de la mairie, etc. Notons également que pour la dernière vague de l’enquête, le fichier d’adresses avait été confié juste avant la collecte à la Poste afin de procéder à d’ultimes actualisations et corrections d’adresses (la Poste disposant d’un fichier de transfert d’adresse et de suivi du courrier des personnes en cas de déménagement).
(1) Ces remerciements intervenaient environ trois mois après la fin de la collecte, temps nécessaire au Service des enquêtes et sondages de l’Ined (SES) pour saisir l’intégralité des coordonnées des personnes (et éventuelles personnes-relais) ayant accepté que l’on reprenne contact avec elles trois ans plus tard.
(2) Régnier-Loilier A., 2006, « À quelle fréquence voit-on ses parents ? », Population et sociétés, 427. Le choix de cette thématique avait été guidé par le souhait d’intéresser la majorité des répondants à l’enquête (18-79 ans) en proposant un sujet où la plupart des personnes se sentiraient concernées (soit en tant que parent, soit en tant qu’enfant).
(3) Bauer D., 2007, « Entre maison, enfant(s) et travail : les diverses formes d’arrangement dans les couples », Études et résultats, Drees, 570.
(4) Régnier-Loilier A., 2009, « L’arrivée d’un enfant modifie-t-elle la répartition des tâches domestiques au sein du couple ? », Population et sociétés, 461.
26Entre les vagues 2 et 3, 48 personnes ont annoncé leur refus de poursuivre ou un proche nous a annoncé leur décès. Pour la troisième vague, 6296 répondants aux vagues 1 et 2 étaient donc éligibles. À ceux-ci a été ajouté un échantillon de 1274 personnes ayant répondu à la première vague mais pas à la deuxième. Il s’agit principalement de personnes impossibles à joindre ou ayant refusé de répondre alors qu’elles ne s’étaient pas opposées au terme de la première vague à ce qu’un enquêteur reprenne contact avec elles. Le choix de tenter de recontacter ces personnes pour la troisième vague était motivé par le fait que les enquêteurs indiquaient qu’il ne s’agissait pas nécessairement de refus définitifs de participer à l’enquête, mais de refus de répondre à cette période-là, en raison de circonstances particulières (décès d’un proche, faible disponibilité, etc.). Un courrier leur avait donc été envoyé avant la troisième vague (printemps 2011) expliquant que nous n’avions pu les interroger en 2008, mais que nous souhaitions pouvoir les réinterroger en 2011. Si elles ne le souhaitaient pas, elles pouvaient le faire savoir par mail, courrier ou téléphone. Au final, sur les 7522 adresses, 5781 ont donné lieu à un entretien lors de la troisième vague, avec un taux de succès évidemment beaucoup plus important parmi les personnes ayant répondu aux deux premières vagues (87 %) que parmi celles qui n’avaient pas été interrogées en 2008 (27 %). Bien que le choix de recontacter pour la troisième vague des personnes impossibles à joindre, ou ayant refusé de répondre lors de la deuxième vague ait eu des implications fortes en amont de la collecte8 mais aussi en aval9, cette procédure de repêchage a ainsi permis d’interroger 345 personnes supplémentaires, soit 6 % de l’échantillon longitudinal.
27Au final, l’attrition entre les deux premières vagues a donc été bien plus élevée (35 %) qu’entre les deux suivantes (17 %10), résultat classique dans les enquêtes panel en France. Cela tient en partie à un effet de sélection. Les personnes peu intéressées par l’étude ou ayant trouvé le questionnement trop indiscret sont sorties de l’échantillon dès la fin de la première vague (près de 11 % des répondants de 2005 ont refusé que l’on reprenne contact avec eux pour la vague suivante contre seulement 4 % des répondants à la deuxième vague). En outre, les difficultés logistiques rencontrées entre les deux premières vagues ne se sont pas reposées ensuite11. Sur l’ensemble de la période d’enquête (2005-2011), l’attrition s’élève ainsi à 43 %12, laquelle est, dans environ un cas sur deux, imputable à des refus (de poursuivre suite à la première ou la deuxième vague, ou de répondre lors du passage de l’enquêteur), dans un cas sur deux à des pertes de contact, des personnes impossibles à joindre, hors champ (départs en institution, à l’étranger) ou décédées. Sur ce dernier point, nous ne connaissons pas le nombre exact de répondants décédés entre 2005 et 2011 mais on l’estime à 43013, soit 10 % de l’attrition totale.
28Le taux d’attrition observé dans Érfi est au final assez semblable à celui observé dans d’autres enquêtes panel après 6 ans : 59 % des répondants à la première vague du Panel européen des ménages ont répondu à l’ensemble des vagues de l’enquête entre 1994 et 2001 (Lhommeau, 2003) et 55 % pour les Statistiques sur les revenus et les conditions de vie (SRCV14, 2004-… ; Burricand et Lorgnet, 2014) contre 54 % des répondants à l’enquête Érfi15. Le taux d’attrition de ces deux enquêtes, qui sont annuelles, étaient cependant plus faible à trois ans (environ 25 % contre 35 %) dans Érfi, indiquant un meilleur suivi à court terme lorsque les vagues sont rapprochées. Toutefois, le taux de participation se dégrade ensuite, peut-être en raison de la charge que représente le fait de répondre chaque année à un questionnaire. Notons cependant qu’un certain nombre de facteurs influent sur l’attrition, comme l’autorisation de proxy ou le caractère obligatoire ou non de l’enquête. Sur ce dernier point, la déperdition de l’échantillon de l’enquête SRCV était très mesurée durant les 4 premières vagues alors que l’enquête était obligatoire mais s’est sensiblement accentuée ensuite lorsqu’elle a perdu son caractère d’obligation. Dans le même ordre d’idées, l’attrition observée dans l’enquête Santé et itinéraire professionnel (SIP) était de 19 % (contre 35 % pour Érfi après 3 ans), différence pour une bonne part expliquée par le caractère obligatoire de l’enquête SIP, mais aussi par l’annonce dès la première vague que l’enquête allait compter deux vagues. Ainsi, ceux qui acceptaient de prendre part à la première vague savaient qu’ils s’engageaient à répondre à la seconde vague. Ceci s’est traduit par très peu de refus d’être recontacté pour la seconde vague contre près de 10 % dans Érfi (Mermilliod, 2012). Cette procédure d’annonce d’une deuxième vague dès la prise de contact lors de la première vague de l’enquête SIP a cependant pu occasionner un biais de sélection à l’entrée avec davantage de refus de participer à l’enquête dès la première vague que dans Érfi.
2. Les facteurs liés à l’attrition : éléments descriptifs
29Au-delà du taux d’attrition dans son ensemble, nous avons cherché à repérer si certaines caractéristiques favorisaient ou au contraire venaient limiter la déperdition de l’échantillon. De manière descriptive d’abord, on se focalise sur la répartition géographique de l’attrition et sur l’effet de l’âge et du sexe du répondant.
a. Géographie de l’attrition
30L’attrition a été plus ou moins marquée selon les différentes régions (figure 1), avec au final une déperdition plus forte de l’échantillon dans les régions méditerranéennes et en Île-de-France (attrition supérieure à 50 %). Mais c’est surtout entre la première et la deuxième vague que les disparités régionales se sont jouées (figure 2). En effet, entre 2008 et 2011, les différences interrégionales sont plus faibles et certaines régions qui avaient subi de fortes pertes entre 2005 et 2008 comblent même une partie de leur retard avec un taux de participation à la troisième vague légèrement supérieur à la moyenne : c’est le cas de la Corse et du Languedoc-Roussillon. En revanche, l’Île-de-France qui avait déjà connu une attrition plus élevée en 2008 creuse son écart en 2011 en enregistrant le plus faible taux de suivi.
Figure 1. Taux d’attrition entre 2005 et 2011 par région

Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
31À l’inverse, les répondants des Pays-de-la-Loire, les mieux suivis entre les deux premières vagues, confirment leur plus grande « fidélité » par rapport aux autres régions en 2011 ; au final, il s’agit de la région où l’attrition a été la plus faible (31 %).
32Ces disparités régionales sont à rapprocher de la densité urbaine (figure 2), avec une attrition plus faible dans les petites villes et dans les zones rurales (33 % dans les communes de moins de 5000 habitants ; 39 % dans les communes rurales). Les habitants des grandes villes, et en particulier à Paris et dans les villes méditerranéennes, vivent majoritairement en appartement (en 2005, 73 % des répondants Érfi vivant à Paris sont dans ce cas, plus de 50 % des habitants de villes comptant au moins 100000 habitants, contre 5 % des habitants de communes rurales), logements souvent plus difficiles d’accès pour les enquêteurs que les quartiers pavillonnaires (code d’accès à l’entrée des immeubles, personnes plus difficiles à joindre). Ces populations très urbaines sont par ailleurs plus mobiles géographiquement ; elles ont plus souvent déclaré avoir l’intention de déménager dans les trois années à venir (20 % des répondants des villes de plus de 100000 habitants avaient l’intention ferme16 de déménager dans les trois ans contre moins de 8 % des habitants de communes rurales).
Figure 2. Taux d’attrition par région entre 2005 et 2008 et entre 2008 et 2011

Note : intervalles de confiance à 95 %. Les lignes horizontales continues matérialisent les taux d’attrition moyen (France entière). Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
33Toutefois, pour l’Île-de-France, l’attrition plus importante tient à des refus plus fréquents (plus forte défiance, moindre disponibilité) contrairement aux régions méditerranéennes où elle s’explique davantage par d’autres motifs (tableau 2)17 : les résidences secondaires y étant plus nombreuses, l’attrition pourrait s’expliquer par des difficultés accrues à rentrer en contact avec le ménage en raison d’absences de longue durée ; la population est également plus âgée, ceci pouvant expliquer davantage de départs en institution et de décès.
Tableau 2. Facteurs associés au risque d’avoir refusé de répondre à la vague 3 versus ne pas y avoir participé pour une autre raison (modèle logit, coefficients ß et seuil de significativité)

Champ : tous les non répondants de la troisième vague (2011). Lecture : un coefficient de signe positif (resp. négatif), statistiquement significatif, indique que l’on est en présence d’un facteur qui accroît (resp. réduit) la probabilité d’avoir refusé de participé à une vague. Légende : Réf. : situation de référence ; ★★★ significatif à 1 % ; ★★ significatif à 5 % ; ★ significatif à 10 % ; .
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
b. Une attrition plus élevée aux âges extrêmes et d’importantes différences selon le sexe aux jeunes âges
34À la fois entre les deux premières vagues et entre les vagues 2 et 3, l’attrition est bien plus élevée aux âges extrêmes, avant 30 ans et au-delà de 60 ans (figure 3). Pour les plus jeunes, l’attrition peut s’interpréter par une probabilité plus grande de mobilité : décohabitation de chez les parents, déménagement pour poursuivre des études, se mettre en couple ou suite à l’arrivée d’un enfant, changement de situation vis-à-vis de l’emploi. Pour les plus âgés, si la perte de contact peut également être attribuable à des déménagements suite au passage à la retraite par exemple, elle s’explique aussi par une plus forte propension à avoir refusé de poursuivre l’étude au terme du questionnaire de la première vague (Régnier-Loilier, 2009 ; 2011). À cela s’ajoutent également des sorties de champ plus fréquentes (départs en institution, en maison de retraite par exemple) et à une probabilité accrue de décès.
Figure 3. Taux d’attrition par sexe et âge entre 2005 et 2008 et entre 2008 et 2011

Note : l’âge est celui de 2005 pour l’observation de l’attrition entre 2005 et 2008 ; il correspond à celui observé en 2008 pour l’observation de l’attrition entre 2008 et 2011. Lissage des séries par modélisation incluant l’âge en continu (rapporté à la moyenne d’âge de l’échantillon) et son carré. Ces courbes « résument bien » les valeurs observées pour chaque âge (non présentées ici), en gommant les variations aléatoires.
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
35Plus dans le détail, la comparaison des taux d’attrition entre les vagues 1 et 2 et entre les vagues 2 et 3 laisse apparaître une inversion de tendance entre les plus jeunes et les plus âgés. Ces derniers ont bien moins fréquemment participé à la deuxième vague que les plus jeunes, mais ils ont un peu plus souvent répondu qu’eux à la troisième vague. Cela tient en partie à un effet de sélection des plus âgés suite à la première vague : les refus, on l’a rappelé, avaient été nettement plus nombreux de leur part mais, une fois cette sélection opérée, ils ne sortent pas plus fréquemment de l’échantillon que les plus jeunes.
36Enfin, quelle que soit la période observée (de la vague 1 à 2 ou de la vague 2 à 3), l’attrition est plus élevée du côté des hommes, mais l’écart est principalement marqué avant 50 ans : les jeunes hommes participent nettement moins à la vague suivante que les jeunes femmes.
3. Les facteurs d’attrition : « toutes choses égales »
37Bien des effets se conjuguent pour « expliquer » l’attrition. Il y a par exemple un lien fort entre la taille de l’unité urbaine, le type de logement et l’intention de déménager. Afin de mesurer l’effet « net » des différents facteurs sur la probabilité d’attrition, un ensemble de modélisations a été réalisé, en jouant sur les variables prises en compte dans la modélisation. Seuls trois modèles sont ici présentés (tableau 3). Les deux premiers prennent en compte la catégorie socioprofessionnelle de la personne et se distinguent par l’inclusion ou non de la durée du questionnaire en première vague (distinction faisant émerger un lien entre la composition du ménage et la durée de l’entrevue). Le troisième modèle reprend les mêmes caractéristiques que le deuxième, mais la catégorie socioprofessionnelle est remplacée par la situation détaillée d’activité (en tenant notamment compte du temps de travail afin de tester l’hypothèse d’un impact de la disponibilité sur l’attrition)18. Le choix des variables retenues fait suite aux hypothèses construites sur la base de la revue de la littérature présentée précédemment. Il s’agit des caractéristiques des personnes en 2005 (première vague). Quatre grands groupes de facteurs sont considérés : l’habitat, les caractéristiques sociodémographiques, la santé perçue et la sociabilité de la personne et, enfin, sa posture par rapport à l’enquête.
Tableau 3. Modélisation de la probabilité d’avoir répondu à la troisième vague de l’enquête Érfi (paramètres estimés de la régression logistique)

Champ : tous les répondants de la première vague (en 2005). Lecture : un coefficient de signe positif (resp. négatif), statistiquement significatif, indique que l’on est en présence d’un facteur qui accroît (resp. réduit) la probabilité d’avoir répondu à la 3e vague. Légende : Réf. : situation de référence ; ★★★ significatif à 1 % ; ★★ significatif à 5 % ; ★ significatif à 10 % ;
Source : Érfi-GGS13, Ined-Insee, 2005-2011.
a. L’habitat
38Toutes choses égales par ailleurs, notamment en tenant compte du type de logement, de la taille de l’unité urbaine et de l’intention de déménager dans les trois ans, on retrouve un effet spécifique pour l’Île-de-France et les régions méditerranéennes avec une moindre participation à la vague 3. L’explication est cependant différente, l’attrition tenant en Île-de-France à davantage de refus, contrairement à la région méditerranéenne où elle tient davantage à d’autres motifs (tableau 2). Les locataires, personnes vivant en appartement ou encore ayant exprimé leur intention de déménager dans les trois ans ont également été plus souvent perdus entre 2005 et 2011, en raison principalement d’une perte de contact plus fréquente (n’habite pas à l’adresse indiquée, impossible à joindre). À l’inverse, les propriétaires accédants et les résidants de communes de moins de 5000 habitants ont davantage pris part à la troisième vague. C’est en particulier le cas des agriculteurs pour qui l’attrition est bien plus faible, ceci s’expliquant par une moindre mobilité de ces populations et par un accès au logement plus simple pour l’enquêteur que dans les grandes villes.
b. Les caractéristiques sociodémographiques
39Les hommes, déjà sous-représentés dès la première vague de l’enquête19, ont connu une attrition plus forte, confirmant les résultats descriptifs (cf. plus haut) ; il en va de même des personnes plus jeunes et plus âgées. Il est à noter que leur moindre participation ne tient pas à des refus plus fréquents de participer mais davantage à d’autres motifs (impossible à joindre, partis sans laisser d’adresse, partis en institution, etc.). Les peu diplômés, les personnes au chômage et les étrangers ont également moins pris part à la troisième vague de l’enquête. Watson et Wooden (2009) ont relevé un refus plus fréquent de la part des étrangers d’être réinterrogés, ce qui ne se retrouve pas ici. Leur moindre participation à la troisième vague tient autant à d’autres facteurs qu’à un refus explicite (tableau 2).
c. Santé perçue, sociabilité
40Les personnes s’estimant en mauvaise santé, vivant seules ou étant en situation de monoparentalité avec un enfant en bas âge (moins de trois ans) en 2005 ont moins souvent répondu au questionnaire de 2011 ; cela ne tient pas à des refus plus fréquents de leur part mais à d’autres motifs (tableau 2). On peut faire l’hypothèse de départs en institution ou de décès plus fréquents pour les personnes en mauvaise santé ; pour les personnes seules, on peut penser à une prise de contact plus difficile pour l’enquêteur (plus le logement compte d’habitants, plus l’enquêteur a de chances de tomber sur quelqu’un lorsqu’il s’y rend).
41La « sociabilité » joue également un rôle significatif : les personnes ayant déclaré ne pas avoir été confidentes de leur entourage au cours des douze derniers mois20 ont ainsi moins souvent pris part à la troisième vague de l’enquête, avec des refus plus fréquents de poursuivre l’étude (tableau 2).
42À l’inverse, et suite au constat d’enquêteurs lors des bilans de tests ou des collectes, nous avions émis l’hypothèse d’une plus forte participation des personnes éprouvant un sentiment de solitude, la visite de l’enquêteur étant parfois perçue comme une occasion d’échanger avec l’extérieur. Toutefois, l’inclusion d’indicateurs de cet ordre21 dans le modèle ne laisse pas apparaître d’effets significatifs sur la probabilité d’avoir participé à la troisième édition de l’enquête (résultats non présentés ici).
d. Posture par rapport à l’enquête
43Les études méthodologiques mettent l’accent sur un lien entre l’attrition et la posture du répondant par rapport à l’enquête, son intérêt pour la thématique abordée dans le questionnaire et la manière dont s’est déroulé l’entretien. Si nous ne disposons que de peu d’informations à ce niveau, quelques indicateurs permettent cependant d’éprouver cette hypothèse pour l’enquête Érfi : le fait d’avoir refusé de répondre à certaines questions (revenu par exemple) ou que la réponse donnée aux questions dites « sensibles » (religion et Pacs) soit enregistrée22 ; le fait de ne pas avoir souhaité être destinataire des résultats de l’enquête ; ou encore la durée du questionnaire de 2005.
44Une posture de défiance par rapport à la collecte, avec par exemple le refus que l’enquêteur conserve les réponses données aux questions sensibles, conduit à un refus plus fréquent de participer aux vagues suivantes de l’enquête. Il en est de même pour les personnes ayant refusé de répondre à certaines questions (revenu mensuel par exemple). La plus forte attrition pour ces personnes tient pour beaucoup à des refus de poursuivre l’étude sans doute parce qu’elles ont estimé que le questionnaire était trop indiscret. De la même manière, le refus de recevoir les premiers résultats de l’enquête marque un moindre intérêt pour l’objet de l’étude et conduit, sans surprise, à davantage de refus de poursuivre et, in fine, à une attrition nettement plus marquée.
45Par ailleurs, si l’on s’attendait à une attrition plus forte pour les personnes ayant eu un premier entretien sensiblement plus long que la moyenne, suite à un possible effet de lassitude, c’est l’inverse que l’on observe : les personnes dont le questionnaire de la première vague a duré entre 1 h 15 et 2 h 30 ont une propension plus forte à avoir participé à la troisième vague. Ce résultat, qui semble aller à l’encontre des idées préconçues que l’on se fait (on se limite généralement à une heure de questionnement craignant un effet de déconcentration, mais aussi de lassitude chez le répondant), s’interprète en réalité assez bien dans le cas d’Érfi. Par le jeu des filtres, la variance de la durée du questionnaire est importante, et un questionnaire était d’autant plus long que la situation personnelle du répondant était en adéquation avec la thématique de l’enquête. Ces personnes (pour lesquelles l’entretien est long) ont ainsi pu se sentir davantage intéressées et concernées par l’enquête, expliquant leur meilleure participation aux vagues successives. Le fait d’intégrer la durée du questionnaire (modèle 2, tableau 3) annule en partie l’effet de la variable « type de ménage » observé dans le modèle 1 : vivre seul(e) sans enfant dans le ménage diminue la probabilité d’avoir répondu aux vagues suivantes si l’on ne tient pas compte de la durée du questionnaire, mais cet effet disparaît lorsque la durée du questionnaire est prise en compte.
46Outre la durée du questionnaire, c’est aussi la disponibilité au quotidien des personnes qui peut avoir un effet sur le suivi. En particulier, nous posions l’hypothèse que le fait d’exercer une activité professionnelle à temps plein, avec un temps de travail élevé, pouvait conduire à une moindre propension à participer aux vagues suivantes. À cette fin, le modèle 3 (tableau 3) intègre une variable de situation d’activité tenant compte du statut d’activité (salarié ou non) et du temps de travail de la personne lors de la première vague (variable qui se substitue à la catégorie socioprofessionnelle). Ni l’exercice d’une activité à temps partiel ni une durée hebdomadaire de travail supérieur à 40 heures n’ont d’impact.
4. D’une vague à l’autre : accentuation de la déformation de l’ échantillon ou effet de sélection ?
47Indépendamment des facteurs d’attrition observés entre les vagues 1 et 3, on peut se poser la question de la déformation de l’échantillon au fil des vagues. Entre les vagues 1 et 2, l’attrition n’avait pas été aléatoire (Régnier-Loilier, 2009 ; 2011) et entre les vagues 1 et 3, elle ne l’est pas non plus (cf. section précédente). Se pose alors la question de savoir s’il y a eu accentuation de la déformation de la structure de l’échantillon entre les vagues 2 et 3 (les mêmes facteurs explicatifs de l’attrition se rejouent à chaque vague) ou si l’attrition a été sélective entre les deux premières vagues, mais qu’elle a été plus aléatoire entre les vagues 2 et 3.
48Dit autrement, on peut faire l’hypothèse que certains facteurs ont pu jouer sur l’attrition entre les vagues 1 et 2, mais n’ont plus joué ensuite entre les vagues 2 et 3 par effet de sélection. Par exemple, les personnes peu intéressées par la thématique de l’enquête ou ayant trouvé les questions trop indiscrètes, ont pu refuser de poursuivre dès le terme de la première vague ; l’échantillon constitué pour la deuxième vague était donc de ce point de vue sélectionné, les personnes encore dans l’échantillon étant les plus volontaires et les plus intéressées pour poursuivre. À l’inverse, on peut faire l’hypothèse que d’autres variables, liées par exemple à la probabilité de mobilité ou de sortie de champ (décès, départ en institution), n’ont pas lieu de jouer différemment entre les vagues et se sont rejouées à l’identique entre les vagues 1 et 2 et entre les vagues 2 et 3.
49À partir de quelques indicateurs, il semble que les deux effets se combinent. L’ampleur de l’attrition observée entre les vagues 1 et 2 est bien supérieure à celle observée entre les vagues 2 et 3, plaidant en faveur d’un effet de sélection ; en revanche, la dispersion de la variable de pondération de la vague 3 est supérieure à celle de la vague 223, indiquant plutôt une accentuation de la déformation de la structure de l’échantillon.
50Afin d’affiner l’analyse nous avons, dans un premier temps, mis en regard deux modélisations calquées sur le même principe que le modèle 2 du tableau 3, mesurant la probabilité de suivi entre 2005 et 2008 et entre 2008 et 2011 (tableau 4)24. La comparaison des R2, classiquement faibles en sciences sociales, laisse cependant apparaître une moins bonne qualité du modèle « Suivi V2 V3 ». Bien que les modèles ne soient pas directement comparables (effectifs différents notamment), cela semble plaider en faveur d’un effet de sélection, du moins sur la base des variables retenues dans les modélisations : elles expliquent « moins » le suivi entre V2 et V3 qu’entre V1 et V2. Toutefois, la comparaison des modalités significatives laisse apparaître peu de différences, la plupart des facteurs liés à l’attrition entre 2005 et 2008 se rejouant entre 2008 et 2011.
Tableau 4. Modélisation de la probabilité d’avoir répondu à la deuxième vague (« suivi V1-V2 ») / à la troisième vague (« suivi V2-V3 ») de l’enquête Érfi

Champ : tous les répondants de la première vague (en 2005) pour le modèle ‘suivi V1-V2’ ; tous les répondants de la deuxième vague (2008) pour le modèle ‘suivi V2-V3’. Lecture : un coefficient de signe positif (resp. négatif), statistiquement significatif, indique que l’on est en présence d’un facteur qui accroît (resp. réduit) la probabilité d’avoir répondu à la vague suivante. Légende : Réf. : situation de référence ; ★★★ significatif à 1 % ; ★★ significatif à 5 % ; ★ significatif à 10 %.
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
51Quelle que soit la période inter-vagues, le suivi a été moindre en Île-de-France, pour les personnes ayant l’intention de déménager, aux âges extrêmes (les jeunes sont plus mobiles, les plus âgés conservent une plus forte propension à sortir du champ), refusant de répondre à certaines questions (revenu du ménage notamment), ne souhaitant pas recevoir les premiers résultats25 ou encore s’estimant en mauvaise santé ; le suivi est en revanche meilleur chez les agriculteurs, les habitants de communes comptant moins de 5000 habitants et pour les personnes plus diplômées.
52D’autres variables pour lesquelles on posait l’hypothèse d’un effet de sélection (donc d’un moindre effet entre 2008 et 2011) se rejouent cependant : c’est le cas du sexe et de la nationalité. Sur ce dernier point, le résultat n’est guère surprenant relativement à ce qui a été mis en avant plus haut : dans Érfi, l’attrition pour ces personnes ne s’explique pas plus par davantage de refus que la moyenne, contrairement aux résultats d’autres études montrant plus de refus de leur part lié à un moindre intérêt pour une enquête nationale.
53Certains facteurs ne jouent plus entre les vagues 2 et 3 : c’est le cas des plus bas diplômes, de la région méditerranéenne et des locataires (sur ce dernier point, on peut penser à un effet de sélection : les locataires les plus mobiles ont déménagé entre les deux premières vagues et ont été plus souvent perdus ; ceux qui restent sont les moins mobiles limitant le risque de perdre le contact26). Enfin, la durée du questionnaire ne joue plus sur le suivi entre 2008 et 2011, mais il est à noter qu’il s’agit de la durée observée en 2005 dans les deux modèles (celle de 2008 n’étant pas disponible).
54Au final, donc, la plupart des facteurs liés à une attrition plus forte entre les deux premières vagues se rejouent entre les deux vagues suivantes, accentuant la déformation de la structure de l’échantillon.
55Une seconde méthode a été testée afin de voir si la différence d’effet d’un même facteur était significative entre V1 et V2 et entre V2 et V3. L’effet d’une même variable peut en effet jouer dans le même sens ou être différent, mais sans que l’on sache si la différence est significative. Pour ce faire, les échantillons de 2005 et 2008 ont été « empilés » dans un même fichier, avec l’inclusion d’une variable permettant de repérer s’il s’agit de l’échantillon de la première ou de la deuxième vague (indicatrice de vague). On évalue ensuite la probabilité d’avoir participé à la vague suivante27 sur la base des modèles présentés en tableau 4, en incluant en plus cette indicatrice de vague ainsi que le facteur d’interaction entre celle-ci et chacune des variables du modèle. Une interaction statistiquement significative indique que l’effet de la variable est différent entre les vagues 1 et 2 et entre les vagues 2 et 3 ; un effet non significatif indique que l’effet est globalement de même ampleur (soit la variable ne jouait pas entre V1 et V2 et son effet est du même ordre entre V2 et V3, soit elle était significative entre V1 et V2 et joue dans le même sens entre V2 et V3). Cette modélisation (tableau 5) confirme un effet significativement différent pour les non diplômés et en région méditerranéenne (attrition plus forte en vague 2 qui disparaît en vague 3), pour l’âge, mais aussi pour la durée du questionnaire et le fait de souhaiter recevoir les premiers résultats (effet moindre en V3 allant dans le sens d’un effet de sélection au fil des vagues pour cette variable).
Tableau 5. Modélisation de la probabilité d’avoir répondu à la vague suivante et facteurs d’interaction avec la vague

Champ : tous les répondants de la première vague (2005) et de la deuxième vague (2008). Lecture : la probabilité de répondre à la vague suivante est significativement moindre en région Méditerranée (paramètre négatif et statistiquement significatif). Toutefois, l’effet de ce facteur est significativement différent entre les vagues 1-2 et entre les vagues 2-3 dans le sens d’une meilleure participation en vague 3 qu’en vague 2 (paramètre positif et statistiquement significatif). Légende : Réf. : situation de référence ; ★★★ significatif à 1 % ; ★★ significatif à 5 % ; ★ significatif à 10 %.
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
Conclusion
56L’attrition dans les enquêtes Generations and Gender Survey est une préoccupation de premier ordre, à plusieurs titres. En premier lieu, outre des considérations financières qui ont empêché certains pays de conduire les différentes vagues de l’enquête, l’attrition trop élevée entre les deux premières vagues de l’enquête en a conduit d’autres à renoncer à poursuivre l’enquête (c’est notamment le cas de l’Allemagne, où seul un tiers des personnes interrogées lors de la première vague a participé à la deuxième : voir également chapitre 1). Une déperdition trop élevée peut ainsi venir compromettre en partie l’objectif comparatif du projet. En deuxième lieu, l’attrition détermine plus généralement la qualité des données et, dans le contexte d’une opération internationale, il importe que celle-ci soit précisément documentée. L’étude préliminaire de l’attrition dans le volet français de l’enquête a permis de construire de manière raisonnée une variable de pondération longitudinale, mais il importera, dans une perspective de comparaisons internationales, de réfléchir à la construction d’une pondération qui soit relativement homogène entre les différents pays. Enfin, l’ampleur de l’attrition et la déformation de l’échantillon initial peut avoir des implications au niveau des études statistiques qui seront ensuite conduites. Outre une moindre précision statistique des estimateurs à mesure que la taille d’un échantillon diminue, une attrition trop sélective peut induire des biais sur les variables d’intérêt28. Si ce chapitre met en lumière un certain nombre de variables liées à une plus forte attrition, il ne met pas l’emphase sur les variables d’intérêt29 ni ne vise à estimer ces éventuels biais. L’enquête étant généraliste, les variables d’intérêt sont en effet très nombreuses et il importe à chaque chercheur de s’assurer que l’attrition n’affecte pas ses résultats, une fois la variable de pondération appliquée.
57Au terme des trois vagues de l’enquête Érfi (2005-2011), l’attrition atteint 43 %, taux semblable à ceux relevés dans d’autres enquêtes du même type en France. Comme dans la plupart des enquêtes longitudinales, c’est entre la première et la deuxième vague que l’attrition a été la plus forte (35 %)30. Au-delà de ce taux, notre étude révèle que les facteurs qui y sont associés sont globalement conformes à ceux observés dans d’autres enquêtes. Sur le plan des caractéristiques sociodémographiques, on trouve d’abord un effet significatif du sexe, de l’âge, du niveau de diplôme, de la nationalité. Sur ce dernier point cependant, il est intéressant de souligner que l’attrition ne tient pas pour les étrangers à des refus plus fréquents de participer aux vagues suivantes31, mais à d’autres raisons (perte de contact notamment). Le lieu de vie des personnes joue également fortement, avec une attrition plus forte dans les grandes villes, en Île-de-France, chez les locataires ou encore chez les personnes qui avaient l’intention de déménager. La posture du répondant par rapport à l’étude joue également un rôle important : une moindre coopération lors du premier questionnaire (refus de répondre à certaines questions) et un moindre intérêt pour l’étude (refus de recevoir les premiers résultats) s’accompagne d’une sortie plus fréquente de l’échantillon au fil des vagues. On notera cependant que l’on ne trouve pas d’effet négatif d’une durée élevée de questionnaire, au contraire : un questionnaire long s’accompagne d’un meilleur taux de suivi et inversement. L’architecture du questionnaire peut en partie expliquer cela, les personnes plus enclines à ne pas se sentir concernées par une enquête sur la famille se voyant interrogées sur beaucoup moins de questions que les personnes en couple, avec enfants, etc. Enfin, le fait d’être moins disposé à des échanges de confidences avec son entourage mais aussi, sans surprise, un mauvais état de santé s’accompagnent d’un moins bon suivi (risque plus fort d’être indisposé pour répondre, de se retrouver en institution, et risque supérieur de décéder entre les vagues). Toutefois, suite au retour des enquêteurs lors des bilans de collecte, nous faisions l’hypothèse d’un meilleur suivi des personnes se sentant plus isolées, certaines voyant dans la venue de l’enquêteur une occasion d’échanger. Celle-ci ne se vérifie pas sur la base des indicateurs ici utilisés.
58La mise en regard des facteurs associés à l’attrition entre les deux premières vagues et entre les deux suivantes montre que la plupart des facteurs se rejouent d’une vague à l’autre. Nous postulions notamment que les facteurs liés à une plus forte mobilité géographique ou à une prise de contact plus difficile avec le répondant avaient tout lieu de se rejouer d’une vague à l’autre, mais que cela devait être moins le cas pour les facteurs liés à une posture de refus en raison d’un effet de sélection : les personnes méfiantes ou peu intéressées pour répondre seraient sorties dès la fin de la première vague. En réalité, presque tous les effets qui pèsent sur l’attrition entre les deux premières vagues se rejouent entre les deux vagues suivantes, avec une intensité comparable (facteur d’interaction non significatif). Seuls les non diplômés, les habitants de la région méditerranéenne et les personnes ne souhaitant pas recevoir les résultats, dont la probabilité d’attrition est plus forte (paramètre estimé de signe négatif), ont mieux participé à la vague 3 qu’ils ne l’avaient fait lors de la vague 2 (facteur d’interaction positif et significatif). Cela pourrait traduire un effet de sélection mais, au final, la déformation de la structure de l’échantillon s’est amplifiée au fil des vagues, comme en atteste la dispersion plus élevée de la variable de pondération calculée suite à la troisième vague (par rapport à celle issue de la vague 2).
59Nous regrettons de n’avoir pu creuser davantage certaines hypothèses, notamment en lien avec les conditions de passation : quel est l’effet du sexe et de l’âge de l’enquêteur lors d’une étude dont les rapports de genre et les effets de générations sont au cœur du questionnement ? Malheureusement, ces informations ne sont pas disponibles dans l’enquête. Il importera, pour l’avenir, de mieux anticiper les informations à collecter en vue d’études méthodologiques. L’étude des facteurs liés à l’attrition et la mesure de leur impact entre les différentes vagues répond en effet à des objectifs méthodologiques plus généraux. En amont de la conception d’enquêtes notamment, une meilleure connaissance de ces facteurs peut éclairer les concepteurs à la fois dans la définition de l’échantillonnage (certaines catégories de personnes, plus sujettes à la déperdition, pourraient être surreprésentées dans le tirage initial afin de permettre de disposer d’effectifs suffisants pour les études en longitudinal), le choix des enquêteurs (sexe ou âge, selon la thématique de l’enquête), mais aussi dans les stratégies à mettre en œuvre pour suivre l’échantillon entre les vagues (un suivi plus ou moins rapproché pourrait être envisagé selon la probabilité d’attrition). En aval de la collecte, le repérage des facteurs liés à la déperdition de l’échantillon permet de mettre en œuvre de manière raisonnée la construction d’une variable de pondération visant à corriger la déformation de l’échantillon. En outre, répondre à la question de savoir si les mêmes facteurs d’attrition se rejouent entre les vagues a pour objectif de mettre en garde les utilisateurs des données sur les risques de biais d’analyses en longitudinal. Même si la construction de variables de redressement est toujours possible, une déformation excessive de la structure initiale de l’échantillon au fil des vagues doit inciter le chercheur à s’assurer que celle-ci n’affecte pas ses résultats.
Bibliographie
Des DOI sont automatiquement ajoutés aux références bibliographiques par Bilbo, l’outil d’annotation bibliographique d’OpenEdition. Ces références bibliographiques peuvent être téléchargées dans les formats APA, Chicago et MLA.
Format
- APA
- Chicago
- MLA
Références bibliographiques
10.1093/esr/jci037 :Behr A., Bellgardt, E. Rendtel U., 2005, “Extent and determinants of panel attrition in the European Community household panel”, European Sociological Review, 21(5), p. 489-512.
10.2139/ssrn.1663704 :Blom A., De Leeuw E., Hox J., 2011, “Interviewer effects on nonresponse in the European Social Survey”, Journal of Official Statistics, 27(2), p. 359-377.
Breuil-Genier P., Valdelièvre H., 2001, « Le Panel européen : l’intérêt d’un panel d’individus », Économie et statistique, 349-350, p. 17-40.
Buber-Ennser I., 2014, “Attrition in the Austrian Generations and Gender Survey: is there a bias by fertility-relevant aspects ?”, Demographic Research, 31 (16), p. 459-496.
10.3406/estat.2014.10422 :Burricand C., Lorgnet J.-P., 2014, « L’attrition dans SRCV : déterminants et effets sur la mesure des variables monétaires », Économie et statistique, 469-470, p. 19-35.
Charrance G., Razafindrastima N., 2012, « Les pondérations de la vague 3 de l’enquête Érfi », in Régnier-Loilier A. et Guisse N., Dictionnaire des codes. Troisième vague de l’enquête Érfi, document de travail interne, p. 17-35 ; nesstar.ined.fr/other_docs/IE0228_C.pdf.
Collomb P., 1979, « Les émigrants de l’Ouest audois dix-neuf ans après. Examen des méthodes de collecte et d’analyse », Population, 34 (1), p. 65-90.
10.2307/146433 :Fitzgerald J., Gottschalk P., Moffit R., 1998, “An analysis of sample attrition in panel data : the Michigan panel study of income dynamics”, The Journal of Human Resources, University of Wisconsin Press, 33 (2), p. 251-299.
10.1002/9781118490082 :Groves R., Couper M., 1998, Nonresponse in Household Interview Surveys, Wiley series in probability and statistics.
Holbrook A., Green M., Krosnick J., 2003, “Telephone versus face-to-face interviewing of national probability samples with long questionnaires. Comparisons of respondent satisficing and social desirability response bias”, Public Opinion Quarterly, 67, p. 79-125.
Jäckle A., Lynn P., Sinibaldi J., Tipping S., 2013, “The effect of interviewer experience, attitudes, personality and skills on respondent co-operation with face-to-face surveys”, Survey Research Methods, 7 (1), p. 1-15.
Laurie H., Smith R., Scott L., 1999, “Strategies for reducing non-response in a longitudianl panel survey”, Journal of Official Statistics, Vol. 15, p. 269-282.
Lhommeau B., 2003, « Trajectoires passées par un emploi à bas salaire. Une étude à partir du panel européen des ménages », Dares, Document d’études, 78.
Lipps O., 2007, Attrition in the Swiss Household Panel, Methoden-Daten Analysen, 1 (1), p. 45-68.
Loosvedt G., Pickery J., Billiet J., 2002, “Item nonresponse as a predictor of unit nonresponse in a panel survey”, Journal of Official Statistics, 18 (4), p. 545-557.
Mazuy M., Razafindratsima N., De La Rochebrochard É., 2005, Déperdition dans l’enquête « Intentions de fécondité », Ined, Document de travail, n° 129.
Mermilliod C., 2012, L’impact de la mise en place d’un suivi d’adresse entre les deux vagues de l’enquête santé et itinéraire professionnel (SIP), Document de travail, Série Sources et méthodes, 37, Drees.
10.1111/j.1467-985X.2005.00369.x :Nicoletti, C., Peracchi, F., 2005, “Survey response and survey characteristics: microlevel evidence from the European Community household panel”, Journal of the Royal Statistical Society, Series A, vol. 168, part 4, p. 763-781.
Razafindratsima N., Kishimba N., 2004, « La déperdition dans la cohorte Cocon entre 2000 et 2002 », Population, 59(3-4), p. 419-448.
Régnier-Loilier A., 2009, « La déperdition dans les enquêtes longitudinales : l’exemple de l’enquête Érfi », Courrier des statistiques, 128, p. 55-62.
Régnier-Loilier A., 2011, « Attrition entre les deux premières vagues de l’Étude des relations familiales et intergénérationnelles », in Tremblay M.-É., Lavallée P., El haj Tirari M. (dir), Pratiques et méthodes de sondage, Paris, Dunod, p. 254-258.
10.2307/1533494 :Riandey B., 1988, « La qualité du suivi des échantillons dans les enquêtes démographiques : un bilan », Population, 43(4-5), p. 829-854.
Sebille P., Régnier-Loilier A., 2007, Modifications to the Generations and Gender Surveys questionnaire in France (wave 1), Paris, Ined, Document de travail, 144.
Stoop I., 2005, The hunt for the last respondent. Nonresponse in sample survey, The Hague, Social and Cultural Planning of the Netherlands.
Uhrig N., 2008, The Nature and Causes of Attrition in the British Household Panel Survey, Institute for social and economic research, ISER Working Paper series, n° 2008-05.
Voorpostel M., Lipps O., 2011, “Attrition in the Swiss household panel : is change associated with drop-out ?”, Journal of Official Statistics, 27(2), p. 301-318.
10.1002/9780470743874.ch10 :Watson N., Wooden M., 2009, “Identifying factors affecting longitudinal survey response”, in Lynn P. (dir.), Methodology of Longitudinal Surveys, Chichester, John Wiley and Sons ; DOI : 10.1002/9780470743874.ch10.
Notes de bas de page
1 Pour plus d’informations concernant l’attrition dans l’enquête hongroise mobilisée dans le chapitre 13, se rapprocher de l’auteure.
2 Le calcul des poids longitudinaux s’est fait en deux temps : après examen des facteurs liés à l’attrition (présentés dans ce chapitre), nous avons procédé à la correction de la non-réponse puis au calage sur les marges issues de la première vague (voir Charrance et Razafindratsima, 2012).
3 Ce chantier reste entier et justifierait à lui seul une étude complète. Bien que chaque chercheur ait été invité à s’assurer que l’attrition n’affectait pas ses résultats, nous avons choisi dans cet ouvrage de nous focaliser sur la publication des résultats.
4 La « fiche de suivi » prévoyait le recueil de plusieurs numéros de téléphone du répondant ainsi que les coordonnées de deux personnes relais.
5 Résultats non présentés ici mais disponibles auprès des auteurs.
6 Les personnes partant vivre à l’étranger ou en institution (maison de retraite par exemple) n’étaient pas suivies.
7 Les deux échantillons de réserve ont été débloqués en fin de collecte car un effet de saturation de l’échantillon apparaissait, laissant craindre que l’objectif des 10000 répondants ne pourrait être atteint. Toutefois, en raison de contraintes budgétaires, la collecte a été stoppée une fois l’objectif atteint.
8 Notamment la mise en place d’un questionnaire spécifique permettant de faire la jonction avec la première vague. En effet, lors de la troisième vague, un ensemble de questions visait à collecter les évènements survenus depuis la deuxième vague mais, pour les non-participants à la deuxième vague, le questionnement rétrospectif a dû être étendu aux évènements survenus depuis la première vague.
9 Construction de deux pondérations longitudinales, l’une pour les exploitations mobilisant des informations issues des trois vagues, l’autre pour celles ne mobilisant que la première et la dernière vague.
10 Taux calculé sans tenir compte des 345 personnes interrogées en vagues 1 et 3, mais qui n’avaient pas répondu à la deuxième vague.
11 Plusieurs situations se sont en réalité cumulées suite à la première vague. Les fiches de suivi étaient complétées manuellement par l’enquêteur au terme du questionnaire, or certaines avaient été mal renseignées (imprécisions) et n’ont pas permis de retrouver le répondant au moment de la deuxième vague. En outre, pour quelques enquêteurs, les fiches de suivi ont été perdues. Enfin, des erreurs dans la saisie de l’identifiant individuel ont rendu l’appariement impossible entre le questionnaire et les coordonnées des personnes, conduisant à évincer quelques observations lors de la constitution de l’échantillon de la deuxième vague. L’expérience de ces « ratés » a conduit à plus de vigilance pour la troisième vague (pré-impression des fiches de suivi avec les coordonnées des personnes, à modifier uniquement en cas d’erreurs, photocopie systématique des fiches de suivi avant envoi par la Poste au service en charge de la saisie des adresses).
12 Si l’on considère les répondants aux vagues 1 et 3, sans tenir compte du fait d’avoir ou non répondu à la vague 2 ; mais 46 % des répondants de 2005 n’ont pas répondu aux trois vagues (soit à la vague 1, soit aux vagues 1 et 2, soit aux vagues 1 et 3).
13 Estimation de l’auteur à partir des tables de mortalité par groupes d’âges quinquennaux appliquées à la structure de l’échantillon de 2005.
14 L’enquête SRCV est la partie française du système communautaire EU-SILC : European Union-Statistics on income and living conditions.
15 5436 répondants parmi les 10079 personnes interrogées en vague 1 ont participé aux trois vagues.
16 Réponse « oui ».
17 Le tableau 2 présente les résultats d’une régression logistique modélisant la probabilité que l’attrition observée entre les vagues 1 et 3 provienne d’un « refus » plutôt que d’autres motifs (perte de vue du répondant, décès, etc.).
18 Ces deux variables ne sont pas intégrées dans un même modèle en raison de leur forte colinéarité.
19 La moindre participation des hommes est « classique » dans les enquêtes (moindre disponibilité et/ou intérêt pour répondre, plus difficiles à joindre, etc.).
20 L’intitulé de la question était : « Au cours des douze derniers mois, quelqu’un vous a-t-il parlé de sa vie privée ou de son moral ? ».
21 Plusieurs questions permettaient d’approcher ce sentiment de solitude. Par exemple : « Je vais maintenant vous lire plusieurs phrases sur votre vie actuelle. Pouvez-vous m’indiquer pour chacune dans quelle mesure elles vous correspondent… Vous ne vous sentez pas suffisamment entouré(e) », ou « Pouvez-vous me dire à quelle fréquence vous avez ressenti les choses suivantes au cours de la semaine dernière… Vous vous êtes senti(e) seul(e) ? ».
22 Le questionnaire de 2005 comportait deux questions sensibles au sens de la loi informatique et libertés, qui impliquaient que l’on avertisse le répondant de la présence de ces deux questions et qu’on lui demande en fin d’entretien s’il acceptait que l’on enregistre ses réponses ; le cas échéant, il devait alors signer un document (autorisation expresse), nominatif, confirmant qu’il acceptait l’enregistrement de ses réponses à ces deux questions. Pour plus d’explications sur ce point, voir Sebille et Régnier-Loilier, 2007.
23 La comparaison a été effectuée après normalisation des poids de 2008 et de 2011, afin de les rendre comparables, indépendamment de l’ampleur de l’attrition très différente entre 2005 et 2008 et entre 2008 et 2011.
24 Sauf mention contraire dans le tableau, les caractéristiques sont celles observées en 2005 pour le premier modèle (suivi V1-V2) et en 2008 pour le second modèle (V2-V3).
25 Un net effet de sélection apparaît au sujet du souhait de recevoir les premiers résultats : au terme du questionnaire de la première vague (2005), 7,7 % n’ont pas souhaité recevoir les premiers résultats contre 3,1 % au terme de la deuxième vague (2008) ; en revanche, la proportion de personnes refusant de renseigner la fourchette de revenu du ménage est identique, quelle que soit la vague, et très faible (1,5 %) comparativement à d’autres enquêtes (TeO, Ined-Insee, par exemple).
26 Dans les faits, les locataires occupent leur logement depuis 8 ans en moyenne en 2005 (médiane de 4 ans) contre 9 ans en moyenne en 2008 (médiane de 5 ans).
27 Pour l’échantillon de la vague 1, d’avoir répondu à la vague 2 ; pour l’échantillon de la vague 2 d’avoir répondu à la vague 3.
28 Pour exemple, dans l’enquête française Intentions de fécondité (Ined, 1998-2003), l’attrition élevée au terme des trois vagues d’enquête (70 %) a conduit à une déformation significative de la structure de l’échantillon mais aussi entraîné une modification significative du lien entre les variables d’intérêt (l’intention d’avoir un enfant, notamment) et ses facteurs explicatifs (Mazuy et al., 2005).
29 À cet égard, voir par exemple l’analyse réalisée par Isabelle Buber-Ennser (2014) à partir des deux premières vagues de l’enquête GGS autrichienne, où elle étudie le lien entre l’attrition et les variables relatives à la fécondité.
30 En regard avec d’autres pays ayant réalisé les deux premières vagues de l’enquête GGS, le taux d’attrition observé en France entre les vagues 1 et 2 se situe dans la moyenne (elle était par exemple de 17 % en Géorgie et 22 % en Autriche, mais atteint 68 % en Allemagne ou en République tchèque).
31 Par exemple, en raison d’un moindre intérêt pour une étude nationale ou de difficultés accrues de compréhension. Mais il est à noter que seuls des francophones étaient interrogés lors de la première vague.
Auteurs
Docteur en sociologie, chargé de recherche à l’Ined et rattaché à l’unité Fécondité, famille, sexualité. Il enseigne également en master les méthodes d’analyse quantitative à l’université Paris-Sorbonne. Ses principaux travaux portent sur la fécondité, la diversité des conjugalités et les relations enfants-parents en France. Ses réflexions portent également sur la méthodologie d’enquête. Responsable de la mise en place des trois vagues de l’enquête Generations and Gender Survey en France (Étude des relations familiales et intergénérationnelles, Érfi) réalisées en partenariat avec l’Insee entre 2005 et 2011, il a également coordonné, avec Wilfried Rault (Ined), l’enquête Étude des parcours individuels et conjugaux (Épic, 2012-2013, en partenariat avec l’Insee).
Chargée d’études et de recherche au Crédoc (Centre de recherche pour l’étude et l’observation des conditions de vie). Elle travaille principalement sur les questions liées à l’insertion socioprofessionnelle et à l’accès au logement.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Trajectoires et origines
Enquête sur la diversité des populations en France
Cris Beauchemin, Christelle Hamel et Patrick Simon (dir.)
2016
En quête d’appartenances
L’enquête Histoire de vie sur la construction des identités
France Guérin-Pace, Olivia Samuel et Isabelle Ville (dir.)
2009
Parcours de familles
L’enquête Étude des relations familiales et intergénérationnelles
Arnaud Régnier-Loilier (dir.)
2016
Portraits de famille
L’enquête Étude des relations familiales et intergénérationnelles
Arnaud Régnier-Loilier (dir.)
2009
Inégalités de santé à Ouagadougou
Résultats d’un observatoire de population urbaine au Burkina Faso
Clémentine Rossier, Abdramane Bassiahi Soura et Géraldine Duthé (dir.)
2019
Violences et rapports de genre
Enquête sur les violences de genre en France
Elizabeth Brown, Alice Debauche, Christelle Hamel et al. (dir.)
2020
Un panel français
L’Étude longitudinale par Internet pour les sciences sociales (Elipss)
Emmanuelle Duwez et Pierre Mercklé (dir.)
2021
Tunisie, l'après 2011
Enquête sur les transformations de la société tunisienne
France Guérin-Pace et Hassène Kassar (dir.)
2022
Enfance et famille au Mali
Trente ans d’enquêtes démographiques en milieu rural
Véronique Hertrich et Olivia Samuel (dir.)
2024