Chapitre 3. L’incohérence du nombre total d’enfants d’une vague à l’autre de l’enquête Érfi
p. 87-108
Note de l’auteur
Ce chapitre reprend les résultats publiés en 2014 dans la revue Population, 69 (2), p. 167-190.
Texte intégral
Introduction
1. La qualité des données en question
1La fiabilité des statistiques issues d’enquêtes sur échantillon dépend d’un ensemble d’éléments. Le taux de participation influe d’abord sur la représentativité des données. Certaines catégories de personnes sont en effet plus difficiles à joindre, d’autres refusent plus fréquemment de participer. La correction de la non-réponse et le calcul de variables de pondération sont alors indispensables afin de rendre l’échantillon représentatif. Mais la qualité des statistiques dépend aussi de la fiabilité de l’information recueillie. Celle-ci est étroitement liée à la formulation des questions (qui doit éviter toute équivoque) et aux possibilités qu’a la personne interrogée d’y répondre précisément. Les enquêtes rétrospectives tendent notamment à remonter de plus en plus loin dans le passé des personnes, augmentant le risque de défaillance de la mémoire ou de réinterprétation du passé (Auriat, 1996). Concernant plus spécifiquement la rétrospective des événements familiaux (naissances, mariages, etc.), sujet qui nous intéresse principalement ici, différentes recherches concluent à une plus grande fiabilité des dates collectées auprès des femmes (Poulain et al., 1991) et soulignent que les hommes omettent plus souvent de déclarer certains de leurs enfants1. C’est en particulier le cas quand ces derniers ne vivent plus avec leurs enfants (Toulemon, 1997) et qu’ils sont donc moins impliqués quotidiennement dans leur éducation (Joyner et al., 2011). Le phénomène est par ailleurs amplifié si le père n’est pas marié (Rendall et al., 1999).
2Le mode de collecte ou encore les conditions de passation jouent également de manière significative sur les réponses. La présence du conjoint conduit par exemple à une sous-déclaration des relations multi-partenariales ou de la consommation de drogues (Firdion, 1993). Par ailleurs, la présence de jeunes enfants durant l’entretien entraîne une moindre précision dans la datation d’événements passés : les enfants réclament parfois l’attention du répondant et réduisent sa concentration. À l’inverse, notamment lorsqu’un homme est interrogé, la présence de sa conjointe améliore la précision des dates (les conjoints se concertent alors, aidant au travail de mémoire). C’est aussi le cas pour la qualité des informations relatives à la répartition des tâches domestiques et parentales au sein du couple : la conjointe joue alors un rôle dans le contrôle de l’information qui est donnée à l’enquêteur, limitant les réponses visant à surestimer la participation de l’homme aux activités quotidiennes (Régnier-Loilier, 2014 ; Régnier-Loilier et Guisse, 2009).
3Les enquêtes longitudinales, qui consistent à interroger les mêmes personnes à plusieurs reprises, soulèvent d’autres questions concernant la qualité des données. La déperdition de l’échantillon au fil des vagues peut d’abord venir compromettre la robustesse des tests statistiques. En outre, l’attrition étant rarement aléatoire mais sélective (voir chapitre 2), elle entraîne une déformation de la structure de l’échantillon de départ qui peut affecter les variables d’intérêt de l’enquête et biaiser les résultats et l’interprétation qui en est faite (Razafindratsima et Kishimba, 2004 ; Mazuy et al., 2005). Par ailleurs, la réinterrogation de mêmes personnes aux différentes vagues d’enquête soulève la question de la cohérence des réponses collectées. Au-delà du risque d’erreurs de mémoire qui s’accentue avec le temps, le changement de situation d’une personne peut aussi modifier sa perception des choses, sa manière de se raconter (Mazuy et Lelièvre, 2005 ; Molinié et Laville, 2000). Par exemple, une rupture d’union s’accompagne le plus souvent d’une résidence des enfants chez la mère et, parfois, d’un affaiblissement voire d’une rupture des liens entre le père et ses enfants. Ce type de situation peut alors le conduire à ne plus déclarer les enfants qu’il ne voit plus lors de la vague d’enquête suivante. Ou, si les enfants partagent leur temps entre les domiciles des deux parents, le répondant peut à la fois considérer que ses enfants vivent chez lui mais aussi ailleurs, ce qui peut générer des doubles comptes.
2. Le recueil d’informations sur les enfants dans Érfi-GGS
4Les enquêtes longitudinales et internationales Generations and Gender Survey (chapitre 1 ; encadré 1) combinent un recueil d’informations rétrospectives à l’échelle de la vie lors de la première vague (histoire conjugale et génésique) puis, aux deux vagues suivantes (trois et six ans plus tard), des informations complémentaires sur les événements survenus depuis la vague précédente. Le questionnaire a ainsi été conçu de manière à ne pas redemander en vagues 2 et 3 des informations déjà collectées lors de la première vague, tout en évitant de confronter directement le répondant à ses propres réponses aux vagues précédentes. Toutefois, dans la mesure où les situations familiales sont susceptibles d’évoluer entre les différentes interrogations, la description des habitants du logement, des enfants vivant hors du ménage et des enfants décédés est reposée à l’identique à chaque vague d’enquête. Les questions doivent ainsi permettre de repérer les naissances et les décès d’enfants survenus entre les différentes vagues d’enquête, le départ d’enfants du foyer parental ou leur éventuel retour dans le ménage.
5Dans l’enquête GGS, il n’existe pas de question directe interrogeant le répondant sur le nombre total d’enfants qu’il a, celui-ci étant déduit de trois modules distincts du questionnaire, par addition des enfants décrits dans le ménage, des enfants vivant en dehors du ménage et des enfants décédés. Mais, lors de l’appariement des fichiers des deux premières vagues de l’enquête (2005 et 2008), et malgré un questionnement identique aux deux vagues, il s’est avéré que pour une proportion non négligeable de répondants, le nombre total d’enfants différait en 2005 et en 2008 (Régnier-Loilier, Saboni et Valdes, 2011). S’il est logique que le nombre total d’enfants soit plus élevé en 2008 qu’en 2005 (suite à d’éventuelles naissances), on observait également de nombreux cas pour lesquels le répondant avait déclaré moins d’enfants à la deuxième vague (8 % de l’ensemble des répondants à la deuxième vague). L’ampleur du phénomène pouvait faire craindre des erreurs techniques (mauvais appariement entre les vagues, erreur de calcul du nombre d’enfants, erreur de filtrage dans le questionnaire), mais les vérifications apportées ont permis d’écarter cette hypothèse (encadré 1).
6En examinant de plus près ce problème d’incohérence, la différence semblait provenir de personnes qui avaient déclaré en première vague des enfants non cohabitants et qui répondaient ne pas avoir d’enfant lors de la deuxième interrogation, mais sans qu’une explication convaincante ne puisse être apportée. Stratégie d’évitement de la part d’enquêtés se rappelant, suite à l’expérience de la première vague, que chaque enfant donnait lieu à une interrogation fouillée (une dizaine de questions pour chaque enfant) ? Sous-déclaration involontaire de la part des enquêtés estimant que leur situation n’avait pas changé depuis la vague précédente ? Ou alors, sur-déclaration d’enfants lors de la première vague, par exemple déclarés à la fois comme membre du foyer, mais également décrits comme vivant en dehors du ménage (hypothèse envisageable en première vague dans la mesure où la personne tirée au sort dans le ménage pour répondre à l’enquête n’était pas nécessairement celle ayant complété le tableau de composition du ménage2).
7Aucune investigation plus approfondie n’a pu être menée avant la troisième vague de l’enquête en 2011. Toutefois, lors de la mise en place de celle-ci, une attention particulière a été portée sur ce point. En premier lieu, un effort a été fait lors de la formation des enquêteurs afin de les sensibiliser à ce problème et une consigne spécifique a été ajoutée dans le questionnaire afin d’attirer leur attention au moment du module décrivant les enfants vivant en dehors du ménage : « Très important : recenser tous les enfants non cohabitants (en vie) du répondant, même si ceux-ci étaient déjà non cohabitants lors de la vague précédente ». Par ailleurs, afin de savoir si les différences observées tenaient à des omissions à une vague d’enquête ou, au contraire, à des doubles comptes, une question récapitulative plus directe a été ajoutée afin de savoir combien d’enfants l’enquêté(e) avait eu au cours de sa vie (voir formulation dans l’encadré 1). Au terme de la troisième vague, nous disposons donc, pour un même répondant, de quatre indicateurs de nombre total d’enfants : trois sont issus du décompte des enfants du ménage, hors ménage et décédés à chaque vague (en 2005, 2008 et 2011) et un quatrième indicateur provient de la question récapitulative posée à la troisième et dernière vague.
Encadré 1. Présentation des données et détermination du nombre total d’enfants dans Érfi-GGS
Rappels et précisions sur l’enquête
utiles à la bonne compréhension de ce chapitre
Âgée de 18 à 79 ans, la personne tirée au sort dans le logement pour répondre à l’enquête était interrogée sur son enfance, sa situation conjugale passée et présente, ses enfants, sa situation professionnelle et le cas échéant celle de son conjoint, son bien-être, ses opinions. Les mêmes personnes étaient recontactées trois et six ans plus tard (automne 2008 et automne 2011) pour répondre à un nouveau questionnaire. Aucun proxy n’était autorisé : si la personne ne souhaitait plus répondre, si elle était décédée, etc., l’interrogation n’avait pas lieu auprès d’un autre membre du ménage.
D’une vague à l’autre de l’enquête, le questionnaire est très proche, tant dans son architecture que dans son contenu ou dans la formulation des questions afin de garantir la comparabilité entre les vagues (voir chapitre 1). De la même manière, le mode de collecte a été identique aux trois vagues en France : questionnaire administré sous Capi(1) par des enquêteurs de l’Insee, en face-à-face au domicile des personnes sur l’ensemble du territoire métropolitain. Dans la mesure du possible, les mêmes enquêteurs étaient sollicités pour les différentes vagues, même s’il n’est malheureusement pas possible de repérer pour une personne donnée si elle a été interrogée ou non par le même enquêteur aux différentes vagues.
10079 personnes ont répondu à la première vague de l’enquête (2005), 6 534 à la deuxième (2008) et 5781 à la troisième (2011)(2). Parmi les répondants aux deuxième et troisième vagues, 5436 avaient répondu à la fois en 2005 et en 2008 tandis que 345 personnes n’avaient pas pu être interrogées lors de la deuxième vague. Si une variable de pondération corrige la déformation de l’échantillon liée à l’attrition, elle n’est pas utilisée dans ce chapitre, aucune représentativité n’étant ici recherchée.
La détermination du nombre total d’enfants dans l’enquête Érfi-GGS
Le questionnaire ne contient pas de question directe sur le nombre total d’enfants d’une personne. Celui-ci est déterminé a posteriori par décompte des enfants décrits dans trois modules distincts du questionnaire :
1) le module sur les « personnes vivant habituellement dans le logement » : on connaît alors précisément le lien entre chacune des personnes décrites dans le logement et le répondant : conjoint/ami du répondant, enfant eu avec le conjoint actuel, enfant eu avec un précédent conjoint, bel-enfant, enfant adopté, enfant accueilli (placement), frère ou sœur du répondant, frère ou sœur du conjoint, parent du répondant, parent du conjoint, grand-parent, petit-enfant ou arrière petit-enfant, autre membre de la famille du répondant, autre membre de la famille du conjoint, autre personne n’appartenant pas à la famille ;
2) le module « enfants non cohabitants », introduit par une question dont la formulation variait selon deux situations :
- Si le répondant avait décrit un ou des enfants dans le logement :
« Nous avons déjà parlé des enfants vivant au sein de votre ménage. Avez-vous adopté ou avez-vous eu vous-même d’autres enfants ? Ne prenez pas en compte les beaux-enfants, les enfants
accueillis ni les enfants aujourd’hui décédés, nous en parlerons après : Oui/Non » et, si oui, « Combien ? ».
- Si le répondant n’avait pas décrit d’enfants dans le logement :
« Avez-vous adopté ou avez-vous eu vous-même des enfants ? Ne prenez pas en compte les beaux-enfants, les enfants accueillis ni les enfants aujourd’hui décédés, nous en parlerons après : Oui/ Non » et, si oui, « Combien ? ».
Chaque enfant était ensuite décrit précisément : sexe, date de naissance, lien filial de l’enfant avec le conjoint actuel (le cas échéant), date de départ du foyer parental, fréquence des rencontres avec le répondant, note de satisfaction de la relation, situation parentale de l’enfant ;
3) le module « enfants décédés », introduit par la question « Il arrive que l’on perde un enfant. Avez-vous eu d’autres enfants qui sont aujourd’hui décédés ? Oui/Non » et, si oui, « Combien ? ». Chaque enfant était ensuite décrit : sexe, date de naissance, de décès, lien filial de l’enfant avec le conjoint actuel, situation parentale de l’enfant.
Le nombre total d’enfants du répondant est calculé à chaque vague par addition du nombre d’enfants du répondant décrits dans le tableau de composition du ménage, du nombre d’enfants non cohabitants et du nombre d’enfants décédés. En outre, lors de la troisième vague, une question récapitulative a été ajoutée dans l’enquête française, à la fin du module décrivant les enfants ne vivant pas dans le ménage : « Pour récapituler, combien d’enfants avez-vous eu vous-même en tout, qu’il s’agisse d’enfants eus ou adoptés, avec votre conjoint actuel ou avec un précédent conjoint ? Merci de prendre également en compte les enfants qui ne vivent plus avec vous ou qui sont aujourd’hui décédés ».
Les vérifications apportées
lors de l’appariement des trois vagues d’enquête
Afin de s’assurer que les différences de nombre d’enfants entre les vagues n’étaient pas le résultat d’erreurs techniques, plusieurs vérifications ont été faites. On s’est d’abord assuré du bon appariement des répondants entre les vagues. Plusieurs rapprochements ont en effet été effectués entre les informations présentes dans les différentes vagues : nombre de frères et sœurs du répondant, informations relatives aux parents, etc. En outre, un retour aux bases de données brutes contenant l’ensemble des informations issues de la collecte ont permis de rapprocher les prénoms des habitants du logement (notamment du conjoint), des enfants, etc. Autre piste, le nombre total d’enfants n’étant pas issu d’une question unique mais du décompte des enfants décrits dans le ménage, hors ménage et décédés, la différence pouvait être due à une erreur de construction des compteurs de nombre total d’enfants ou à une méthode de calcul différente aux deux vagues. Là aussi, les vérifications apportées ont permis d’écarter cette hypothèse. Troisième explication technique également rejetée, l’erreur de programmation informatique du questionnaire en deuxième vague : par le jeu des filtres, les questions visant à dénombrer les enfants hors ménage ou décédés auraient en effet pu ne pas être posées systématiquement, mais tel ne fut pas le cas. Par ailleurs, un éventuel « effet enquêteur » (les enquêteurs auraient par exemple pu indiquer qu’une personne n’avait pas d’enfants non cohabitants sans lui poser la question afin de gagner en temps de passation(3)) semble également pouvoir être écarté, la sous-déclaration ayant touché la plupart des enquêteurs et ne concernant jamais la majorité des fiches-adresse d’un même enquêteur.
(1) Collecte assistée par ordinateur (notamment gestion automatique des filtres).
(2) Voir le chapitre 2 pour une description précise de l’attrition et des facteurs qui lui sont associés.
(3) Les enquêteurs sont payés au questionnaire et non à l’heure, sur la base d’une durée de passation estimée lors de l’enquête pilote.
3. Objectifs et délimitation du champ de l’étude
8L’objectif de ce chapitre n’est pas d’évaluer la qualité de l’histoire génésique collectée dans Érfi en la confrontant à des sources externes3. Il s’agit ici de comparer, pour un même répondant, les quatre indicateurs dont on dispose afin de voir dans quelle mesure leurs résultats sont cohérents et de mieux comprendre les éventuels décalages observés. Le champ de l’étude est donc limité aux personnes ayant participé aux trois vagues de l’enquête, soit 5 436 observations (encadré 1).
9Quelle est l’ampleur des incohérences entre ces différents indicateurs ? Ces décalages proviennent-ils d’une sous-déclaration des enfants en vague 2 et/ou en vague 3 ou de doubles comptes d’enfants lors de la première vague ? Quels enfants disparaissent d’une vague à l’autre : des enfants appartenant au ménage lors de la vague précédente, des enfants vivant ailleurs, des enfants décédés ? Les personnes ayant sous-déclaré un ou des enfants en deuxième vague sous-déclarent-elles aussi leurs enfants à la troisième vague ? Y a-t-il un profil spécifique des personnes pour lesquelles des incohérences ont été relevées ?
10L’ampleur de la sous-déclaration étant importante et les données étant désormais diffusées auprès de la communauté des chercheurs4, l’objectif de cette étude est d’attirer l’attention des utilisateurs de l’enquête française Generations and Gender Survey (Érfi) sur ce problème de qualité des données. Plus largement, elle vise à susciter de la part des autres pays participant au programme GGP, une évaluation similaire et à attirer plus largement l’attention des concepteurs de futures enquêtes sur le risque de ne s’appuyer que sur des questions indirectes pour déterminer le nombre d’enfants d’une personne, qui plus est lorsqu’il s’agit d’une thématique centrale de l’étude.
I. Importante sous-déclaration des enfants chez les 45 ans et plus aux vagues 2 et 3
11De manière agrégée, confrontons d’abord le nombre moyen d’enfants par groupe d’âges et sexe, issu des quatre indicateurs de décompte des enfants (figure 1) : enfants du ménage, hors ménage et décédés en 2005 (décompte V1), 2008 (décompte V2) et 2011 (décompte V3), et le nombre total d’enfants obtenu par la question récapitulative posée en 2011 (récapitulatif V3), indicateur qui peut être considéré comme le plus fiable. Rappelons que les données ne sont pas pondérées, l’objectif n’étant pas une mesure de la fécondité par groupe d’âges, mais la comparaison d’indicateurs pour un même groupe de personnes.
Figure 1. Nombre moyen d’enfants par âge (en 2005) selon les 4 indicateurs de décompte des enfants

Champ : répondants aux trois vagues d’enquête (n = 5436). Note : données non pondérées ; âge du répondant en 2005. Lecture (exemple pour les hommes de 55-59 ans) : d’après le décompte des enfants (du ménage, hors ménage et décédés), les hommes de 55-59 ans ont déclarés 2,14 enfants en 2005 (décompte V1), 1,82 en 2008 (décompte V2), 1,82 en 2011 (décompte V3) et, d’après leur réponse à la question récapitulative du nombre total d’enfants, ils en ont déclaré 2,10 en 2011 (récapitulatif V3).
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
12Entre 18 et 44 ans (âge du répondant lors de la première vague), les différences entre les courbes décompte V1, décompte V2 et décompte V3 correspondent à des naissances : à chaque âge, le nombre moyen d’enfants est plus élevé en V3 qu’en V2, et plus élevé en V2 qu’en V1. En revanche, à partir de 45 ans, les courbes du décompte V2 et du décompte V3 se superposent et passent sous la courbe du décompte V1. Entre 45 et 79 ans, les personnes ont donc déclaré en moyenne moins d’enfants en 2008 et 2011 qu’en 2005 ( – 0,25 enfant). La parfaite superposition des courbes 2008 et 2011 pourrait laisser penser à une sur-déclaration d’enfants lors de la première vague. Toutefois, le niveau de l’indicateur récapitulatif V3 plaide plutôt en faveur d’une sous-déclaration d’enfants aux vagues 2 et 3. En effet, cette courbe se superpose presque parfaitement avant 40 ans à la courbe du décompte V3, ce qui est logique puisque les deux indicateurs sont calés sur la même année (2011), et presque parfaitement à la courbe du décompte V1 à partir de 45 ans (léger décalage chez les hommes entre 40 et 54 ans cependant). Cette confrontation indique que la méthode du décompte des enfants cohabitants, non cohabitants et décédés est plutôt fiable lors de la première vague, passés 45-50 ans5, et lors de la troisième vague chez les groupes d’âges encore féconds. La méthode du décompte semble en revanche induire une importante sous-déclaration aux vagues 2 et 3 de 0,25 enfant en moyenne, chez les personnes âgées de 45 à 79 ans en 2005.
13Cette confrontation reste cependant limitée dans la mesure où on ne se place pas au niveau individuel, mais à un niveau agrégé (comparaison de moyennes). Afin de valider la fiabilité de la méthode du décompte lors de la vague 1, on peut comparer pour un même individu le nombre total d’enfants eus ou adoptés, d’après la méthode du décompte et d’après l’indicateur récapitulatif en V3 (figure 2). Ainsi, trois configurations existent :
pour un individu i, le nombre d’enfants est identique s’il est déduit du décompte V1 ou du récapitulatif V3 ;
le nombre d’enfants obtenu par le décompte V1 est inférieur au nombre d’enfants déclaré au récapitulatif V3 (plus d’enfants en 2011 qu’en 2005 : naissances, sous-déclaration en V1, sur-déclaration ou double compte en V3) ;
le nombre d’enfants obtenu par le décompte V1 est supérieur au nombre d’enfants déclaré au récapitulatif V3 (moins d’enfants en 2011 qu’en
2005 : sur-déclaration en V1 ou sous-déclaration en V3).
Figure 2. Proportion de personnes déclarant autant, plus, moins d’enfants dans le décompte V1 par rapport à la question récapitulative V3

Champ : répondants aux trois vagues d’enquête (n = 5436). Note : données non pondérées ; âge du répondant en 2005. Lecture : 2 % des hommes de 60-64 ans (en 2005) déclarent moins d’enfants en vague 3 à la question récapitulative sur le nombre total d’enfants que d’après le décompte en vague 1 ; 95 % en déclarent autant et 3 % en déclarent davantage.
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
14Logiquement, la proportion de femmes dont le nombre d’enfants est supérieur en V3 est importante jusqu’à 40 ans environ (maximal chez les 25-29 ans en 2005) compte tenu de la naissance d’enfants à ces âges, puis elle devient infime (2 % entre 45 et 79 ans). On retrouve le même phénomène chez les hommes, bien que plus étalé sur les différents groupes d’âges, traduisant notamment une fertilité qui se prolonge au-delà de 45-49 ans, mais aussi une moindre stabilité des réponses au fil des vagues (nous y revenons plus loin). La proportion de femmes et d’hommes dont le nombre d’enfants est inférieur en V3 par rapport à V1 est infime (1,4 % pour l’ensemble des femmes de 18 à 79 ans ; 1,9 % pour les hommes). Pour les 45 ans et plus, la cohérence est donc très forte entre l’indicateur de décompte en V1 et l’indicateur récapitulatif en V3 à plus de 95 %, indiquant que le nombre total d’enfants déduit du décompte des enfants du ménage, hors ménage et décédés en 2005 est globalement fiable.
15Partant de ce constat, on peut désormais s’affranchir de l’indicateur récapitulatif en V3 et confronter les 3 indicateurs issus du décompte en V1, V2 et V3, toujours au niveau individuel. Toutefois, afin de se focaliser désormais sur la question de la sous-déclaration des enfants déclarés en vague 1 sans que les comparaisons entre les vagues ne soient perturbées par l’effet des éventuelles naissances aux âges féconds, on ne s’intéresse désormais qu’au décompte des enfants nés jusqu’en septembre 2005, c’est-à-dire avant le début de la collecte de la première vague. Si en moyenne (figure 1) la sous-déclaration semble de même ampleur en vague 2 et en vague 3, l’objectif est ici de voir si ce sont les mêmes personnes qui ont sous-déclaré en vague 2 et en vague 3 ou si certaines sous-déclarent à une vague mais pas à l’autre. À partir de ces trois indicateurs, un grand nombre de configurations est possible6. Pour simplifier, cinq situations sont ici confrontées pour un individu i (figure 3) :
le nombre d’enfants nés avant octobre 2005 est identique aux trois vagues : décompte V1 = décompte V2 = décompte V3 (catégorie « Autant aux 3 vagues ») ;
le nombre d’enfants est inférieur en V3 uniquement : décompte V3 < décompte V1 et décompte V3 < décompte V2, avec décompte V2 = décompte V1 (catégorie « Moins en V3 uniquement ») ;
le nombre d’enfants est inférieur en V2 : décompte V2 < décompte V1 et décompte V3 = décompte V1 (catégorie « Moins en V2 »),
le nombre d’enfants est inférieur en V2, et égal en V2 et V3 : décompte V2 < décompte V1, et décompte V2 = décompte V3 (catégorie « Moins en V2, autant en V2 et V3 »). La sous-déclaration serait donc identique aux vagues 2 et 3, ou bien il y aurait eu une sur-déclaration en V1 (possible double compte, par exemple la déclaration d’un même enfant à la fois dans le tableau des habitants du logement et résidant ailleurs ; c’est le cas des étudiants ou des enfants en résidence alternée qui partagent leur temps entre différents logements),
le nombre d’enfants est supérieur en V2 et/ou en V3 : décompte V1 < décompte V2 et/ou décompte V1 < décompte V3 (catégorie « Plus en V2 et/ou V3 »).
Figure 3. Proportion de personnes déclarant autant, plus, moins d’enfants nés avant 2005 aux différentes vagues d’après les 3 indicateurs de décompte V1, V2 et V3
Champ : répondants aux trois vagues d’enquête (n = 5436). Note : données non pondérées ; âge du répondant en 2005. Lecture : 76 % des hommes de 60-64 ans (en 2005) déclarent autant d’enfants (nés avant 2005) aux trois vagues, 8 % en déclarent moins en vague 3 (mais autant aux vagues 1 et 2), 7 % en déclarent moins en vague 2 (mais autant aux vagues 1 et 3), 5 % en déclarent moins en vague 2 mais autant aux vagues 2 et 3, et 4 % en déclarent plus en vague 2 et/ou en vague 3.
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
16Avant 40 ans, la confrontation des trois indicateurs offre des résultats relativement cohérents : le nombre d’enfants nés avant octobre 2005 est le même ou, dans quelques rares cas, il est supérieur en vagues 2 et/ou 3 par rapport à la vague 1 (en particulier chez les hommes). En revanche, au-delà de 40 ans, tant chez les femmes que chez les hommes, plus d’une personne sur cinq (environ 22 %) sous-déclare des enfants à la vague 2 et/ou à la vague 3. Et, fait notable, la sous-déclaration est relativement volatile : la majorité des personnes qui sous-déclarent ne le font qu’à une seule vague (en vague 2 ou en vague 3).
17Bien que nous ayons attiré l’attention des enquêteurs sur ce phénomène lors de la troisième vague (au cours des formations d’enquêteurs, dans les instructions de collecte affichées à l’écran dans Capi), la sous-déclaration d’enfants en vague 3 a été d’une ampleur similaire à celle observée en vague 2 (9 % et 8 %, respectivement, tableau 1). Par ailleurs, même si le fait d’avoir déclaré moins d’enfants en vague 2 par rapport à la vague 1 conduit plus souvent à en déclarer moins en vague 3 par rapport à la vague 1 (39 % en V2 par rapport à V1 contre 7 % en V3 par rapport à V17), le plus souvent la sous-déclaration n’a pas touché les mêmes personnes : parmi les « sous-déclarants » à l’une des vagues, 42 % n’ont sous-déclaré qu’en vague 38, 35 % qu’en vague 2 et 22 % ont sous-déclaré à la fois en vague 2 et en vague 3 (par rapport à la vague 1).
Tableau 1. Proportion de personnes ayant sous-déclaré des enfants en vague 2 et/ou 3 par rapport à la vague 1

Champ : répondants aux trois vagues d’enquête. (a) Effectifs entre parenthèses. Note : données non pondérées. Lecture : 38,6 % des personnes ayant déclaré moins d’enfants (nés avant 2005) en vague 2 par rapport à la vague 1 ont également déclaré moins d’enfants en vague 3 par rapport à la vague 1.
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
II. Les omissions : principalement des enfants hors ménage
18Les indicateurs utilisés décomptent trois catégories d’enfants : ceux vivant dans le ménage, ceux vivant en dehors du ménage et les enfants décédés. La sous-déclaration observée porte-t-elle sur l’ensemble des enfants déclarés en première vague ou sur une catégorie en particulier ? On sait, par exemple, que les enfants décédés tendent à être sous-déclarés dans les enquêtes ou que les hommes sous-déclarent parfois leurs enfants avec qui ils ne vivent plus, notamment suite à une séparation (Toulemon, 2005).
19La sous-déclaration pourrait également être liée au départ du foyer parental d’enfants qui étaient cohabitants lors de la première vague. Mais la sous-déclaration étant très nette chez les 55 ans et plus (en 2005), donc âgés d’au moins 58 ans en vague 2 et 61 ans en vague 3, âge auquel de moins en moins de personnes vivent encore avec leurs enfants9, cela laisse supposer que la sous-déclaration porte principalement sur des enfants non cohabitants.
20Si l’on compare les personnes ayant déclaré moins d’enfants en vague 2 et/ou 3 qu’en vague 1 à celles ayant déclaré le même nombre d’enfants aux trois vagues (tableau 1)10, les sous-déclarants se caractérisent par une proportion beaucoup plus importante de parents avec au moins un enfant non cohabitant : 84 % des sous-déclarants en vague 2 et 76 % en vague 3 étaient dans ce cas en 2005 contre 51 % des personnes ayant indiqué le même nombre d’enfants aux trois vagues. Ils sont également plus souvent parent d’un enfant décédé en 2005 (12 % contre 4 % des non sous-déclarants). À l’inverse, les sous-déclarants sont proportionnellement moins nombreux à cohabiter avec un ou des enfants en 2005. La sous-déclaration semble donc liée à la fois aux enfants non cohabitants et aux enfants décédés lors de la première vague.
21Afin d’affiner l’observation et de repérer quels enfants sont sous-déclarés, le nombre total d’enfants nés avant la première vague d’enquête est décomposé en trois compteurs dénombrant les enfants du ménage, les enfants hors ménage et les enfants décédés. L’observation est limitée aux personnes ayant sous-déclaré un ou plusieurs enfants en vague 2 d’une part (n = 443), et en vague 3 d’autre part (n = 498)11. Nous comparons le nombre d’enfants non cohabitants déclarés en vague 2 par rapport à la vague 1 puis les déclarations à la vague 3 par rapport à la vague 1 (tableau 2a). Nous procédons de même pour les enfants du ménage (tableau 2b) et pour les enfants décédés (tableau 2c).
Tableau 2. Comparaison du nombre d’enfants : a. non-cohabitants, b. cohabitants, c. décédés déclarés en 2005 et 2008 (vagues 1-2) et en 2005 et 2011 (vagues 1-3)

Champ : répondants ayant participé aux trois vagues d’enquête, parent d’au moins un enfant en 2005 (cohabitant, non cohabitant ou décédé) et ayant déclaré moins d’enfants (nés avant 2005) en 2008 qu’en 2005 (n = 443)/moins d’enfants (nés avant 2005) en 2011 qu’en 2005 (n = 498). Note : données non pondérées. Lecture (exemple tableau « a. Vagues 1-2 », ligne « 0 » colonne « 2 ») : parmi les 443 sous-déclarants à la vague 2, 132 personnes ont déclaré avoir 2 enfants hors ménage en 2005 et 0 enfant hors ménage en 2008.
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
22La sous-déclaration apparaît d’abord majoritairement liée au fait d’avoir déclaré en 2005 un ou plusieurs enfants non cohabitants. En effet, 9 sous-déclarants sur 10 n’ont indiqué aucun enfant décédé en 2005. Pour eux, la sous-déclaration ne peut donc porter que sur les enfants cohabitants ou non cohabitants en 2005. De même, 6 sous-déclarants sur 10 n’ont indiqué aucun enfant cohabitant (première colonne des tableaux 2b et 2c). À l’inverse, 8 sous-déclarants sur 10 avaient en 2005 au moins un enfant non cohabitant.
23Les diagonales des tableaux 2 indiquent que le nombre d’enfants déclaré (nés avant la vague 1) est le même aux deux vagues mises en regard (2005 et 2008 ou 2005 et 2011) ; les valeurs situées au-dessus de cette diagonale (chiffres en gras) indiquent que le nombre d’enfants déclaré en 2008 (ou 2011) est inférieur à celui déclaré en 2005 ; les valeurs situées sous cette diagonale (chiffres en italique) indiquent que le nombre d’enfants déclaré en 2008 (ou 2011) est supérieur à celui déclaré en 2005. Qu’il s’agisse de 2008 ou de 2011, les sous-déclarants ont assez rarement déclaré moins d’enfants décédés (tableau 2c) qu’en 2005 : la plupart des effectifs se situent en effet sur la diagonale et même à l’intersection de la ligne « 0 enfant » et de la colonne « 0 enfant ». Ainsi, 35 enfants décédés, déclarés en 2005, ne sont plus déclarés en 2008 et 34 ne le sont plus en 2011. Si ce nombre d’enfants décédés non déclarés en vague 2 ou en vague 3 est important relativement à l’ensemble des enfants décédés décrits par les sous-déclarants en vague 1 (plus de la moitié), il est cependant loin d’expliquer la sous-déclaration dans son ensemble : cette trentaine de cas représente moins de 10 % du nombre total de sous-déclarants.
24En réalité, 80 % des sous-déclarants ont indiqué moins d’enfants non cohabitants en 2008 et en 2011 qu’en 2005 (tableau 2a) : les effectifs se situent massivement au-dessus de la diagonale. Plus encore, on observe une concentration très forte des effectifs sur la première ligne du tableau, quel que soit le nombre d’enfants déclaré en 2005. Ceci signifie que la sous-déclaration ne concerne pas un enfant non cohabitant parmi la descendance, mais l’ensemble des enfants non cohabitants. Par exemple, sur les 443 personnes ayant déclaré moins d’enfants en 2008 qu’en 2005, la moitié (219) avaient déclaré au moins 2 enfants non cohabitants en 2005 et ont indiqué ne pas en avoir du tout en 2008. Les sous-déclarants sont au final, dans près de 8 cas sur 10, des personnes ayant répondu négativement à la question : « (le cas échéant : Nous avons déjà parlé des enfants vivant au sein de votre ménage). Avez-vous adopté ou avez-vous eu vous-même (d’autres) des enfants ? Ne prenez pas en compte les beaux-enfants, les enfants accueillis ni les enfants décédés. Nous en parlons après ». Le même phénomène s’observe pour les sous-déclarants en vague 3.
25En revanche, si l’on compare le nombre d’enfants cohabitants décrits aux différentes vagues, la mécanique apparaît assez différente (tableau 2b). Lorsque le nombre d’enfants cohabitants observé en vague 2 et/ou 3 est inférieur à celui observé en vague 1, les effectifs ne sont pas concentrés sur la première ligne du tableau. Par exemple, sur les 46 sous-déclarants de 2008 (vague 2) qui cohabitaient avec 2 enfants en 2005, 23 cohabitent encore avec un enfant en 2008. Dans ces cas de figure, la sous-déclaration pourrait être liée au départ du foyer parental d’un des enfants et donc à une omission dans la description des enfants vivant hors du ménage en 2008.
III. Pas de profil spécifique des sous-déclarants
26Afin de mieux comprendre les omissions observées, nous avons établi un portrait « type » des répondants ayant sous-déclaré le nombre de leurs enfants à la deuxième et/ou à la troisième vague d’enquête, à partir de trois régressions logistiques (tableau 3) :
le modèle a modélise le fait d’avoir déclaré moins d’enfants en vague 2 qu’en vague 1,
le modèle b modélise le fait d’avoir décrit moins d’enfants en vague 3 qu’en vague 1,
le modèle c modélise le fait d’avoir décrit moins d’enfants en vague 2 et/ou 3 qu’en vague 1.
27Différents facteurs sont pris en compte, la plupart relatifs à la situation observée lors de la première vague12 :
caractéristiques individuelles des répondants en 2005 : sexe, âge et niveau de diplôme : ce dernier peut être considéré comme un proxy d’une plus ou moins grande aisance à comprendre les attendus d’une question ;
rupture conjugale depuis la première vague : le fait de s’être séparé peut conduire à une rupture des liens avec les enfants ;
nombre d’enfants cohabitants, non cohabitants et décédés décrits en
2005 : cela permet d’apprécier l’effet des configurations plus ou moins liées à la sous-déclaration ;présence d’enfant(s) non cohabitant(s) avec qui le lien est rompu en
2005 (aucune rencontre par an) : la rupture du lien et le temps qui passe ont pu conduire le répondant à ne plus déclarer ces enfants. En outre, les relations enfants-parents après une séparation étant « genrées » (Régnier-Loilier, 2013), une interaction avec le sexe du répondant a été introduite dans le modèle ;posture du répondant par rapport à l’enquête en 2005 : refus de répondre à certaines questions, en l’occurrence au revenu du ménage et à l’enregistrement des réponses aux questions « sensibles » au sens de la Cnil (pacs et religion), refus de recevoir les premiers résultats (marquant un moindre intérêt pour l’objet de l’étude), durée du questionnaire (le souvenir d’un questionnaire trop long a pu conduire le répondant à vouloir en limiter la durée lors des vagues suivantes) ;
comparaison des conditions de passation (présence ou non d’une tierce personne lors de l’entretien) par rapport à la vague 1 : la présence du conjoint peut limiter les risques de mauvaise compréhension des questions et le conjoint peut, le cas échéant, rectifier une réponse, mentionner un oubli, etc.
28Le champ est limité aux répondants ayant participé aux trois volets de l’enquête et ayant déclaré avoir au moins un enfant en 2005 (la sous-déclaration n’étant pas possible dans le cas contraire).
Tableau 3. Facteurs associés au fait d’avoir déclaré moins d’enfants en 2008 et/ou 2011 par rapport à 2005 (modèle logit, coefficents ß et seuil de significativité)

Champ : répondants âgés de 18 à 79 ans en 2005, ayant participé aux trois vagues d’enquête et ayant déclaré au moins un enfant en 2005. Note : données non pondérées. Lecture : un coefficient positif (resp. négatif), statistiquement significatif, indique que l’on est en présence d’un facteur qui accroît (resp. décroît) la probabilité d’avoir déclaré moins d’enfants qu’en 2005. Légende : Réf. : situation de référence ; ★★★ significatif à 1 % ; ★★ significatif à 5 % ; ★ significatif à 10 % .
Source : Érfi-GGS123, Ined-Insee, 2005-2008-2011.
29De manière générale, le pouvoir explicatif des modèles a, b et c est extrêmement faible. Les facteurs pris en compte pèsent donc peu sur le phénomène de sous-déclaration. Ce sont principalement les caractéristiques liées aux « types » d’enfants décrits par le répondant en 2005 qui jouent. Ainsi, dans les trois modèles, la probabilité de sous-déclaration est significativement plus faible si le répondant n’avait aucun enfant non cohabitant en 2005, ce qui confirme nos premières observations : la sous-déclaration du nombre total d’enfants est étroitement liée à la présence d’enfants non cohabitants lors de la première vague. En revanche, le nombre d’enfants non cohabitants en tant que tel (avoir 1, 2 ou 3 enfants et plus) n’a pas d’influence. La sous-déclaration apparaît également plus probable si le répondant a mentionné avoir un ou plusieurs enfants décédés au moment de la première vague de l’enquête. Ceux-ci tendent donc à ne plus être évoqués lors des vagues suivantes. La présence d’enfants cohabitants en 2005 n’a que peu d’effets sur la probabilité de sous-déclarer des enfants lors des vagues suivantes (seul un effet apparaît dans le modèle c13. Enfin, le fait d’avoir décrit un ou plusieurs enfants en 2005 avec qui le lien était rompu (absence de rencontre dans l’année) augmente la probabilité d’avoir déclaré moins d’enfants lors de la ou des vagues suivantes. Le facteur d’interaction avec le sexe du répondant est lui aussi significatif (à l’exception du modèle b) et montre un effet de sous-déclaration bien moins marqué du côté féminin. Ce résultat renforce l’hypothèse d’une omission d’enfants par les hommes suite à une rupture conjugale déjà observée dans l’enquête Étude de l’histoire familiale de 1999 (Toulemon, 2005).
30L’évolution des conditions de passation par rapport à la première vague a également un effet significatif dans les modèles a et c : si une tierce personne assistait à l’entretien en 2005, mais que l’entretien se déroule en tête-à-tête à l’une des vagues suivantes, la probabilité d’omission est alors plus grande. La présence d’un tiers, le plus souvent le conjoint, pourrait ainsi jouer un rôle de régulateur des réponses fournies par le répondant, en évitant le risque d’omission ou de mauvaise compréhension des questions.
31Nous indiquions précédemment que les sous-déclarants étaient partiellement les mêmes aux deux vagues. Afin de repérer un éventuel effet cumulatif de sous-déclaration d’une vague à l’autre, nous avons inclus dans le modèle b une indicatrice de sous-déclaration lors de la vague 2. L’effet est significatif et il s’agit de la variable dont le paramètre estimé est le plus élevé du modèle (1,62), révélant une probabilité bien supérieure des sous-déclarants à la vague 2 d’omettre certains enfants en vague 3, toutes autres choses étant égales par ailleurs.
32Au-delà de l’effet de ces deux variables et de la situation parentale du répondant, presqu’aucune des autres caractéristiques incluses dans les modélisations n’influence la probabilité de sous-déclarer : le fait de s’être séparé ne joue pas, pas plus que le diplôme, le sexe ou l’âge, passé 50 ans (la sous-déclaration est moindre chez les plus jeunes, cf. les observations de la figure 3) ; on ne relève pas non plus d’incidence de la posture par rapport à l’enquête ou de la manière dont l’entretien s’est déroulé, notamment pas d’effet de la durée du questionnaire. Ces derniers résultats ne plaident pas en faveur de l’hypothèse d’une possible « stratégie d’évitement » de la part des enquêtés.
Conclusion
33Dans le cadre des vagues successives de l’enquête Érfi-GGS, il nous a paru important de nous interroger sur la qualité des données collectées, relatives au nombre d’enfants. En premier lieu, cette analyse confirme bien une sous-déclaration des enfants décédés dans les enquêtes. Par ailleurs, un important décalage dans le dénombrement des enfants non cohabitants apparaît entre les trois vagues d’enquête et ce, quel que soit le sexe de la personne interrogée. En moyenne, les répondants âgés de 50 ans et plus en 2005 déclarent 0,25 enfant de moins en vague 2 et en vague 3 par rapport à la première vague. Si l’on pouvait suspecter des doubles comptes d’enfants en vague 1, cette piste doit être rejetée. L’introduction d’une question récapitulative du nombre total d’enfants du répondant lors de la dernière vague permet en effet de valider l’information recueillie lors de la première vague et plaide ainsi en faveur d’un phénomène d’omission aux vagues 2 et 3.
34Une récente étude conduite à partir du Continuous British Household Survey montrait que la proportion de personnes sans enfant tendait à augmenter au fil des vagues successives de l’enquête. Le moins bon report des enfants dans cette enquête semble tenir à un changement intervenu dans les instructions de collecte aux enquêteurs, la réorganisation de l’enquête, la modification du mode de collecte, mais aussi l’allongement substantiel du questionnaire (Ní Bhrolcháin et al., 2011). Toutefois, dans l’enquête française GGS, aucun de ces facteurs ne semble pouvoir expliquer les omissions observées : l’architecture du questionnaire est identique aux trois vagues, la formulation des questions est similaire, le mode de collecte est demeuré inchangé. Seul le fait que les conditions de passation aient pu évoluer, avec la présence d’un tiers lors de la première vague puis un entretien en tête-à-tête lors de la deuxième vague, augmente la probabilité d’omission.
35L’hypothèse d’un « effet d’apprentissage » ou « effet panel » peut être proposée : au fil des vagues, les participants se familiariseraient avec le filtrage du questionnaire en anticipant qu’une réponse positive à la question « Avez-vous eu des enfants ? » déclenche ensuite une série de questions pour chaque enfant. Les omissions seraient alors à mettre sur le compte de stratégies d’évitement de la part des enquêtés. Mais cette hypothèse paraît fragile pour plusieurs raisons. En premier lieu, on ne note aucun effet de la durée du questionnaire lors de la première vague sur la probabilité de sous-déclaration aux vagues suivantes. En outre, la description des enfants intervenant plutôt en début de questionnaire, un effet de lassitude du répondant paraît peu probable à ce moment-là de l’entretien. Par ailleurs, la majorité des omissions relevées lors de la deuxième vague ne se retrouvent pas lors de la troisième vague. Enfin, lors de l’étude des caractéristiques liées à l’attrition entre les vagues 2 et 3 (chapitre 2), nous avions inclus comme variable explicative le fait d’avoir ou non déclaré moins d’enfants en 2008 qu’en 2005 avec l’hypothèse qu’une sous-déclaration pouvait traduire un effet de lassitude de l’enquêté et s’être accompagnée d’une attrition plus forte, mais aucun effet significatif n’a été relevé.
36L’absence d’effet des caractéristiques individuelles sur la sous-déclaration (en dehors du nombre d’enfants cohabitants, non cohabitants et décédés en vague 1) et la volatilité de celle-ci selon les vagues (les sous-déclarants de la vague 2 et de la vague 3 ne sont que partiellement les mêmes personnes) montrent un phénomène plutôt aléatoire, difficile à comprendre. Par élimination, l’explication qui semble à ce jour la plus convaincante est l’imprécision de la question utilisée pour recenser les enfants non cohabitants dans un contexte de réinterrogation. Dans les questionnaires des vagues 2 et 3, on demande aux enquêtés s’ils ont « adopté ou eu des enfants » (ou « d’autres enfants » pour ceux ayant décrits au moins un enfant dans le ménage), mais il n’est pas fait mention explicitement au fait d’avoir « des enfants ne vivant pas dans le ménage » ou « vivant ailleurs ». Certains répondants ont pu estimer qu’ils avaient déjà décrit leurs enfants dans la ou les vagues précédentes et qu’il n’y avait plus lieu d’en reparler ou, plus simplement, qu’ils n’avaient pas eu d’enfants depuis la dernière vague. Cette piste est d’autant plus plausible que les omissions concernent principalement des personnes qui ne cohabitent plus au moment de l’enquête avec leurs enfants, et pour lesquelles la question posée était alors « Avez-vous adopté ou avez-vous eu vous-même des enfants » (tandis qu’elle était précédée de « Nous avons déjà parlé des enfants vivant au sein de votre ménage », pour celles et ceux qui avaient décrit au moins un enfant dans le foyer). Plus encore, cette question suivait alors sans transition une question faisant référence aux douze derniers mois écoulés : « Au cours des douze derniers mois, avez-vous gardé des enfants ne faisant pas partie de votre ménage ? ». Certains enquêtés ont alors pu comprendre la question comme « au cours des douze derniers mois… avez-vous adopté ou avez-vous eu vous-même des enfants ». Toutefois, cette explication est fragile dans la mesure où l’enchaînement des questions est resté inchangé au fil des vagues. Comment expliquer alors que ce phénomène d’omission ne se retrouve pas lors de la première vague d’enquête ?
37Si cette étude ne permet pas de donner une explication tranchée au phénomène d’omission d’enfants dans l’enquête Érfi-GGS, elle présente au moins deux intérêts. Le premier est de sensibiliser les utilisateurs des données à ce problème afin qu’ils en tiennent compte dans la réalisation de leurs exploitations et analyses à partir des données longitudinales. À ce jour, aucune imputation n’a en effet été réalisée dans les données diffusées, ni au niveau national ni dans les bases internationales harmonisées14. Ainsi, il importe de récupérer les enfants « manquants » de la première vague d’enquête pour toute étude s’appuyant sur les données de la deuxième ou de la troisième vague. De même, la description des petits-enfants (partie introduite en vague 3) est également biaisée dans la mesure où cette section n’était posée qu’aux répondants ayant au moins un enfant de 16 ans ou plus. Le second intérêt est d’attirer l’attention des concepteurs de futures enquêtes longitudinales sur ce risque de sous-déclaration dès lors que l’on n’introduit pas une question directe pour dénombrer les enfants, mais que l’on procède par cumul d’informations collectées à différents moments du questionnaire. La méthode du décompte des enfants cohabitants, non cohabitants et décédés pour déterminer le nombre total d’enfants paraît certes fiable dans l’enquête française, mais uniquement pour la première vague. La collecte de l’enquête française ayant eu lieu sous Capi, il aurait peut-être été judicieux de mettre en place aux vagues 2 et 3 une procédure de « validation/ correction » des informations collectées lors de la vague précédente (par exemple, rappeler la composition du ménage en demandant si la situation avait évolué)15. Il restera à vérifier si ce problème se retrouve dans d’autres enquêtes, notamment dans les enquêtes GGS qui ont eu lieu dans les autres pays quand les données seront disponibles. Une étude méthodologique réalisée à la suite de la première vague de l’enquête GGS allemande, critique à l’égard de la validité de l’histoire génésique recueillie, concluait également à la trop grande complexité du processus de collecte des enfants non cohabitants et regrettait l’absence d’une question récapitulative simple (Kreyenfeld et al., 2013), point de vue que nous partageons ici.
Bibliographie
Des DOI sont automatiquement ajoutés aux références bibliographiques par Bilbo, l’outil d’annotation bibliographique d’OpenEdition. Ces références bibliographiques peuvent être téléchargées dans les formats APA, Chicago et MLA.
Format
- APA
- Chicago
- MLA
Références bibliographiques
Auriat N., 1996, Les défaillances de la mémoire humaine. Aspects cognitifs des enquêtes rétrospectives, Paris, Éditions de l’Ined, coll. « Travaux et documents », 136.
10.2307/1534179 :Firdion J.-M., 1993, « Effet du rang d’appel et de la présence du conjoint dans une enquête par téléphone », Population, 48 (5), p. 1281-1314.
Hertrich V., 1997, « Les réponses des hommes valent-elles celles des femmes ? Une double collecte sur les questions génésiques et matrimoniales dans une population au Mali », Population, 52 (1), p. 45-62.
10.1007/s13524-011-0073-9 :Joyner K., Peters H. E., Hynes K., Sikora A., Rubenstein Taber J., Rendal M. S., 2011, “The quality of male fertility data in Major U.S. Surveys”, Demography, 49, p. 101-124.
10.12765/CPoS-2013-02 :Kreyenfeld M., Hornung A., Kubisch K., 2013, “The German generations and gender survey : some critical reflexions on the validity of fertility histories”, Comparative Population Studies, 38 (1), p. 3-28.
10.4000/books.ined.5852 :Mazuy M., Lelièvre É., 2005, « Déclarer ses enfants, déclarer ses conjoints : rationalité des locuteurs et mode de questionnement », in Lefèvre C. et Filhon A. (dir.), Histoires de familles, histoires familiales : les résultats de l’enquête Famille de 1999, Paris, Éditions de l’Ined, coll. « Les Cahiers », 156, p. 573-588.
Mazuy M., Razafindratsima N., LaRochebrochard É. de, 2005, Déperdition dans l’enquête Intentions de fécondité, Ined, Document de travail, 129.
Molinié, A.-F., Laville, A., 2000, « Les surprises du longitudinal : les salariés répondent-ils n’importe quoi aux enquêtes portant sur leur travail actuel et passé ? », in B. Mélier et Y. Quéinnec (coord.), Communication et travail, Toulouse, Éditions Octarès, p. 56-68.
Neels K., De Winter T., Vermant G., 2011, “The quality of demographic data in GGS Wave 1”, communication à la First User Conference of the GGP ‘Demographic and Social Challenges in an aging Europe’, 23-24 May, Budapest, Hungary.
10.1080/00324728.2011.607901 :Ní Bhrolcháin M., Beaujouan É., Murphy M., 2011, “Sources of error in reported childlessness in a continuous british household survey”, Population Studies, 65 (3), p. 305-318.
Poulain M., RIandey B., Firdion J.-M., 1991, « Enquête biographique et registre belge de population : une confrontation des données », Population, 46 (1), p. 65-88.
Razafindratsima N., Kishimba N., 2004, « La déperdition dans la cohorte Cocon entre 2000 et 2002 », Population, 59 (3-4), p. 419-448.
10.3917/popsoc.500.0001 :Régnier-Loilier A., 2013, « Quand la séparation des parents s’accompagne d’une rupture du lien entre le père et l’enfant », Population et sociétés, 500.
10.1007/978-3-319-09528-8 :Régnier-Loilier A., 2014, “How are household chores divided ? Responses vary with the respondent’s gender and the partner’s presence or absence during the interview”, in Régnier-Loilier A. (ed), The Contemporary Family in France. Partnership Trajectories and Domestic Organization, Heidelberg/ Paris, Springer/Éditions de l’Ined, coll. « Ined Population Studies », p. 161-180.
Régnier-Loilier A., Guisse N., 2009, « Mise en scène de la vie quotidienne. Dit-on la même chose en présence de son conjoint ? », in Régnier-Loilier A. (dir.), Portraits de familles. L’Étude des relations familiales et intergénérationnelles, Paris, Éditions de l’Ined, coll. « Grandes Enquêtes », p. 195-218.
10.2307/2648139 :Rendall M. S., Clarke L., Peters H. E., Ranjit N., Verropoulou G., 1999, “Incomplete reporting of men’s fertility in the United States and Britain : a research note”, Demography, 36 (1), p. 135-144.
Toulemon L., 1997, “The fertility of step-families : the impact of childbearing before the current union”, Communication à la PAA (Population Association of America), Chicago.
10.4000/books.ined.5852 :Toulemon L., 2005, « Enfants et beaux-enfants des hommes et des femmes », in Lefèvre C. et Filhon A. (dir.), Histoires de familles, histoires familiales : les résultats de l’enquête Famille de 1999, Paris, Éditions de l’Ined, coll. « Les Cahiers », 156, p. 59-77.
Uhrig N., 2008, The Nature and Causes of Attrition in the British Household Panel Survey, Institute for social and economic research, ISER Working Paper series, n° 2008-05.
Notes de bas de page
1 On évoque ici le cas des pays développés. S’intéressant au Mali, Véronique Hertrich (1991) a montré que la société s’organisait autour des hommes et que ceux-ci disposaient d’une aussi bonne connaissance que celle des femmes pour certains événements (les omissions dans l’histoire génésique des hommes ne sont pas plus nombreuses que dans celle des femmes), voire meilleure, comme pour le mariage.
2 Le tirage au sort du répondant intervenait en effet après la description du ménage par l’un de ses habitants (pour plus de détails : Régnier-Loilier, 2006). Ainsi, un enfant cohabitant une partie du temps seulement aurait pu être décrit dans le ménage par la personne remplissant le tableau des habitants du logement, puis considéré par le répondant à l’enquête comme ne faisant pas partie du ménage. Dans les faits, quelques cas de doubles comptes ont pu être repérés mais ils sont très peu nombreux.
3 Sur cette question, on pourra se référer à l’étude conduite sur 13 pays ayant réalisé la première vague de l’enquête GGS : Neels et al., 2011.
4 En France, mais aussi au niveau international dans un format harmonisé (vagues 1 et 2 à ce jour).
5 Et probablement aux plus jeunes âges, mais la confrontation du nombre d’enfants en 2005 et 2011 n’a de sens que pour les personnes ayant achevé leur vie féconde.
6 V1 = V2 = V3 ; V1 > V2 = V3 ; V1 < V2 = V3 ; V1 = V2 > V3 ; V1 = V2 < V3 ; V1 > V2 > V3 ; V1 < V2 < V3 ; V1 > V2 < V3 et V1 = V3 ; V1 > V2 < V3 et V1 < V3 ; V1 > V2 < V3 et V1 > V3 ; V1 < V2 > V3 et V1 = V3 ; V1 < V2 > V3 et V1 < V3 ; V1 < V2 > V3 et V1 > V3.
7 La comparaison entre ces deux proportions pourrait être discutée dans la mesure où le champ n’est ici pas limité aux seules personnes susceptibles d’avoir « sous-déclaré » un ou des enfants, c’est-à-dire celles ayant au moins un enfant lors de la première vague. Toutefois, un écart d’ampleur comparable demeure en limitant l’observation aux parents d’au moins un enfant en vague 1 (39 % contre 9 %).
8 327 personnes sur 770 sous-déclarants à l’une des vagues (327 + 171 + 272). La même méthode de calcul a été appliquée pour les autres proportions citées par la suite.
9 En 2005, 28 % des 55-59 ans vivent encore avec au moins un enfant dans le ménage, proportion qui tombe à 16 % chez les 60-64 ans.
10 Le champ est limité aux personnes ayant déclaré au moins un enfant lors de la première vague, seule population soumise au risque de sous-déclaration lors des vagues suivantes.
11 Parmi eux, 134 ont sous-déclaré à la fois en vague 2 et en vague 3.
12 Sauf mention contraire dans le tableau. À noter que dans la mesure où la sous-déclaration peut avoir eu lieu en vague 2 ou en vague 3, le même modèle a été répliqué en incluant les caractéristiques observées à la vague précédant la sous-déclaration (caractéristiques de 2005 si la sous-déclaration a eu lieu en 2008, caractéristiques de 2008 si la sous-déclaration a eu lieu en 2011). Les résultats étant identiques, seul le modèle relatif aux caractéristiques observées en 2005 est ici présenté.
13 Une interaction entre le nombre d’enfants cohabitants et le nombre d’enfants non cohabitants a été testée. Aucun effet significatif n’apparaît.
14 L’objectif de cette investigation était précisément de comprendre la nature des écarts de réponses entre vagues, en vue d’éventuelles imputations ou corrections. Aucune directive n’est cependant prévue à ce sujet au niveau des consignes d’harmonisation et de diffusion internationale des données.
15 Ce type de procédure n’est possible que lors d’une collecte assistée par ordinateur. Elle peut aussi avoir des effets pervers. Certaines personnes pourraient douter que l’enquête soit vraiment confidentielle alors que l’enquêteur rappelle des informations collectées trois ans auparavant et par conséquent ne pas souhaiter participer à la vague suivante. D’autres pourraient remettre en cause ce qui a été collecté lors de la vague précédente.
Auteur
Docteur en sociologie, chargé de recherche à l’Ined et rattaché à l’unité Fécondité, famille, sexualité. Il enseigne également en master les méthodes d’analyse quantitative à l’université Paris-Sorbonne. Ses principaux travaux portent sur la fécondité, la diversité des conjugalités et les relations enfants-parents en France. Ses réflexions portent également sur la méthodologie d’enquête. Responsable de la mise en place des trois vagues de l’enquête Generations and Gender Survey en France (Étude des relations familiales et intergénérationnelles, Érfi) réalisées en partenariat avec l’Insee entre 2005 et 2011, il a également coordonné, avec Wilfried Rault (Ined), l’enquête Étude des parcours individuels et conjugaux (Épic, 2012-2013, en partenariat avec l’Insee).
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Trajectoires et origines
Enquête sur la diversité des populations en France
Cris Beauchemin, Christelle Hamel et Patrick Simon (dir.)
2016
En quête d’appartenances
L’enquête Histoire de vie sur la construction des identités
France Guérin-Pace, Olivia Samuel et Isabelle Ville (dir.)
2009
Parcours de familles
L’enquête Étude des relations familiales et intergénérationnelles
Arnaud Régnier-Loilier (dir.)
2016
Portraits de famille
L’enquête Étude des relations familiales et intergénérationnelles
Arnaud Régnier-Loilier (dir.)
2009
Inégalités de santé à Ouagadougou
Résultats d’un observatoire de population urbaine au Burkina Faso
Clémentine Rossier, Abdramane Bassiahi Soura et Géraldine Duthé (dir.)
2019
Violences et rapports de genre
Enquête sur les violences de genre en France
Elizabeth Brown, Alice Debauche, Christelle Hamel et al. (dir.)
2020
Un panel français
L’Étude longitudinale par Internet pour les sciences sociales (Elipss)
Emmanuelle Duwez et Pierre Mercklé (dir.)
2021
Tunisie, l'après 2011
Enquête sur les transformations de la société tunisienne
France Guérin-Pace et Hassène Kassar (dir.)
2022
Enfance et famille au Mali
Trente ans d’enquêtes démographiques en milieu rural
Véronique Hertrich et Olivia Samuel (dir.)
2024