Chapitre VIII
Principe et présentation des modèles
p. 107-118
Texte intégral
Les diverses voies de formalisation
1En même temps que se dégageaient et s’affinaient les concepts que nous venons d’analyser longuement, l’idée de les agréger afin de reconstituer les variables classiques de l’analyse démographique (taux, etc...) prenait corps.
2a) Dès 1953, L. Henry s’attaquait au problème de la formalisation algébrique du processus de constitution de la famille [Réf. 003], qu’il devait développer plus complètement dans trois articles parus en 1957 et 1961 [Réf. 157, 158 et 159]. Laissant de côté la stérilité définitive – supposée survenir au même âge chez tous les couples – L. Henry définissait trois fonctions fondamentales :
p(x) = fécondabilité à l’âge x
v(x) = probabilité qu’une conception (survenue à l’âge x) aboutisse à une naissance vivante (ou : “proportion des conceptions V”),
K(x, g) = probabilité qu’une femme ayant conçu à l’âge x soit encore non fécondable à l’âge x + g (K = O pour g > G).
3Elles expriment toutes trois un “risque”, dont l’intensité est fonction de l’âge de la femme – et non de la durée de mariage. Ce choix était dicté par les observations disponibles sur des populations non malthusiennes, d’où il résultait que la fécondité était d’abord une fonction de l’âge. Par le fait même, le modèle est inapplicable à des populations malthusiennes.
4Ces risques sont supposés identiques, à âge égal, pour toutes les femmes.
5S’il n’y avait pas de “temps mort”, le nombre des conceptions (dans une cohorte d’effectif unité) serait à chaque instant égal à p(x). En raison de l’existence des temps morts, il faut retrancher le nombre des femmes non fécondables, à un instant donné, de l’effectif “au risque” ; d’où l’équation fondamentale :

6C’est une équation intégrale, qui ne peut pas être résolue explicitement. Il est néanmoins possible d’étudier la forme générale de ses solutions, comme l’a fait L. Henry dans son article de 1957. Précisons que K était, en fait, décomposée en deux :
7KA pour la distribution des durées de temps mort après un avortement spontané,
8Kv pour la distribution des durées de temps mort après une naissance vivante.
9Poursuivant son étude théorique, L. Henry calculait ensuite le nombre des conceptions cumulées depuis l’âge au mariage x0 jusqu’à un âge x, la descendance (enfants nés-vivants) au même âge, les taux de fécondité par âge ; reprenant ensuite les mêmes calculs pour les naissances de chaque rang, il pouvait étudier de manière très détaillée les intervalles successifs entre naissances, en relation avec les taux de fécondité.
10Nous donnons, en Annexe B, les principales formules établies en continu. Pour ses applications numériques, l’auteur les avait naturellement converties en notation discrète : nous avons fait de même pour la présente application (cf. Chap. IX). Enfin, nous rappelons plus loin quelques-uns des résultats obtenus par L. Henry.
11Dans un article ultérieur (Réf. 051), L. Henry a introduit une double hétérogénéité, pour la fécondabilité et la mortalité intra-utérine (en supposant les deux distributions indépendantes, ce qui – nous l’avons vu – est probablement une hypothèse peu réaliste). Mais ce modèle n’est pas comparable aux précédents puisqu’il est limité à l’étude de l’intervalle mariage-première naissance.
12b) Indépendamment de L. Henry, mais à la même époque, Dandekar proposait (en 1955) [Réf. 154] une formalisation par la voie de l’analyse combinatoire : au lieu d’établir des formules récurrentes, il décomposait directement un intervalle de durée quelconque en diverses combinaisons de “temps morts” et de délais de conception. La formulation, dans ce cas, est forcément discrète, et l’échelle de temps adoptée est le mois, puisque la fécondabilité est définie comme une probabilité mensuelle. Dans ce modèle très simplifié, la mortalité intra-utérine n’était pas prise en compte, le temps mort avait une durée fixe, la fécondabilité était constante et homogène.
13Repris et développé par de nombreux auteurs (Basu, Brass, Potter, Singh, DharmadhiKari...), ce modèle a surtout ouvert la voie à l’application des résultats de la théorie des “processus de renouvellement”, en particulier les chaînes de Markov et les processus semi-markoviens. Dans cette théorie, on définit une suite d’états distincts, et des probabilités de transition d’un état à un autre ; le comptage des événements se fait donc par comptage du nombre des transitions entre états.
14Dans le premier modèle de ce genre, en 1964, Perrin et Sheps [Réf. 170] retenaient cinq états :
S0= fécondation possible,
S1 = grossesse,
S2 = stérilité post-partum associée à une fausse couche,
S3 = stérilité post-partum associée à une naissance non vivante,
S4= stérilité post-partum associée à une naissance vivante.
15Chaque femme entre dans le processus par l’état S0, puis transite au bout d’un certain nombre de mois vers l’état S1, et de là dans l’un des trois autres états ; après quoi, elle retourne en S0. La durée de passage dans chaque état est une variable aléatoire, dont la fonction de répartition peut dépendre à la fois de l’état en cours et de l’état suivant : par exemple, la durée de grossesse (S1) est fonction de l’issue de la grossesse, c’est-à-dire de la nature de l’état suivant : S2, S3 ou S4. Mais les distributions ne dépendent pas du temps total écoulé : elles ne peuvent donc dépendre ni de l’âge, ni de la durée de mariage. C’est une première limitation de cette formalisation.
16La seconde limitation résulte de ce que la plupart des formules sont établies pour le régime stationnaire, c’est-à-dire en supposant un temps infini. En pratique, la convergence vers l’état stationnaire est suffisamment rapide pour que le modèle donne des résultats satisfaisants dans toute la période de la vie fertile où les diverses fonctions ne varient que lentement, c’est-à-dire entre 20 et 35 ans. Par contre, il est impossible de décrire les périodes de croissance et de décroissance de la fertilité.
17L’un des grands avantages de cette formalisation est de permettre de calculer non seulement l’espérance mathématique des divers événements étudiés, mais aussi les moments des divers ordres – ce qui n’avait pas du tout été examiné par L. Henry. Signalons aussi que certains développements du schéma sont possibles : modification des fonctions de répartition à chaque retour dans un état donné (essentiellement S0), ou modification des probabilités de transition avec le temps passé dans un état. On trouvera une vue d’ensemble sur les résultats déjà acquis et les extensions possibles dans un article de Sheps, Menken et Radick (Réf. 179).
18c) Le modèle Fermod, développé par Potter et Sakoda (Réf. 173 et 174), se rapproche davantage des modèles de L. Henry dans leur version discontinue. Mais toute référence à l’âge est abandonnée ; à la place, la fécondabilité (et elle seule) devient fonction du rang de naissance, et peut, de plus, subir des modifications discontinues pour certaines durées de mariage. Le but, en l’occurrence, est d’élaborer un modèle applicable à l’étude de la constitution de la famille en régime malthusien, ce qui suppose que l’efficacité de la contraception puisse être modifiée en fonction du déroulement du “plan” familial.
19La structure du modèle est la suivante : une cohorte de femmes est répartie, mois après mois, en diverses classes selon la parité atteinte et le statut (fécondable, enceinte, ou en post-partum). Sont ainsi constituées et gérées des “files d’attente”, dont les femmes sortent au bout d’un certain nombre de mois. Nous donnons plus loin un exemple des résultats obtenus à l’aide de ce modèle.
20d) À partir de 1964, la diffusion de la “méthode de Monte-Carlo” provoque l’éclosion d’une série de modèles utilisant le principe de la simulation : Hyrenius (1964), Ridley et Sheps (1966), Jacquard (1967), Lombardo (1968), Barrett (1969), Venkatacharya (1969, Horvitz et al (1969) Holmberg (1970), ... Dans cette méthode, l’histoire de chaque individu est simulée successivement et expérimentalement, à l’aide de tirages probabilistes répétés à chaque étape et pour chaque événement possible. Il n’est donc pas nécessaire de formuler explicitement les multiples distributions conditionnelles, ni de faire préalablement l’inventaire exhaustif de tous les états possibles. Le modèle peut donc être plus riche, mais par contre il introduit une “erreur aléatoire”, qui ne peut être réduite que par l’usage de gros “échantillons”, ce qui augmente le temps de calcul dans des proportions qui ne peuvent être tenues pour négligeables, même pour un ordinateur...
21L’extraordinaire souplesse de ce type de modèle permet de “coller” à la réalité beaucoup mieux qu’avec aucune autre méthode. La liste des événements possibles peut être celle-ci :
mariage, veuvage, divorce, remariage,
décès,
stérilité définitive,
conception, sous diverses hypothèses d’efficacité de la contraception selon la taille et le calendrier souhaités pour la famille,
décès intra-utérin.
22Les diverses probabilités peuvent être fonction de l’âge, ou de la durée de mariage, ou du rang de naissance.
23Les applications possibles sont illimitées. Il n’est d’ailleurs pas nécessaire d’élaborer d’emblée un modèle très complexe et polyvalent : il vaut mieux, au contraire, contenir la complexité du modèle dans les limites requises par chaque type d’application.
⁂
24Après cette présentation théorique des divers modèles, dont on trouvera une liste plus complète de références à la rubrique 1.4 de la Bibliographie, nous allons résumer quelques-uns des résultats obtenus.
Quelques résultats théoriques obtenus par L. Henry
25II ne saurait être question de résumer en quelques dizaines de lignes trois articles extrêmement denses. Mais il n’est peut-être pas inutile de rappeler ici un certain nombre de résultats obtenus par L. Henry qui semblent, parfois, avoir été oubliés.
261) Examinons tout d’abord la situation en début de mariage. Nous avons rappelé, en Annexe B, les formules donnant le nombre de conceptions cumulées (de l’âge au mariage x0 à un âge x) et la descendance effective (au même âge x) (Formules 3 et 4) :

27G désignant une borne supérieure de la durée de stérilité consécutive à un accouchement, et a le début de la période de fertilité de la femme, L. Henry montre que, pour tout âge au mariage xo tel que : x0 ⩾ α + G, Q(x) est constamment supérieure à l’intégrale obtenue à partir de la fécondité centrale : Q(x) n’est donc pas une bonne mesure de la fécondité “intrinsèque”, et le taux de fécondité :

28peut être sujet à des erreurs d’interprétation.
29Si l’on suppose p(x) et K(x, g) indépendants de l’âge x, ce qui est justifié sur un intervalle 20-30 ans, par exemple, et en l’absence de conceptions prénuptiales, le taux de fécondité précédent peut s’exprimer ainsi :

30avec :

31et

32Il apparaît donc comme la somme d’un terme constant, d’un terme hyperbolique, et d’une fonction oscillatoire amortie.
33La présence du terme hyperbolique traduit le fait qu’en début de mariage le “taux moyen de conception” commence toujours par décroître rapidement, car l’entrée en observation (c’est-à-dire le mariage) correspond à une situation unique : celle où aucune femme n’est en temps mort (nous avons exclu, par hypothèse, l’existence de conceptions prénuptiales).
34Il a pour autre conséquence d’accentuer la fécondité apparente des âges où les mariages sont les plus nombreux, lorsqu’on calcule un taux de conception dans une cohorte de nouvelles mariées sans distinction de l’âge au mariage. (Ces deux effets ne doivent pas être confondus avec l’effet de sélection existant dans une cohorte hétérogène au regard de la fécondabilité, que nous avons décrit dans le chapitre consacré à celle-ci).
35Avec les seules naissances vivantes (ou conceptions V), la décroissance n’existe pas : le taux moyen passe très rapidement de zéro à un maximum, peu supérieur à sa valeur asymptotique. C’est donc un indice plus sûr de la fécondité en début de mariage.
362) Dans les deux articles de 1961, L. Henry a consacré une place très importante à l’étude des intervalles entre naissances, et aux relations existant entre ceux-ci et les fonctions fondamentales, ou les taux de fécondité.
37Considérons une cohorte unité de femmes ayant conçu à un âge x0, et sortant de temps mort à l’âge x0 + g.
38Soit R(x) le nombre de celles qui n’ont pas encore conçu à l’âge x. R(x) est tout simplement une exponentielle, vérifiant :

39d’où, en posant :


40Pour ces femmes, la durée moyenne d’exposition au risque, ug, (ou “délai moyen de conception”) est égale à :

41ω désignant l’âge limite de fertilité.
42Quant à l’intervalle moyen entre deux conceptions, il est égal à la somme : g + ug. Soit h(g) la densité de probabilité de g ; l’intervalle moyen est :

43Dans le cas où p, v et K sont indépendants de l’âge, et pour des âges suffisamment éloignés de la fin de la période fertile ω, on retrouve l’expression simple :

44désignant la moyenne de la distribution des temps morts. Dans ce cas, il est également possible de calculer l’intervalle moyen entre deux conceptions V, donc entre deux naissances vivantes :

453) Pour passer au calcul des taux de fécondité par âge, il est nécessaire de repérer la position des intervalles par rapport à un groupe d’âges déterminé. Soit δ l’intervalle d’âge considéré (par exemple : 20 à 25 ans, ou 20 à 30 ans).
46Un intervalle entre deux naissances peut être complètement intérieur à δ ; il peut aussi chevaucher l’une des deux bornes de δ : dans ce cas, il est dit “à cheval”. On suppose les fonctions fondamentales indépendantes de l’âge, sur une période débordant quelque peu δ de part et d’autre.
47Soient : l’intervalle moyen entre naissances vivantes (sur la période considérée),
48ӯ la durée moyenne d’un intervalle à cheval,
49la moyenne d’un intervalle intérieur,
50k le nombre des femmes concernées,
51ni le nombre d’enfants mis au monde par la femme i, durant l’intervalle δ.
52L. Henry montre d’abord que le taux de fécondité cherché (fécondité des femmes ultérieurement fécondes) est égal à :

53Autrement dit, 1/f est égal à une moyenne pondérée des intervalles ayant leur début ou leur fin dans la période δ, les intervalles intérieurs étant comptés deux fois.
54Si désigne le coefficient de variation (écart-type sur moyenne) de la distribution des intervalles après une conception, ȳ et j̄ ont pour expressions :

55et

56Il faut remarquer que :

57et

58autrement dit, ni la moyenne des intervalles à cheval, ni celle des intervalles intérieurs, n’est égale à la moyenne générale des intervalles.
Les applications numériques. Le modèle Fermod (Potter et Sakoda)
59Nous avons passé en revue, dans le paragraphe précédent, les principaux résultats obtenus par L. Henry par la voie théorique. Son étude était complétée par des applications numériques, limitées par les moyens de calcul disponibles à l’époque. Pour simplifier des calculs déjà lourds, il adopta comme unité de temps le trimestre, et non le mois ; pour le type d’applications proposées, cette simplification est sans inconvénient majeur. Bien entendu, toutes les applications se rapportent à des groupes homogènes. Voici, à titre d’exemple, deux jeux d’hypothèses retenues :
601) pour le calcul des conceptions et naissances vivantes selon le rang :
fécondabilité : en palier pendant 15 ans (0,488 par trimestre, ou 0,20 par mois), puis linéairement décroissante pour atteindre 0 en 5 ans ;
mortalité intra-utérine : taux constamment égal à 10 % ;
deux distributions de temps mort, selon l’issue de la grossesse (moyenne globale : 6,3 trimestres).
61Ainsi, la stérilité ne se trouve prise en compte que par le biais de la fécondabilité : quand celle-ci devient nulle, la femme ne peut plus concevoir.
622) pour l’étude des intervalles entre naissances :
fécondabilité : même évolution que précédemment, mais avec plusieurs durées de baisse (5 ans, 10 ans, 15 ans) ;
mortalité intra-utérine : nulle ;
temps mort : fixe (6 trimestres).
63Quoique très restrictives, ces hypothèses ont cependant permis de poursuivre l’analyse au-delà de l’étude théorique. En résumé, on peut dire que c’est surtout l’évolution de la fécondabilité avec l’âge qui a retenu l’attention de l’auteur dans ces applications.
64Cet aspect de la question disparaît dans les modèles destinés à étudier les effets de la contraception. La fécondité, dans ce cas, n’est plus une fonction de l’âge, mais une fonction de la durée de mariage, ou mieux du nombre d’enfants déjà nés, par le biais de l’efficacité de la contraception. Il en est ainsi dans le modèle Fermod de R.G. Potter et J. Sakoda [Réf. 173 et 174], que nous avons présenté plus haut. Les auteurs distinguent trois issues possibles à une gestation :
avortement spontané (18 % des cas) ; temps mort associé : 3 + 1 mois
mort-né (2 % des cas) ; temps mort associé : 9 + 3 mois ;
naissance vivante (80 % des cas) ; temps mort associé 9 mois +g, g ayant une distribution (fixe) de moyenne égale à 3 mois et demi.
65La durée de la période de reproduction est fixe (20 ans).
66Quant à la fécondabilité, sa valeur “naturelle” est supposée constante (par exemple : 0,28), mais sa valeur “résiduelle” dépend du rang de naissance, en fonction du “plan familial” des parents. Ce plan est défini par :
un objectif final en terme de naissances vivantes (trois),
des intervalles souhaités entre les naissances (un, deux ou trois ans),
l’efficacité de la contraception pratiquée, soit pour espacer les naissances (0,90), soit après que l’objectif a été atteint (0,95 ou 0,99).
67Les variables de sortie sont les suivantes :
distribution des familles selon leur dimension finale,
moyenne, écart-type, oblicité de cette distribution,
moyenne et écart-type des intervalles entre le mariage et la naissance de rang n.
68Pour préciser les idées, voici un exemple des résultats proposés : (voir tableau page suivante).
69La force de ces modèles "microdémographiques” est, comme on le voit, de pouvoir traiter des chroniques individuelles, et donc de calculer des types d’indices (ici : la proportion de dépassement, selon divers critères “individuels”) que l’analyse globale ne permettrait pas d’atteindre. Et de plus, ces résultats peuvent être mis en correspondance avec des résultats valables à l’échelle globale, ainsi que va le montrer l’exemple suivant.
Proportion des couples dépassant leur objectif final (3 enfants)

(1) Intervalles courts : un an (mariage à première conception), puis deux ans (entre naissances successives) ;
Intervalles longs : respectivement 2 ans et 3 ans.
L’efficacité de la contraception d’espacement est 0,90.
Source : Potter et Sakoda : [Réf. 174] Tableau 5, p. 323.
Un exemple de modèle par simulation (Jacquard et Bodmer)
70Les modèles par simulation permettent de franchir un pas de plus dans la complexité croissante du processus. Ce pas peut être fait dans deux directions :
soit par enrichissement des hypothèses physiologiques (par exemple en réinsérant une variation de la fécondabilité naturelle avec l’âge),
soit par rapprochement des conditions d’observation de la démographie classique, en tenant compte des entrées en union, des ruptures d’union et des décès ; à la limite, le modèle peut s’insérer dans un modèle plus général d’évolution d’une population.
71De plus, la méthode permet une analyse de variance.
72Les paramètres du modèle de Jacquard et Bodmer [Réf. 168 et 152] sont les suivants :
des probabilités mensuelles de mariage, de veuvage, de décès et de divorce (ces dernières par durée de mariage), de 15 à 45 ans ;
la fécondabilité naturelle est une fonction de l’âge (croissante de 15 à 20 ans, en palier de 20 à 30 ans au niveau 0,25, et décroissante de 30 à 45 ans) ;
un taux de mortalité intra-utérine constant (25 %) ;
des distributions de temps mort, selon l’issue de la grossesse ;
pour la contraception : un nombre d’enfants désirés, des intervalles entre naissances souhaités, et des niveaux d’efficacité de la contraception d’espacement ou d’arrêt.
73En sortie, les variables sont les suivantes :
âges moyens des femmes lors des conceptions de divers rangs,
intervalles moyens entre conceptions successives,
variances de ces intervalles,
nombre des conceptions des divers rangs par année d’âge.
74Comme dans le modèle précédent, il est donc possible d’obtenir des taux de réussites ou d’échecs individuels. Par exemple, lorsque le nombre d’enfants souhaités est 3, les auteurs obtiennent les proportions de dépassement suivantes :
7549 % avec une contraception d’arrêt efficace à 95 % (contraception de retardement : 90 % ; intervalle souhaité : 3 ans),
7618 % avec une contraception d’arrêt efficace à 99 % (mêmes hypothèses pour le “calendrier”).
77La seconde proportion est proche du résultat obtenu par Potter et Sakoda pour une fécondabilité comprise entre 0,14 et 0,28 (respectivement 15 % et 29 % de dépassement), mais la première est plus faible (55 % et 81 % de dépassement pour les mêmes fécondabilités) ; l’écart résulte probablement de la prise en compte des ruptures d’union.
78Sur le plan collectif, les résultats peuvent être traduits en taux de reproduction : on peut ainsi juger de l’efficacité globale de la contraception. Les hypothèses de fécondité naturelle retenues par les auteurs, conduisent à un taux net de reproduction supérieur à 4. Cette valeur est probablement trop élevée ; une explication possible serait que la diminution progressive de la fécondabilité avec l’âge ne suffit pas à compenser l’absence d’hypothèses relatives à la stérilité : à 35 ans, nous l’avons vu, environ 16 % des femmes sont déjà définitivement stériles.
79Si tous les couples désiraient trois enfants, et pratiquaient une contraception d’efficacité médiocre (70 % en retardement, et 90 % en arrêt), le taux net de reproduction serait voisin de 2 ; avec une efficacité élevée (90 % en retardement et 99 % en arrêt), le taux tomberait à 1,3.
80Ainsi, sur le plan collectif, la contraception joue un rôle important, à double sens : tant que l’efficacité moyenne est faible, les échecs maintiennent la fécondité totale à un niveau supérieur au souhait des individus ; mais quand l’efficacité devient très élevée, la contraception peut les empêcher d’atteindre leur objectif, en retardant une conception jusqu’à un moment où elle n’est plus possible (séparation, stérilité, faible fécondabilité).
Le problème de l’hétérogénéité des cohortes réelles
81Tous les modèles aboutissent à une certaine dispersion des dimensions finales des familles. Cette dispersion est la conséquence des diverses probabilités introduites, qu’il s’agisse de la fécondabilité, de la durée du temps mort, de l’âge au mariage ou de l’efficacité de la contraception. Il n’en reste pas moins qu’un facteur essentiel de dispersion est rarement pris en compte : l’hétérogénéité, au regard des divers risques cités, des cohortes réelles.
82Il est pourtant tout à fait possible de manipuler des cohortes hétérogènes dans un processus de simulation, puisque le résultat final est obtenu par addition d’histoires individuelles, traitées l’une après l’autre. Dans les autres types de modèles, on pourrait à la rigueur tenir compte de la dispersion d’un paramètre, par mélange de plusieurs cohortes, mais tenir compte de plus d’une dispersion reposerait le problème des distributions conditionnelles.
83Bodmer et Jacquard ont eu l’idée de comparer la variance (des dimensions finales) ressortant de leur modèle, sous les hypothèses de fécondité naturelle, avec la variance réelle observée chez les femmes huttérites, rigoureusement non malthusiennes. La seconde est deux fois et demie supérieure à la première, ce qui montre bien que les modèles actuels sont loin de refléter le degré d’hétérogénéité des cohortes réelles. Il est vrai que celui-ci est, dans ses détails, assez mal connu : nous avons pu citer, dans la première partie, des distributions de fécondabilité et de temps mort, mais nous n’avons rien dit de la dispersion de la mortalité intra-utérine, et nous n’avons pu être très précis pour les acquisitions de stérilité au-delà de 35 ans.
84Un nouveau problème risque, d’ailleurs, de se poser rapidement : celui de la dépendance ou de l’indépendance de ces diverses variables ; on pourrait facilement imaginer, par exemple, que fécondabilité et mortalité intra-utérine soient en corrélation (négative), étant donné la part d’arbitraire qu’il y a à définir leurs limites respectives.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Gens de Marrakech
Géo-démographie de la ville Rouge
Mohamed Sebti, Patrick Festy, Youssef Courbage et al.
2009
Histoire de familles, histoires familiales
Les résultats de l’enquête Famille de 1999
Cécile Lefèvre et Alexandra Filhon (dir.)
2005
La population canadienne au début du xviiie siècle
Nuptialité - Fécondité - Mortalité infantile
Jacques Henripin
1954
Les travaux du Haut comité consultatif de la population et de la famille
Travaux et documents
Haut comité consultatif de la population et de la famille
1946