Annexe I.
Annexe technique
p. 176-185
Texte intégral
(A) Application à l’Angleterre de la méthode proposée par D. Friedlander et J. Roshier : la mesure des migrations entre comtés anglais1 (1851-1951)
Les sources anglaises
1Outre les données de base indispensables à l’application de la méthode, c’est-à-dire le double classement des recensés par comté de naissance, F. et R, disposaient :
De la structure par âge, en 8 groupes décennaux, pour 17 groupes mij en 1911,
De la structure par âge, en 8 groupes décennaux, de chacun des groupes mij en 18512
2Revenons à l’équation n° 2 pour estimer les flux μij entre les recensements de 1851 et 1861. On peut l’écrire, en séparant le groupe mij par groupe d’âges, notés par l’indice x

3Sij est inconnu, mais l’estimation de la structure par âge du groupe en1851 permet d’estimer le terme mij Sij pour cette période.
4F. et R. ont supposé nulles :
les différences de mortalité entre migrants et non migrants
les variations géographiques de la mortalité.
5Ils peuvent alors appliquer à la structure par âge du groupe mij, les probabilités de survie par groupe d’âges des tables nationales ; d’où l’équation d’estimation

6On ne peut procéder de la même façon pour la période suivante car on ne dispose plus de la répartition par âge des migrants présents en 1861 (groupe m’ij de la période 1851-1861 = groupe mij de la période 1861-71).
7Revenons à l’équation n° 6 pour la première période et supposons que l’on connaisse une estimation de la distribution3 par âge du terme µij au second recensement (ici 1861)

8On peut décomposer μ̂ij en groupes d’âges en 1861

9On peut alors obtenir une décomposition en groupes d’âges des migrants présents en 1861. Il suffit d’écrire la relation (8), non plus pour l’ensemble des âges, mais pour un groupe particulier :

10On dispose alors, pour la seconde période, des mêmes informations que pour la première ; on peut, de la même façon, estimer la valeur µij au cours de la période suivante (1861-71) et ainsi de suite...
11Nous avons supposé connue plus haut la structure par âge des groupes μij ; F. et R. l’ont estimée de la façon suivante :
Estimation des µx
12F. et R. font une hypothèse assez forte, la seule possible compte tenu des données.
13Ils ont supposé la structure par âge des soldes µij
indépendante de la période décennale,
indépendante des comtés d’origine et de destination.
14La répartition unique a alors été estimée par approximations successives en utilisant le seul renseignement supplémentaire disponible : la série des effectifs par âge des groupes mij d’un échantillon de comtés en 1911.
15F. et R. ont calculé au moyen de l’équation n° 7 les flux μij de 1851 à 1861 pour les paires i, j de leur échantillon.
16Ils se sont alors donné un jeu très large de répartitions μx. Pour chacune d’entre elles, ils ont calculé la structure par âge des groupes m’ ij de l’échantillon en 1861, au moyen de l’équation n° 9 ; puis les flux de 1861 à 1871 au moyen de l’équation n° 7, puis les structures par âge des groupes mij de l’échantillon en 1871, au moyen de l’équation n° 9 ; et ainsi de suite...4.
17Pour une répartition donnée µx, ils obtiennent ainsi la série d’estimations de la structure par âge en 1911 de chaque groupe mij de l’échantillon.
18Ayant procédé ainsi pour chaque répartition µx, ils en ont retenu une : celle qui conduit à l’écart minimum entre l’ensemble des estimations et l’ensemble des structures par âge connues.
Méthode approchée
19Le calcul précédent est lourd, il implique le calcul de la structure par âge des 22.472 groupes (53 x 53 couples i, j x 8 périodes), puis l’application à chaque groupe d’âges des coefficients de survie du moment. Ceci a amené les auteurs à chercher si l’on pouvait, sans perte appréciable de précision, appliquer à l’ensemble d’un groupe mij quelconque une probabilité de survie unique (tous âges réunis), identique pour tous les couples i j.
20Le calcul serait alors très simplifié ; il se ramènerait à l’application directe de l’équation n° 2, où l’on remplacerait l’ensemble des valeurs Sij par une valeur Ŝ, estimée une fois par période. Il suppose néanmoins que la variabilité par âge des groupes mij, à un recensement donné, soit faible.
21F. et R. ont effectué le calcul complet des valeurs Sij pour un échantillon aléatoire de 22 couples et pour les 8 périodes intercensitaires (1851-1951). Au vu de leur faible dispersion autour des valeurs du coefficient de survie (tous ages) de l’ensemble des 22 groupes, ils concluent à la possibilité d’utiliser la méthode approchée.
22L’équation d’estimation se simplifie alors pour s’écrire :

B) Estimation de la précision de la méthode
23Les données publiées dans l’article de F. et R. nous ont permis d’évaluer l’incidence de diverses hypothèses sur la précision de la méthode. C’est l’objet des calculs relativement techniques qui suivent.
24Les principaux résultats de ces calculs sont donnés à la fin du chapitre I avec la discussion des hypothèses et les conclusions générales.
Méthode complète
25On obtient l’erreur absolue sur par différence des équations (6) et (7)

26qui peut s’écrire sous la forme (12) où l’erreur est séparée en deux termes.

27L’erreur relative s’en déduit en divisant par µ̂ij 5

28L’équation (7) donne μij par différence de deux termes du même ordre de grandeur.
29Une erreur relative faible sur le second terme6 entraîne une erreur relative nettement plus forte sur μij. Ce qu’on peut mettre en évidence en écrivant l’équation n° 13 sous la forme :

30La somme Aij + Bij représente l’erreur relative commise en calculant les survivants du groupe mij dans l’équation d’estimation n° 7.
31L’erreur relative sur le flux μij s’en déduit en multipliant, par un facteur Mij, sensiblement supérieur à 1 dans la quasi-totalité des cas :

32Nous avons estimé la répartition M d’un échantillon de valeurs Mij à partir des données fournies dans l’article. Leur répartition est légèrement plus dispersée qu’une distribution uniforme entre 1 et 57. C’est cette dernière distribution que nous utilisons pour simplifier les calculs
Etude des terme Aij
33Portons notre attention sur Aij, premier terme de l’erreur due à l’approximation des termes Sij, x. L’écart entre les valeurs vraies Sij, x et leurs estimations Sx par les probabilités nationales de survie, provient de deux causes :
34Pour un âge et un comté de naissance donnés, les migrants peuvent avoir une mortalité différente des non migrants pour de nombreuses raisons ; si, par exemple, la répartition par catégorie socio-professionnelle des deux groupes n’est pas la même ou si l’aptitude à migrer est liée à l’état physique opérant une sélection. L’absence de données ne permet pas d’estimer la part Aij qui provient de cette mortalité différentielle des migrants. Nous ne pouvons prendre en compte ici que le second facteur responsable des écarts (Sij, x – Sx) : les variations régionales de la mortalité. Calculons la distribution des valeurs de A qui en résulte.
35Il n’est pas possible d’étudier si la mortalité des migrants se rapproche davantage de celle du comté de départ ou d’arrivée. Cependant de nombreuses études8, dont celle de F. et R, montrent que la majorité des migrants effectuent des déplacements à courte distance, dans la moitié des cas environ à destination d’un comté contigu. Or, les études menées dans de nombreux pays montrent que les variations de la mortalité, si elles sont fortes à l’échelon national, sont continues dans l’espace. Autrement dit la variabilité de la mortalité entre comtés voisins est faible par rapport à celle de l’ensemble des comtés. Il est donc vraisemblable que les variations de la mortalité entre groupes mij sont voisines de celles de leurs comtés d’origine (ou de destination).
36Il suffirait alors de posséder des données sur la mortalité par comté pour estimer l’ordre de grandeur de l’erreur commise. En l’absence de ces données, nous avons utilisé les résultats d’une étude de la statistique générale de la France9 sur la mortalité par département pendant la période 1910-1912.
37Nous avons calculé la distribution des valeurs de Aij en France pour 90 groupes dont la mortalité a été supposée être celle de leur département d’origine. L’étude fournit une série de taux annuels de mortalité obtenus en appliquant les taux de mortalité par âge et par département à une structure-type identique pour tous les départements. On en déduit immédiatement les probabilités décennales de survie Si par département et S (France entière), dans l’hypothèse où la structure par âge des départements est la structure-type précédente.
38La différence

39donne la valeur Aij correspondant à un groupe dont la répartition par âge est la structure-type précédente et la mortalité celle du département i.
40La distribution des 90 valeurs

41ne donne qu’un ordre de grandeur de celle qui aurait été calculée pour les groupes mij en Angleterre à la même époque.
42D’une part la structure-type diffère des structures par âge des groupes mij ; ceci peut conduire à surestimer la valeur moyenne et les variations de la distribution de A si par exemple les groupes d’âges où la mortalité est forte sont plus représentés dans la structure-type que dans les distributions par âge des groupes mij. Nous avons vérifié que les différences de structure n’entraînent que de faibles écarts que nous avons corrigés.
43Mais surtout il est très approximatif d’assimiler les variations de la mortalité entre départements français aux variations entre comtés pour la même période. Cependant, comme il n’y a pas lieu de supposer a priori que les unes sont plus fortes ou plus faibles que les autres, on obtiendra ainsi un ordre de grandeur des erreurs possibles. De plus. ce calcul présente au moins un intérêt méthodologique : il permet d’évaluer l’erreur que l’on commettrait en appliquant cette méthode à la France.
44La taille des circonscriptions n’est pas un obstacle à cette transposition ; celle des comtés, assez variable, est en moyenne voisine de celle d’un département.
45La distribution des valeurs10 Aij est donnée dans le tableau I (p. 184). Son influence sur la distribution finale des erreurs est étudiée plus bas.
Etude des termes Bij
46Ces termes proviennent des erreurs commises en estimant les structures par âge mij.x des migrants présents au premier recensement de chaque période. F. et R. donnent un tableau relatif à 17 couples11 pour l’année 1911 où la comparaison est possible avec les structures par âge données par le recensement. On en déduit directement une distribution des 17 valeurs Bij correspondantes, donnée dans le tableau I.
47Leur dispersion est vraisemblablement plus faible que celle des autres années de recensement. La structure par âge unique, de l’ensemble des soldes μija en effet été estimée de façon à obtenir la meilleure concordance entre les structures par âge calculées pour l’échantillon avec celles que fournit le recensement de 1911.
48Il en résulte une sous-estimation de l’erreur, impossible à apprécier avec les données dont on dispose, mais qui peut être notable.
Calcul pratique de l’erreur relative
49Il s’agit d’estimer la distribution des erreurs relatives sur µij à partir de l’équation n° 14.
50Nous venons d’estimer des distributions approximatives des valeurs Aij, Bij et Mij. Il manque cependant un dernier renseignement, la liaison entre les trois distributions. Autrement dit, on ne sait quelles valeurs Bij et Mij doivent être associées à Aij donné.
51Rien ne nous a permis de penser que les trois distributions soient liées, nous les avons supposées indépendantes. Il est alors facile de déduire la distribution M (A + B) des trois distributions connues.
52En pratique, nous avons successivement calculé les distributions M A, M B, puis M (A + B), de façon à pouvoir comparer les ordres de grandeurs respectifs, des erreurs provenant de l’application de taux nationaux (distribution M A) et de celles provenant de l’imprécision des structures par âge des groupes mij (distribution M B). Ces trois distributions sont données dans le tableau I.
Méthode simplifiée
53Rappelons-la brièvement : elle consiste à remplacer le terme

54de l’équation d’estimation n° (7) par une valeur approchée mij Ŝ. Le calcul des survivants par groupe d’âges est alors ramené à l’application d’un taux de survie identique Ŝ à chaque groupe mij,
55mij est donné par les recensements, Ŝ a été estimé à partir de données sur 22 couples que F. et R. ont tirés au hasard. La valeur Ŝ calculée résulte de l’application des taux nationaux par âge à la structure de l’ensemble des groupes mijde migrants des 22 couples.
56On calcule la précision de la méthode simplifiée de la même façon que celle de la méthode complète. La seule différence est la présence d’un terme supplémentaire dans les équations.
57L’équation n° 15, correspondant à l’équation n° 11 dans la méthode complète, donne l’erreur absolue sur μij.

58Cette équation peut s’écrire sous la forme (16) où apparaît le terme supplémentaire correspondant à la perte de précision due à l’emploi de la méthode simplifiée :

59On aboutit de la même façon à l’équation n° 17 identique à l’équation n° 14 au terme supplémentaire près, noté Cij dans la suite.

60Un tableau relatif aux 22 couples tirés au hasard12 pour estimer Ŝ donne les éléments nécessaires au calcul des distributions C par période entre 1851 et 1911. Les six distributions obtenues sont très voisines ; nous les avons rassemblées en une distribution unique relativement précise puisque déduite de 132 observations, que nous utilisons pour évaluer l’erreur relative totale.
61Le calcul de la distribution M (A + B + C) est identique à celui de M (A + B) sous la même hypothèse d’indépendance. Cette distribution, est donnée, avec C, dans le tableau I.
Tableau i. – erreurs relatives sur uij

Le problème de la période d’estimation
62Sur quelle période portent les estimations de précision qui précèdent ?
63Les distributions A et B sont relatives à l’année 1911 ; la distribution C a été estimée pour l’ensemble des six périodes 1851-1911 pour que l’estimation soit faite à partir de données suffisamment nombreuses ; néanmoins les distributions par périodes décennales qui la composent sont très voisines.
64Seule la distribution M, estimée pour l’ensemble des périodes décennales de l’intervalle 1851-1911, peut provoquer un écart entre l’estimation et la distribution réelle des erreurs en 1911. Son utilisation rapproche les distributions finales calculées de celles de l’année 1901.
65En définitive on peut donc considérer que nos estimations donnent la précision de la mesure des flux au cours de l’intervalle intercensitaire 1901-1911.
Notes de bas de page
1 Il y a en Angleterre 53 comtés dont les dimensions, très variables, sont en moyenne voisines de celles d’un département français.
2 Estimée à partir de données des recensements : séparation en grands groupes d’âges des groupes mij en 1851 et 1861.
3 La méthode d’estimation des coefficients µx est donnée au paragraphe suivant.
4 Ces calculs étaient programmés sur ordinateur.
5 En toute rigueur, il faudrait diviser par la valeur exacte, inconnue, µ ij
6 Le premier, m’ij, est connu sans erreur.
7 La valeur moyenne de 3,1 recoupe assez bien la valeur trouvée pour l’ensemble des départements français au cours de la période décennale 1901 – 1911.
M = 3,3
8 V. chapitre V.
9 Henri Bunle “Mortalité comparée en France et à l’étranger avant et après la guerre”. Bulletin trimestriel de la S.G.F. Janvier – Mars 1929.
10 Nous conservons un double indice pour éviter un changement de notation ; un seul indice correspondant au département suffirait.
11 Tableau n° 2, page 247 de l’étude de F. et R.
12 Tableau n° 3 p. 249 de l’étude de F. et R.
Le texte seul est utilisable sous licence Licence OpenEdition Books. Les autres éléments (illustrations, fichiers annexes importés) sont « Tous droits réservés », sauf mention contraire.
Gens de Marrakech
Géo-démographie de la ville Rouge
Mohamed Sebti, Patrick Festy, Youssef Courbage et al.
2009
Histoire de familles, histoires familiales
Les résultats de l’enquête Famille de 1999
Cécile Lefèvre et Alexandra Filhon (dir.)
2005
La population canadienne au début du xviiie siècle
Nuptialité - Fécondité - Mortalité infantile
Jacques Henripin
1954
Les travaux du Haut comité consultatif de la population et de la famille
Travaux et documents
Haut comité consultatif de la population et de la famille
1946