> Documentation >> Exploitation des résultats
LE DÉNOMBREMENT
Le dénombrement est la première exploitation effectuée
après la collecte. Il permet d’obtenir les comptages de
population et de logements pour tous les échelons géographiques
(du district de recensement aux différentes circonscriptions administratives). À partir du niveau
communal, la combinaison de ces résultats à ceux de l’état
civil et des recensements de la population précédents
permet d’obtenir les évolutions de population (mouvements naturel et migratoire).
Ces comptages sont obtenus à partir des bordereaux récapitulatifs
établis lors de la collecte. Les informations saisies, pour chaque district, sont le nombre de logements et la
population des ménages, celles des communautés et les doubles comptes.
Les résultats du comptage des bulletins individuels sont
authentifiés par un décret.
Haut
de page
LES EXPLOITATIONS STATISTIQUES
Après le dénombrement, viennent les
exploitations statistiques. À partir des imprimés
(essentiellement le bulletin individuel ou BI, la feuille
de logement ou FL et le dossier d’immeuble collectif ou
DIC) remplis par la population ou l’agent recenseur,
l’INSEE procède aux exploitations statistiques.
Ces imprimés sont saisis par des façonniers extérieurs en
deux étapes : saisie des informations de l’exploitation principale, puis saisie de
l’exploitation complémentaire après sélection par l’INSEE des bulletins à traiter.
L’INSEE procède ensuite au codage automatique des questions (par
exemple transformer un libellé de commune en code) et aux
traitements statistiques nécessaires pour obtenir un
fichier de données individuelles anonymes
"propre" (imputation des valeurs manquantes,
redressements, recodifications) pour préparer la diffusion des résultats.
Les exploitations statistiques s’effectuent en deux temps de
manière à mettre à disposition, le plus rapidement
possible, l’essentiel des résultats.
Haut
de page
L'EXPLOITATION PRINCIPALE
La première exploitation statistique dite « principale »
(ex-exploitation « légère ») est exhaustive, c’est-à-dire qu’elle traite la totalité
des bulletins individuels et des feuilles de logement.
Les résultats de cette exploitation principale correspondent
au traitement de la plupart des critères d’étude sur tous les bulletins.
Les résultats socio-économiques qui s’en dégagent peuvent
être classés en 12 thèmes (10 pour les DOM) :
- Population
(âge, sexe, état matrimonial, actifs ou inactifs,...) ;
- Activité (taux d’activité par sexe, chômage, conditions
d’emploi,...) ;
- Emploi
(salariés ou non, temps partiel ou complet,...) ;
- Navettes domicile-travail ;
- Formation
(scolarisation et lieu d’études, diplômes, niveau d’études,...)
;
- Migrations (lieu de naissance, lieu de résidence au 1/1/90) ;
- Nationalité(nationalité selon l’âge, sexe, taille des ménages,...) ;
- Immigration(français de naissance ou par acquisition, étrangers,...)
: uniquement métropole ;
- Ménages (sexe, âge et activité de la personne de référence,...) ;
- Logements (type, nombre de pièces,...) ;
- Résidences principales (date d’emménagement, statut
d’occupation, surface, garage-box-parking, confort/chauffage, nombre de voitures,...) ;
- Immeubles (date d’achèvement, nombre d’étages, nombre de
logements, HLM ou non, chauffage collectif, évacuation
des eaux, digicode, gardien,...) : uniquement métropole.
Haut
de page
L'EXPLOITATION COMPLÉMENTAIRE
La seconde exploitation statistique dite « complémentaire »
(ex-exploitation
« lourde ») permet d’affiner les caractéristiques
de l’emploi et de procéder à l’analyse détaillée
de la composition des ménages et des familles.
Ces variables sont plus complexes à obtenir, c’est pourquoi
l’exploitation complémentaire procède par sondage en métropole.
Les départements d’outre-mer et certaines zones de métropole
sont traitées exhaustivement (voir la note
« Tirage
des échantillons »).
Pour permettre la validation des traitements statistiques
(imputation des valeurs manquantes, redressement,
recodification) et la diffusion plus rapide des premiers résultats
sur les catégories sociales et l’activité économique,
une exploitation au 1/20 (par sélection d’un cinquième
de l’échantillon du quart) est également réalisée pour la métropole.
Les résultats socio-économiques qui s’en dégagent peuvent
être classés en 12 thèmes (11 pour les DOM) :
- il s’agit des thèmes déjà présentés lors de la première
exploitation enrichis d’une analyse sur les catégories
socioprofessionnelles et sur le secteur
d’activité, seul le thème immeuble n’est pas repris ;
- un thème nouveau apparaît lors de cette
exploitation statistique : le thème Familles
(couples, familles monoparentales, nationalité et catégorie
socioprofessionnelle de la personne de référence, nombre
et âge des enfants,...).
Haut
de page
TIRAGE DES ÉCHANTILLONS
Le tirage des échantillons du quart
Le sondage au 1/4 est un tirage systématique de 1 unité sur 4 sur
fichier trié. Cette méthode donne des résultats
similaires à un tirage stratifié sur les mêmes critères de tri.
Le tirage s'applique sur les logements pour les ménages et
assimilés et les logements vides, et sur les individus
pour les communautés et assimilés.
Pour les ménages et assimilés, les enregistrements sont triés selon 5 critères :
- le département et la commune de résidence ;
- une catégorie sociale approchée de la personne de référence du ménage ;
- un type de ménage ;
- la taille du ménage ;
- une catégorie sociale approchée du conjoint.
Pour les logements vides, les enregistrements ont été triés
sur le département et la commune.
Pour les communautés et assimilés, le tirage d'individus est
réalisé sur un fichier trié selon la commune, le type de communauté et la date de naissance.
Les extensions géographiques
Certaines zones géographiques traitées à l'exhaustif ont été
intégrées à l'exploitation complémentaire. Il s'agit
plus particulièrement des départements d'outre-mer, des
deux départements de la Corse, de quelques communes et de
certaines zones infracommunales (petites Zones Urbaines Sensibles et certains îlots).
Le tirage de l'échantillon du vingtième
L'échantillon du 1/20 est issu directement de l'échantillon du sondage
au 1/4, par tirage d'un cinquième des bulletins sur les mêmes
critères. Certaines populations particulières ont toutefois été traitées à l'exhaustif : il s'agit des
mariniers rattachés administrativement à la commune et
de la population des établissements n'ayant pas de résidence
personnelle (ou dont la feuille de logement correspondant
à l'adresse de leur résidence personnelle n'a pas été retrouvée).
Haut
de page
PRÉCISIONS DES RÉSULTATS
Quels que soient les efforts employés lors de la collecte, les
questionnaires du recensement présentent des imperfections dues à des causes diverses : unités non
recensées, personnes recensées deux fois, absence de réponse
à certaines questions, réponses inexactes. Ces imperfections affectent surtout les unités se trouvant
dans une situation complexe ou marginale. En outre,
certaines erreurs de traitement ont pu se produire lors de
l'opération de saisie-chiffrement.
L'existence de ces imperfections, inhérentes à toute opération
statistique, ne doit pas être oubliée même si elles ne
ressortent pas clairement de l'examen des résultats,
puisque, lors de la codification, on a pu corriger des
incompatibilités et, dans certains cas, attribuer une
valeur plausible aux variables non renseignées.
Dans le cas des résultats tirés de l'exploitation complémentaire,
il s'ajoute une incertitude due à l'échantillonnage,
sauf si la zone d'intérêt a été traitée exhaustivement.
La théorie des sondages permettrait d'estimer la précision
de chaque donnée, pour chacune des méthodes utilisées,
à condition de procéder à des tabulations complexes pour chacune d'elles. Dans des études expérimentales, on
a pu constater le bien fondé de la théorie avec des simulations qui en précisent les indications.
L'incertitude sur un total est essentiellement fonction de
l'effectif à estimer ; on peut ainsi en première
approximation prendre comme intervalle de confiance à 95 %
(un tel intervalle a 95 chances sur 100 de recouvrir le résultat
que donnerait un dépouillement exhaustif) :
,
arrondi à ,
si le résultat est tiré du sondage au 1/20
,
arrondi à ,
s'il est issu de l'exploitation complémentaire
Le tableau ci-dessous donne les intervalles de
confiance ainsi calculés pour quelques valeurs de x :
|
Intervalle de confiance à 95%
|
Résultat
|
1/20
|
1/4
|
1 000 000
|
991 000 - 1 009 000
|
996 000 - 1 004 000
|
100 000
|
97 100 - 102 900
|
98 700 - 101 300
|
10 000
|
9 100 - 10 900
|
9 600 - 10 400
|
1 000
|
710 - 1 290
|
870 - 1 130
|
100
|
10 - 190
|
60 - 140
|
Il y a lieu de remarquer que les petits
nombres peuvent être entachés d'une erreur relative très
importante. Néanmoins, ils ont été maintenus dans les
tableaux. Ainsi la cohérence comptable des tableaux est
satisfaite ; de plus, cela rend possible d'éventuels
regroupements ainsi que des recoupements entre tableaux différents.
|