Enquête sur le sous-dénombrement du recensement (ESoR)

Information détaillée pour le 11 mai 2021

Statut :

Active

Fréquence :

Aux 5 ans

Numéro d'enregistrement :

3902

Après chaque recensement depuis le Recensement de 1961, la Contre-vérification des dossiers (CVD) est menée afin de mesurer le sous-dénombrement de la population au recensement. En vue du cycle du Recensement de 2021, la CVD a été renommée Enquête sur le sous-dénombrement du recensement (ESoR). L'ESoR permet d'estimer le nombre de personnes omises lors du recensement.

Date de la parution - 28 avril 2023 (estimations provisoires); 27 septembre 2023 (estimations définitives)

Aperçu

Après chaque recensement depuis le Recensement de 1961, l'Enquête sur le sous-dénombrement du recensement (ESoR), autrefois nommée la Contre-vérification des dossiers (CVD), est menée afin de mesurer le sous-dénombrement de la population au recensement. L'ESoR permet d'estimer le nombre de personnes omises lors du recensement. Les résultats de l'ESoR sont combinés aux estimations du nombre de personnes dénombrées plus d'une fois provenant de l'Étude sur le surdénombrement du Recensement afin de calculer le sous-dénombrement net.

Le sous-dénombrement de la population est considéré comme l'une des plus importantes sources d'erreurs touchant les données du recensement. Il introduit un biais vers le bas dans la mesure où les chiffres du recensement sous-estiment les vrais chiffres de population. Par contre, le surdénombrement introduit un biais vers le haut, car les chiffres du recensement surestiment les vrais chiffres de population. Ces deux sources d'erreur peuvent également fausser les répartitions des caractéristiques de la population estimées au moyen des données du recensement si les personnes surdénombrées et omises ne possèdent pas les mêmes caractéristiques que les personnes dénombrées une seule fois.

Période de référence : Jour du recensement

Période de collecte : Après le recensement

Sujets

  • Population et démographie

Sources de données et méthodologie

Population cible

La population cible est identique à celle du recensement. Le recensement cible toutes les personnes qui vivent au Canada le jour du recensement ainsi que les citoyens canadiens temporairement à l'étranger, soit sur une base militaire, en mission diplomatique, en mer ou à quai à bord d'un navire marchand enregistré au Canada. Les personnes au Canada qui détiennent le statut de résident non permanent, qui ont un permis d'études ou un permis de travail, ainsi que les personnes à leur charge, sont également visées dans le cadre du recensement.

Les bases de sondage utilisées dans le cadre de l'enquête ne portent pas sur les personnes émigrées ou hors du pays lors du recensement précédent, qui n'ont pas rempli de questionnaire du recensement et qui sont revenues durant la période intercensitaire (Canadiens de retour dans une province), de même que les personnes de retour des territoires dans les provinces et celles qui étaient dans des réserves partiellement dénombrées au recensement précédent et dénombrées dans le présent recensement. Pour cette raison, la population observée ne comprend pas ces populations, estimées à un total de 290 000 personnes pour la Contre-vérification des dossiers de 2016.

Élaboration de l'instrument

Avant l'Enquête sur le sous-dénombrement (ESoR) de 2021, les utilisateurs des données de l'ESoR ont été consultés pour discuter de changements possibles, mais le contenu de l'instrument de collecte de l'ESoR est demeuré relativement le même au fil du temps. Le questionnaire électronique utilisé pour l'ESoR de 2021 a été révisée par le Centre de ressources en conception de questionnaires de Statistique Canada.

Le principal mode de collecte était par interview téléphonique assistée par ordinateur (ITAO). L'application d'ITAO a été mise à l'essai en profondeur avant la collecte.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

Un plan d'échantillonnage aléatoire systématique stratifié a été utilisé pour sélectionner un échantillon de personnes.

La base de sondage a été conçue en utilisant huit sources indépendantes du Recensement de 2021. Les cinq premières bases de sondage ont été utilisées pour la sélection d'un échantillon servant à l'estimation du sous-dénombrement dans les dix provinces tandis que les estimations pour les trois territoires ont été calculées au moyen des échantillons tirés des trois dernières bases de sondage seulement.

Au niveau des provinces, les deux premières bases de sondage portent sur les personnes qui faisaient partie de la population cible du Recensement de 2016. Elles représentent toutes les personnes dénombrées au Recensement de 2016 en plus des personnes omises lors du recensement, représentées par la portion de l'échantillon de personnes de la Contre-vérification des dossiers (CVD) de 2016 qui ont été classées comme omises. Afin de représenter les personnes qui se sont ajoutées à la population cible depuis le recensement précédent, les naissances et les immigrants intercensitaires (c.-à-d. entre les Recensements de 2016 et 2021) ont été ajoutés, de même que les résidents non permanents en date du jour du recensement. La base des trois territoires a été conçue en utilisant leur fichier d'assurance maladie respectif.
Le plan d'échantillonnage variait d'une base de sondage à l'autre. Dans la base du Recensement de 2016, le plan d'échantillonnage était un plan stratifié à un seul degré. La population a été stratifiée en fonction de la probabilité de faire partie de la population cible du recensement et la probabilité d'avoir été dénombré, de même que selon la province, le sexe et l'âge. Les personnes dénombrées au Recensement de 2016 dans des réserves ont été classées dans des strates séparées. Dans la base des territoires, le plan d'échantillonnage était également un plan stratifié à un degré. La population a été stratifiée selon le territoire de résidence, le sexe et l'âge.

La base des personnes omises est une base de sondage fondée sur un échantillon puisqu'il n'existe pas de liste de toutes les personnes omises au Recensement de 2016. L'échantillon de cette base de sondage était constitué de tous les cas classés « omis » lors de la CVD de 2016. L'échantillon n'a pas été stratifié comme tel, même s'il y avait une stratification implicite, car les cas omis en 2016 provenaient de bases de sondage et de strates différentes.

La base des naissances a été stratifiée selon la province de résidence de la mère. La base des immigrants et celle des résidents non permanents (détenteurs de permis et revendicateurs du statut de réfugié) ont aussi été stratifiées selon la province.

Lorsque plusieurs bases de sondage sont utilisées, comme c'est le cas pour l'ESoR, la possibilité existe qu'une personne soit incluse dans plus d'une base de sondage. Par exemple, une personne qui est incluse dans la base des immigrants pouvait être au Canada en mai 2016 avec un permis de travail et aurait été alors dénombrable au Recensement de 2016. Elle serait donc à la fois dans la base des immigrants, et dans celle du recensement si elle était dénombrée ou dans celle des personnes omises si elle était omise. Il est donc important de relever tous les cas de chevauchement de base de sondage, sinon les estimations produites risquent d'être trop élevées puisque des personnes se trouveraient à être comptées deux fois dans les bases de sondage. Dans la mesure du possible, ce chevauchement a été relevé lors de la conception des bases de sondage, mais une partie de ce chevauchement a également été relevée plus tard en utilisant l'information fournie par les répondants.

La taille d'échantillon totale, de même que sa répartition, ont été déterminées de manière à atteindre un certain niveau de précision pour l'estimation du sous-dénombrement dans chaque province et territoire, de même qu'au niveau national, tout en contrôlant les coûts de collecte et de traitement.

Sources des données

Collecte des données pour cette période de référence : mars 2022 à août 2022

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants.

Bien que l'Enquête sur le sous-dénombrement du recensement (ESoR) de 2021 ait été une enquête multimodale, le principal mode de collecte était l'interview téléphonique assistée par ordinateur (ITAO). L'application d'ITAO a été conçue en utilisant un grand nombre des normes fixées pour l'ensemble des questionnaires d'ITAO utilisés à Statistique Canada. L'application comprenait divers modules interreliés et accessibles par l'interface générique des bureaux régionaux. Les intervieweurs ont été affectés aux cas en fonction de la langue et en fonction des cas qui exigeaient du dépistage ou non. Par définition, la collecte se faisait par personne interposée pour les personnes choisies (PC) de moins de 18 ans ou les personnes présumées décédées. Les réponses par personne interposée ont aussi été permises lorsque la PC n'était pas disponible pendant la période de collecte ou lorsqu'elle était difficile à joindre.

L'interview ITAO prenait en moyenne moins de 15 minutes. Cependant, le temps réel consacré à chaque cas était beaucoup plus long, étant donné le nombre de tentatives de contact requises et tout le travail de dépistage à effectuer.

Un mode d'auto-réponse par questionnaire électronique était disponiblepour les PC contactées par téléphone et qui demandaient à compléter le questionnaire par eux-mêmes. Les personnes choisies que les intervieweurs ne réussissaient pas à joindre par téléphone et qui avaient une adresse postale valide ont reçu une lettre d'invitation expliquant l'enquête et fournissant un Code d'accès sécuritaire (CAS) afin de compléter le questionnaire en ligne, de même que des instructions sur la manière de procéder.

De nombreuses sources de données administratives ont été utilisées lors des différentes opérations de l'ESoR. Pour construire les bases de sondage, les données des statistiques de l'état civil sur les naissances intercensitaires ont été utilisées, tout comme les données administratives provenant d'Immigration, Réfugiés et Citoyenneté Canada au sujet des immigrants et des résidents non permanents et les fichiers de l'assurance-santé de chacun des trois territoires. Afin de mettre à jour l'information géographique, en particulier pour l'échantillon du recensement et des omis dont l'information datait de 2016, un appariement aux fichiers de l'Agence de revenu du Canada (ARC) dont celui d'Impôt sur le revenu des particuliers de 2016 à 2020 et ceux de prestations canadiennes pour enfants de 2020-2021 a été effectué. Les fichiers de l'ARC et des données de la statistique de l'état civil ont également été utilisés afin de vérifier si des personnes sélectionnées étaient décédées. Dans le cadre de la préparation de l'échantillon, les cas ont fait l'objet d'un appariement avec les données fiscales et des fichiers téléphoniques pour trouver les coordonnées à jour de la PC et des membres de son ménage. Ces différents fichiers de données administratives sont obtenus par Statistique Canada en vertu de la Loi sur la statistique.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

L'application d'interview téléphonique assistée par ordinateur (ITAO) comportait une vérification automatisée pour s'assurer que les données étaient recueillies pour la bonne personne. Une vérification similaire a été faite après la collecte. L'application d'ITAO comportait également plusieurs vérifications au sujet des données manquantes ou incohérentes. Les interviewers avaient la possibilité de changer les données qu'ils avaient saisies. Les données ont été soumises à des vérifications après collecte pour les données manquantes, incomplètes ou incohérentes. La classification de chaque personne échantillonnée comme dénombrée, omise ou hors du champ de l'enquête a été faite après le traitement post-collecte. Afin d'obtenir la plus haute qualité de classification possible, tous les cas potentiellement classés comme omis ont été revus en profondeur.

Imputation

Bien que la non-réponse d'item ait été plutôt faible pour la plupart des questions dans le questionnaire de l'ESoR, elle était plus élevée pour le module s'appliquant aux personnes dont la résidence habituelle le jour du recensement se trouvait à l'extérieur du Canda. Les questions de ce module jouent un rôle déterminant afin de classifier correctement ces personnes. L'imputation par donneur a été utilisée pour imputer la non-réponse d'item pour les pricnipales questions de ce module. Ailleurs, la méthode de l'imputation déterministe a été utilisée pour quelques données manquantes, incomplètes ou incohérentes.

Estimation

L'estimation de l'Enquête sur le sous-dénombrement du recensement (ESoR) se divise en deux parties. D'abord, il y a la pondération des personnes choisies (PC) qui est suivie du calcul du sous-dénombrement de la population au recensement.

Le poids initial d'une PC de la base des personnes omises de 2016 correspond au poids final qui lui a été attribué lors de la CVD de 2016 au moment où la PC avait été classée comme omise. Pour les PC des autres bases de sondage, les poids initiaux sont attribués en fonction de l'inverse des probabilités de sélection dans l'échantillon.

Pour réduire les biais, les poids initiaux des répondants devaient être rajustés pour tenir compte de la non-réponse. Le poids des personnes pour lesquelles une classification n'avait pas pu être établie (appelées non-répondants) a été redistribué parmi les personnes pour lesquelles une classification a été établie (appelées répondants). Cette redistribution s'est faite en s'assurant que le poids des non-répondants ayant certaines caractéristiques a été redistribué parmi des groupes de répondants ayant les mêmes caractéristiques. Les caractéristiques suivantes ont été utilisées : l'information disponible dans la base de sondage, différents indicateurs fiscaux de même que l'information provenant de la collecte.

L'ajustement des poids initiaux pour tenir compte de la non-réponse était suivi par deux étapes de calage. La première était pour les bases de sondage des territoires. L'estimation du nombre de personnes dénombrées dans les territoires obtenue à l'aide des poids ajustés pour la non-réponse est traditionnellement inférieure au chiffre comparable du recensement. Cette situation semble due à un sous-dénombrement de la population cible du recensement dans les fichiers d'assurance maladie. Pour pallier ce sous-dénombrement, les poids des PC sélectionnées dans les territoires ont été rajustés afin que l'estimation du nombre de personnes dénombrées, selon l'âge et le sexe, soit égale au chiffre comparable du recensement pour ce territoire. Trois groupes d'âge ont été utilisés. Le deuxième calage était pour la base du recensement. Des variables auxiliaires fortement corrélées avec les classifications de l'ESoR des personnes dénombrées, décédées et omises ont été dérivées pour chaque personne dans la base du recensement. Les poids des répondants de l'échantillon provenant de la base du recensement ont ensuite été ajustés de façon à ce que les totaux estimés pour ces variables auxiliaires correspondent aux totaux connus de la base de sondage.

Finalement, les poids des PC de la base du Recensement de 2016 qui avaient été dénombrées plus d'une fois en 2016 ont été ajustés à la baisse pour tenir compte du fait que ces PC avaient plus d'une chance d'être sélectionnées.

Le sous-dénombrement de la population au recensement a été estimé en utilisant le nombre pondéré de personnes omises moins le nombre de personnes exclues de la version de l'ESoR de la base de données des réponses du recensement (BDRR ESoR) de 2021. La BDRR ESoR est une version différente de la base de données des réponses du Recensement de 2021 finale, qui était disponible avant la fin du traitement des données du recensement. Il y a quelques différences mineures entre la BDRR ESoR et les versions ultérieures des bases de données du recensement. En particulier, la BDRR ESoR, qui une base des données sur les personnes, comprend tous les enregistrements du recensement pour les personnes sauf deux exceptions. La première exception a trait aux enregistrements du recensement imputés dans le cadre des imputations de ménages entiers. Le deuxième groupe a trait aux enregistrements du recensement avec des noms invalides ou incomplets, ou des dates de naissance invalides ou incomplètes. Ce groupe est également connu comme étant les « dénombrements incomplets ».

Finalement, pour les besoins du calcul de la variance des estimations de l'ESoR, la méthode du bootstrap a été utilisée. Cinq cent poids bootstrap ont été créés.

Évaluation de la qualité

Les vérifications avant diffusion ont consisté en une comparaison avec d'autres sources de données publiées (chiffre du recensement du nombre de personnes dénombrées, estimations de la population des personnes décédées, des émigrants et de la migration interne), et en une analyse des tendances historiques. De plus, il existe un processus exhaustif d'attestation après la diffusion des données provisoires avec les coordonnateurs statistiques provinciaux et territoriaux et d'autres clients clés.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Aucune microdonnée n'est diffusée. Aucun tableau n'est produit pour les petites régions géographiques. Par ailleurs, il n'y a pas de cellules de nature délicate.

Révisions et désaisonnalisation

Cette méthodologie ne s'applique pas à cette enquête.

Non-réponse

Plusieurs mesures ont été prises pour minimiser l'effet de la non-réponse sur les estimations de l'Enquête sur le sous-dénombrement du recensement. Premièrement, la majorité des cas ont été résolus sans recourir à la collecte. Des lettres de présentation ont été envoyées aux personnes choisies (PC) avant la collecte. Le bureau central a fourni des pistes pour le dépistage au moyen de nombreux fichiers administratifs, afin d'aider les bureaux régionaux à trouver chaque PC. La période de collecte, qui s'étendait sur cinq mois, permettait de multiples tentatives de prise de contact pour chaque cas, de même qu'un dépistage extensif. La collecte multimodale, où des lettres invitant à remplir le questionnaire en ligne ont été envoyées aux PC les plus difficiles à joindre, a aussi contribué à compléter plus d'interviews.

Il est important de noter que la définition d'un non-répondant pour la classification, et par conséquent pour l'estimation, diffère de la définition habituelle d'un non-répondant, selon laquelle la collecte des données pour ces cas n'a pu être complétée avec succès. Il en est ainsi parce que la classification est effectuée en utilisant des données provenant de plusieurs sources, dont l'une peut être la collecte.

Exactitude des données

Les données de l'Enquête sur le sous-dénombrement du recensement sont combinées avec les résultats de l'Étude sur le surdénombrement du recensement et les données de la base de données du recensement finale pour estimer l'erreur de couverture de la population. Les erreurs-types sont fournies pour chaque estimation des tableaux de diffusion.

Date de modification :