Recensement de la population

Information détaillée pour 2016

Statut :

Active

Fréquence :

Aux 5 ans

Numéro d'enregistrement :

3901

Le recensement fournit un portrait statistique détaillé du Canada et de sa population en fonction de leurs caractéristiques démographiques, sociales et économiques. Les données recueillies sont importantes pour les collectivités et elles sont essentielles pour planifier des services tels que des garderies, des écoles, des services à la famille ainsi que de la formation pour acquérir des compétences nécessaires à l'emploi.

Date de la parution - 8 fév. 2017 (population et logements); 3 mai 2017 (âge, sexe. type de logement); 2 août 2017 (familles, langue); 13 sept. 2017 (revenu); 25 oct. 2017 (immigration, logement, peuple autochtones); 29 nov. 2017 (scolarité, travail, migration)

Aperçu

Statistique Canada mène le Recensement de la population pour brosser un portrait statistique du Canada et de sa population à un jour donné. Le recensement est conçu pour fournir de l'information sur les personnes et les unités de logement au Canada en fonction de leurs caractéristiques démographiques, sociales et économiques.

Statistique Canada a rétabli le questionnaire détaillé à participation obligatoire, à temps pour le Recensement de 2016. Ainsi, un échantillon de approximativement 25 % des ménages canadiens ont reçu un questionnaire détaillé. Tous les autres ménages ont reçu un questionnaire abrégé.

Le recensement est un moyen fiable d'estimer la population des provinces, des territoires et des municipalités. Les données recueillies sont liées à des mesures législatives fédérales et provinciales et servent à la répartition des paiements de transfert fédéraux. Le recensement fournit également des renseignements sur les caractéristiques de la population et des logements dans de petites régions géographiques, ainsi que pour de petits groupes de population, afin d'appuyer les activités de planification, d'administration, d'élaboration des politiques et d'évaluation de toutes les échelles des administrations publiques. Les données sont également utilisées par le secteur privé.

Clients : Le gouvernement fédéral, les gouvernements provinciaux et territoriaux, les administrations municipales, les bibliothèques, les établissements d'enseignement, les chercheurs et universitaires, le secteur privé, les associations de gens d'affaires, les syndicats, les groupes ethniques et culturels, les citoyens et les groupes de défense de l'intérêt public comptent parmi les utilisateurs des données du recensement.

Période de référence : 10 mai 2016, sauf indication contraire.

Période de collecte : Mois de mai, chaque (5) cinq ans

Sujets

  • Éducation, formation et apprentissage
  • Estimations et projections démographiques
  • Familles, ménages et logement
  • Immigration et diversité ethnoculturelle (anciennement Diversité ethnique et immigration)
  • Langues
  • Peuples autochtones
  • Population et démographie
  • Revenu, pensions, dépenses et richesse
  • Société et communauté
  • Travail

Sources de données et méthodologie

Population cible

Le recensement vise l'ensemble de la population du Canada, qui est formée, des citoyens canadiens (par naissance et par naturalisation), des immigrants reçus et des résidents non permanents ainsi que les membres de leur famille qui vivent avec eux au Canada. Les résidents non permanents sont des personnes titulaires d'un permis de travail ou d'études, ou qui revendiquent le statut de réfugié.

Le recensement dénombre aussi les citoyens canadiens et les immigrants reçus qui sont temporairement à l'extérieur du Canada le jour du recensement. Il s'agit, par exemple, des fonctionnaires fédéraux et provinciaux en poste à l'extérieur du Canada, du personnel des ambassades canadiennes à l'étranger, des membres des Forces armées canadiennes en poste à l'étranger et des Canadiens qui se trouvent à bord de navires marchands. En raison du dénombrement des personnes se trouvant à l'extérieur du pays, le Recensement du Canada est un recensement de jure modifié.

Les résidents étrangers comme les représentants de gouvernements étrangers affectés à une ambassade, à un haut-commissariat ou à une autre mission diplomatique au Canada, et les ressortissants d'autres pays qui sont en visite temporaire au Canada ne sont pas dénombrés.

Questionnaire détaillé
La population cible du questionnaire détaillé du recensement est la même que celle du questionnaire abrégé, à l'exception des citoyens canadiens vivant temporairement à l'étranger, des membres à temps plein des Forces canadiennes en poste à l'étranger, des personnes vivant dans des logements collectifs institutionnels comme les hôpitaux, les établissements de soins infirmiers et les établissements pénitentiaires, et les personnes vivant dans des logements collectifs non institutionnels comme les camps de travail, les hôtels et motels et les résidences pour étudiants.

Élaboration de l'instrument

Avant chaque Recensement de la population, Statistique Canada entreprend un processus de trois à quatre ans pour passer en revue le contenu du questionnaire. Dans le cadre de ce processus, des consultations sont menées auprès des utilisateurs des données, des mises à l'essai sont effectuées et le contenu du questionnaire est élaboré de manière à tenir compte de l'évolution de la société canadienne. Parmi les facteurs pris en compte pour élaborer le contenu, mentionnons les renseignements exigés en vertu des besoins législatifs, les besoins découlant des programmes et des politiques, le fardeau imposé aux répondants, les préoccupations relatives à la protection des renseignements personnels, les commentaires ressortis des consultations et des évaluations, la qualité des données, les coûts et les facteurs opérationnels, la comparabilité des données avec les données antérieures et la disponibilité d'autres sources de données.

Statistique Canada a mené des consultations sur le contenu des questionnaires. L'organisme a reçu des propositions de divers intervenants et a tenu des réunions et des conférences téléphoniques avec un large éventail d'utilisateurs de données, dont des ministères et organismes fédéraux, des ministères provinciaux et territoriaux, des administrations municipales, le grand public, des bibliothèques, des universitaires, des groupes d'intérêt, le secteur privé ainsi que des distributeurs autorisés de données du recensement. C'est en décembre 2010 que Statistique Canada a lancé le Projet de la stratégie du Recensement de 2016, et les consultations sur le contenu du questionnaire de 2016 ont commencé en septembre 2012.

Statistique Canada mène des essais quantitatifs et qualitatifs du contenu du questionnaire. Ces essais qualitatifs ont été menés avec l'aide du Centre de ressources en conception de questionnaires (CRCQ) de Statistique Canada, à partir de questionnaires fondés sur les questions du Recensement de 2011. Les questionnaires ont été mis à l'essai par le CRCQ en juin 2013, en septembre 2013 et en janvier 2014. En outre, des essais quantitatifs ont été menés en mai 2014 et un test des procédures sur le terrain a été effectué à partir des questionnaires en octobre 2014.

Conformément à la Loi sur la statistique, les questions du recensement ont été prescrites par le gouverneur en conseil en vertu d'un décret signé le 29 janvier 2016. Les questions qui suivent la question 10 constituent le questionnaire détaillé du recensement et seront posées en vertu de l'article 22 de la Loi sur la statistique, et prescrites par le statisticien en chef sous la direction du ministre. Le décret et l'annexe des questions ont été publiés dans la Gazette du Canada le 6 février 2016.

Échantillonnage

Pour le questionnaire abrégé :

Il s'agit d'un recensement intégral à plan transversal.

Les questions sur l'âge, le sexe, l'état matrimonial, la langue maternelle et le lien avec la personne 1 sont posées à l'ensemble de la population (100 %). Aucun échantillonnage n'est effectué, les données étant recueillies pour toutes les unités (logements) de la population cible.

Pour le questionnaire détaillé :

Il s'agit d'une enquête transversale par échantillon.

Pour le questionnaire détaillé, un échantillon aléatoire d'un logement privé sur quatre au Canada est sélectionné systématiquement. La taille de l'échantillon a été déterminée afin d'assurer la diffusion d'estimations fiables pour de petites régions géographiques et de petits groupes de population. L'échantillon du questionnaire détaillé est sélectionné à partir de la liste de logements du Recensement de 2016.

Sources des données

Collecte des données pour cette période de référence : 2016-02-02 à 2016-07-29

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

La collecte comprenait la réponse par Internet, par questionnaire papier, par l'entremise de l'Assistance téléphonique du recensement, par interview, par le suivi des rejets à la vérification et par le suivi des cas de non-réponse. Le contenu des questionnaires du Recensement de la population de 2016 (questionnaires abrégé et détaillé) a un contenu similaire à celui du Recensement de la population de 2011, à l'exception des questions sur le revenu, pour lesquelles les réponses seront tirées de données administratives, et de la question sur la religion, qui est posée tous les dix (10) ans. Statistique Canada a recueilli également des renseignements sur le revenu à partir des dossiers d'impôt et de prestations des particuliers.

Données sur le revenu:

1) Pour réduire le fardeau de réponse et améliorer la qualité et la quantité disponible de données sur le revenu, le programme du Recensement de la population de 2016 a recueilli l'information sur le revenu de sources administratives seulement plutôt que de la demander directement des répondants.

Aux fins statistiques, les données des répondants sur le revenu, l'impôt sur le revenu, les contributions à des régimes enregistrés et certaines dépenses furent extraites de leur dossier personnel de revenus et de prestations (y compris la déclaration d'impôt T1, divers feuillets d'information soumis à l'ARC et les programmes de la PFCE et le crédit pour la TPS) et ajoutées à leurs réponses au recensement de la population (questionnaire abrégé et questionnaire détaillé).

De l'Agence de revenu du Canada (ARC) :
T1 Fichier principal personnel, 2014 et 2015
Fichier de la Prestation fiscale canadienne pour enfants, années de programme 2014-2015 et 2015-2016
Fichiers du Crédit pour la TPS, années de programme 2014-2015 et 2015-2016
T4 État de la rémunération, 2014 et 2015
Feuillets de contributions et retraits CÉLI, 2014 et 2015
Feuillets divers de revenus et déductions, 2015
(comprend T4A, T4ANR, T4OAS, T4RIF, T4RSP, T5007, T5, T4NR, T4A(P) - RRQ et RPC, T5018, T5008, T1204, contributions aux REÉR, SAFER)
Feuillets d'information, annexe 9 et fichier principal T3, 2015
État des revenus d'une société de personnes T5013, 2015
T4E État des prestations d'assurance-emploi et autres prestations, 2015

Ces fichiers furent obtenus avec l'autorité de la section 24 de la Loi sur la statistique. Des versions à jour en décembre 2016 furent employées lorsque possible.

Le traitement de chacun de ces fichiers était très similaire et fut complété en deux phases principales : le couplage des données administratives et l'adaptation des concepts administratifs aux concepts statistiques.

La phase de couplage exigeait de choisir les identifiants personnels disponibles dans le fichier, de les nettoyer et normaliser afin de permettre la comparaison à une version des identifiants obtenus de la base de données des réponses du recensement et traités de façon semblable. Lorsque les identifiants personnels des fichiers administratifs étaient moins complets (pour les feuillets d'information en particulier) mais qu'un numéro d'assurance sociale (NAS) était disponible, la date de naissance et les noms complets furent tirés d'un index pour compléter l'information et faciliter le processus d'appariement. Le processus d'appariement statistique comportait une certaine tolérance qui permettait de retrouver des paires même si certains identifiants n'étaient pas parfaitement identiques sur les deux fichiers.

Les concepts requis pour administrer la Loi de l'impôt sur le revenu ne sont pas toujours entièrement compatibles avec les normes des concepts de revenus employés par Statistique Canada. Lorsqu'appropriés, les montants en dollars des lignes de la déclaration de revenus ou des boîtes sur les feuillets d'information furent additionnés ou soustraits pour se conformer aux concepts statistiques. En particulier, des sources de revenus non imposables sont comprises dans le concept de revenu total et certains montants imposables, tels les gains en capital, sont exclus.

De surcroît, quelques changements de valeurs considérées non plausibles furent appliqués durant la phase de vérification et d'imputation suivant la cohérence générale des autres variables.

Seules les informations sur le revenu, sur les variables démographiques de base et sur la mesure de la qualité de l'appariement furent ajoutées à la base de données de vérification et d'imputation du recensement de 2016. Aucun identifiant personnel (c.à.d. aucun nom, adresse ou numéro de téléphone) ne fut retenu sur cette base de données et l'accès est restreint seulement aux employés dont les tâches requièrent cet accès.

Seuls des résultats statistiques agrégés et des analyses conformes aux provisions de confidentialité de la loi sur la statistique sont diffusés hors de Statistique Canada. Les produits du recensement comprennent un vaste ensemble d'analyses et de tableaux de données normalisés ainsi que des tableaux personnalisés.

2) Tel que décrit ci-haut, un index administratif fut utilisé pour compléter les identifiants personnels disponibles et faciliter l'appariement pour les enregistrements composés de feuillets d'information seulement (sans date de naissance, nom ou adresse complète) et pour s'assurer que les personnes détenant plusieurs NAS soient traitées de façon appropriée.

D'Emploi et Développement social Canada (ESDC) :
Extrait du Registre de l'assurance sociale, 2016

Acquis sous l'autorité de la section 13 de la Loi sur la statistique. Version du fichier employée était datée de septembre 2016.

3) D'autres utilisations de données administratives, bien que non planifiées avant le recensement, ont eu lieu pour pallier à des difficultés durant la collecte dans les régions affectées par des feux de forêt en Alberta. Ces utilisations sont décrites dans l'annexe 1.4 du Guide du Recensement de la Population, 2016 (http://www12.statcan.gc.ca/census-recensement/2016/ref/98-304/app-ann1-4-fra.cfm).


Données sur l'immigration:

Les variables de catégorie d'admission et de type de demandeur dans les données administratives d'Immigration, Réfugiés et Citoyenneté Canada (IRCC) sur l'immigration ont été ajoutées au Recensement de 2016 afin de mieux comprendre les conditions sous lesquelles les immigrants ont été admis au Canada (par exemple, les immigrants économiques, les immigrants parrainés par la famille, les réfugiés, etc.) et leur intégration socioéconomique (par ex., éducation, travail, langue et logement) dans la société canadienne.

Les données ont été obtenues en vertu de l'article 13 de la Loi sur la statistique. Dans la mesure du possible, des versions à jour en date du mois de janvier 2017 ont été utilisées.

Le traitement des données de ces fichiers a été effectué en deux phases principales : le couplage des dossiers administratifs et l'adaptation des concepts administratifs aux concepts statistiques.

La phase de couplage exigeait que les identifiants personnels choisis dans le fichier soient normalisés afin de permettre la comparaison à une version des identifiants obtenus de la base de données des réponses du recensement et traités de façon semblable. Le processus d'appariement statistique comportait une certaine tolérance qui permettait de retrouver des paires même si certains identifiants n'étaient pas parfaitement identiques dans les deux fichiers.

Le prétraitement des variables dans les données administratives sur l'immigration a également été effectué. Cela comprenait le remplacement des entrées erronées par des champs vides et la normalisation des variables administratives aux formats et ensembles de codes des variables du Recensement de 2016. De plus, quelques changements ont été apportés aux valeurs non plausibles de certains champs au cours de la phase de contrôle et d'imputation selon la cohérence générale avec les autres champs, dont l'année d'immigration.

Seules les variables d'immigration pertinentes ont été ajoutées à la base de données de contrôle et d'imputation du Recensement de 2016 par les clés de couplage. Aucun identifiant personnel (comme les noms, les adresses ou les dates de naissance) n'a été retenu dans cette base de données.

Seules les analyses et les estimations statistiques agrégées qui sont conformes aux dispositions en matière de confidentialité de la Loi sur la statistique sont diffusées. Les produits du recensement comprennent un vaste ensemble d'analyses et de tableaux de données normalisés ainsi que des totalisations personnalisées.

Données sur le revenu:

L'intégration des données sur le revenu dans le recensement emploie une technique de remplacement de données directe. Les données sur le revenu de source administrative sont obtenues pour des variables de revenu précises pour le sous-ensemble de répondants identifiés dans chaque source administrative.

Si des valeurs différentes ou incohérentes sont obtenues de fichiers distincts, habituellement, les valeurs de la déclaration de revenus et prestations T1 sont employées en priorité plutôt que les valeurs tirées de feuillets d'information qui ne sont pas toujours contrôlées ou modifiées à l'Agence du revenu du Canada.

Pour les observations avec de l'information de source administrative incomplète (p. ex. si le répondant n'est pas identifié dans le fichier administratif ou s'il ou elle n'a pas produit de déclarations de revenus), les variables manquantes sont imputées selon une méthode par donneur, le donneur étant choisi d'après les autres informations disponibles.

Données sur l'immigration:

Le couplage des enregistrements a été effectué en couplant les données administratives sur l'immigration d'IRCC à la base de données du Recensement de la population de 2016.

Parmi les enregistrements couplés, seuls ceux ayant, au recensement, une année d'immigration supérieure ou égale à 1980 étaient retenus en vue du traitement.

Toute incohérence entre les variables traditionnelles du recensement et les variables de catégorie d'admission dans le fichier de données administratives sur l'immigration a été résolue en modifiant la valeur de catégorie d'admission pendant le processus de contrôle et d'imputation.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

Le Centre des opérations des données (COD) de Statistique Canada était le point central pour la réception et l'entreposage des questionnaires électroniques et imprimés. Les questionnaires électroniques ont été transmis directement aux serveurs du COD et les questionnaires imprimés ont été numérisés et sauvegardés en images.

Une série de contrôles automatisés a été faite sur les images afin d'assurer que chacune était apte à la saisie des données. Les images qui ont échoué aux contrôles ont été envoyées à une révision effectuée par des préposés; pour les cas dont l'image était considérée inapte à la saisie le formulaire a été envoyé à être re-numérisé ou transcrit manuellement.

Les données ont ensuite été saisies à partir des images à une étape automatisée qui utilise la reconnaissance optique des marques (ROM) et la reconnaissance optique des caractères (ROC). Les réponses que la ROM ou la ROC n'ont pas réussi à saisir à cause de problèmes tels qu'une mauvaise écriture ont été saisies manuellement par des opérateurs. Plusieurs contrôles ont été appliqués aux résultats de la reconnaissance automatisée ainsi qu'à ceux de la saisie manuelle pour assurer que les valeurs répondaient aux attentes, telles que cohérence entre les champs, valeurs de champs numériques comprises entre certaines bornes, etc. Les échecs à la saisie automatisée ont été envoyés à la saisie manuelle, tandis que les échecs à l'étape de saisie manuelle ont été signalés à l'opérateur afin qu'ils soient corrigés.

Après la saisie des données, toutes les réponses ont été soumises à une série de vérifications, appelées « contrôles de couverture », afin d'identifier tout problème qui affecte le dénombrement des personnes dans chaque ménage. Ceci inclut des personnes ou des questionnaires en double, ou une fausse personne créée par des erreurs de saisie ou de réponse. Toutes les erreurs trouvées ont été corrigées par des processus automatisés quand c'était possible. Les autres ont été envoyées à un système interactif où elles ont été corrigées manuellement par un opérateur.

Après l'étape des contrôles de couverture, les réponses ont été vérifiées afin de déterminer si le ménage avait besoin d'un suivi téléphonique pour confirmer que tous les résidents avaient été énumérés et pour obtenir toute donnée manquante. Parmi les ménages qui avaient besoin d'un suivi on retrouve ceux qui ont indiqué qu'ils n'étaient pas sûrs s'ils devaient inclure certaines personnes sur le questionnaire et ceux qui n'ont pas fourni des données pour toutes les personnes figurant sur la liste des membres du ménage.

Le codage, qui est la prochaine étape du traitement des données, a aussi été effectué au COD. Toutes les réponses écrites ont été soumises à un système de codage automatisé qui tentait d'assigner à chaque réponse un code numérique en utilisant des fichiers de référence, des ensembles de codes et les classifications standards de Statistique Canada. Quand le système a été incapable d'assigner un code à une réponse donnée, la réponse a été codée manuellement par un opérateur. Le codage a été effectué pour les variables suivantes : la relation à la personne 1, le lieu de naissance, la citoyenneté, les langues non-officielles, la langue parlée à la maison, la langue maternelle, l'origine ethnique, le groupe de population, la Première Nation/bande indienne, le lieu de résidence il y a un an, le lieu de résidence il y a cinq ans, le lieu de naissance des parents, le principal domaine d'études, le lieu des études, la langue au travail, l'industrie, l'occupation et le lieu de travail.

À chacune des étapes de saisie des données, de contrôles de couverture et de codage, des activités d'assurance de qualité sont exécutées afin de mesurer la qualité et fournir de la rétroaction constante aux responsables des opérations. L'AQ consiste à refaire le traitement pour des échantillons du travail déjà accompli (champs saisis manuellement, ménages ou réponses écrites codées) et à les comparer au traitement initial. Les différences sont envoyées à être traitées une troisième fois afin de déterminer ce que le résultat approprié devrait être. Des rapports quotidiens contenant les taux d'exactitude et d'autres statistiques reliées au traitement sont distribués aux responsables des opérations.

Après le codage, les données sont traitées à l'étape finale de contrôle et d'imputation. Les contrôles finaux détectent des réponses invalides et des incohérences. Ils sont basés sur des règles déterminées par des analystes spécialisés en la matière à Statistique Canada. Les questions sans réponse sont aussi identifiées. L'imputation remplace ces réponses manquantes, invalides ou incohérentes avec des valeurs plausibles.

Imputation

Parmi les données recueillies par toute enquête ou recensement il y a forcément certaines omissions ou incohérences. Ces erreurs peuvent être dues à des questions sautées par le répondant ou encore peuvent avoir été générées durant le traitement, entre autres raisons.

Après l'achèvement des opérations initiales de contrôle et celles de codage, les données ont été soumises à l'activité finale de contrôle et d'imputation. Ce processus final de contrôle a signalé des erreurs que le processus d'imputation a corrigées.

Le système d'imputation est constitué de deux composantes, à savoir l'imputation déterministe et l'imputation par donneur. L'imputation déterministe permet de corriger des erreurs systématiques ou des erreurs n'ayant qu'une seule solution en se fondant sur l'expérience des spécialistes du domaine. Lorsque plusieurs solutions sont possibles pour corriger une erreur, on fait plutôt l'imputation par donneur. Cette méthode, appelée aussi méthode du plus proche voisin, est beaucoup utilisée pour traiter la non-réponse. Elle remplace l'information manquante, invalide ou incohérente au sujet d'un répondant avec des valeurs prises d'un répondant « semblable ». Les règles qui déterminent le répondant le plus semblable peuvent varier selon les variables à imputer. Ces méthodes d'imputation par donneur ont de bonnes propriétés et en général ne changeront pas la distribution des données, un inconvénient de plusieurs autres techniques d'imputation. L'imputation par plus proche voisin vérifie que toute valeur imputée est cohérente avec les autres données.

Estimation

Pour le questionnaire abrégé :

Aucun poids n'est calculé pour produire les estimations du questionnaire abrégé du Recensement de la population. Cependant, une imputation des ménages entiers est effectuée pour compenser les cas de non-réponse totale et les cas de sous-couverture identifiés par l'Enquête sur la classification des logements (ECL).

Une des sources d'erreurs de couverture au Recensement est la mauvaise classification de logements le jour du Recensement. Cette erreur peut se produire quand un logement occupé est classifié comme étant inoccupé ou quand un logement inoccupé est classifié comme étant occupé. Le but de l'ECL est de produire des estimations du nombre de ces erreurs de classification. Un échantillon de logements pour lesquels aucun questionnaire du Recensement n'a été retourné est contacté, de l'information est recueillie sur leur statut d'occupation et, si le logement est occupé, sur le nombre de résidents habituels.

Pour le questionnaire détaillé :

Un poids est produit et associé à chaque ménage répondant de l'échantillon du questionnaire détaillé. On attribue aux personnes, familles de recensement et familles économiques le poids de leur ménage. Ce poids est utilisé pour faire l'estimation des paramètres de population.

Un poids est d'abord calculé pour tous les logements de l'échantillon basé sur le plan de sondage. Ce poids est égal à l'inverse de la probabilité de sélection du logement. Dans les régions éloignées et les réserves indiennes, où tous les ménages sont recensés à l'aide du questionnaire détaillé, il s'agit du poids final et on procède à une imputation des données pour les cas de non-réponse totale et partielle.

Dans le reste du pays, le poids de sondage des ménages répondants est d'abord corrigé pour la couverture, telle qu'évaluée par l'ECL. Le poids résultant est ensuite ajusté pour la non-réponse à l'aide d'un modèle prédisant la probabilité de réponse en fonction de variables dérivées du questionnaire abrégé et de données administratives appariées (données d'impôt des particuliers, registre d'Indiens inscrits et données d'immigration). Le poids des ménages non-répondants est quant à lui mis à zéro. Le poids ajusté pour la non-réponse est ensuite calé pour divers niveaux géographiques à une multitude de totaux du recensement, ainsi qu'à des totaux dérivés des données administratives mentionnées précédemment appariées aux enregistrements du recensement. Les totaux de calage incluent les ménages imputés au recensement basés sur les résultats de l'ECL.

Pour l'estimation de la variabilité due à l'échantillonnage et à la non-réponse totale, des poids de répliques sont utilisés. La méthode d'estimation de la variance s'inspire de la méthode des répliques équilibrées répétées.

Évaluation de la qualité

L'évaluation de la qualité des données permet d'évaluer tous les aspects de la qualité des données du recensement. Les résultats de ces évaluations servent à informer les utilisateurs de la fiabilité des données, à apporter des améliorations au prochain recensement, à ajuster les chiffres du recensement pour la non-réponse et, dans le cas de deux études sur la couverture (Contre-vérification des dossiers et Étude sur le surdénombrement du recensement), à produire les estimations démographiques officielles. Des activités d'évaluation de la qualité sont mises en oeuvre tout au long du processus du recensement, lesquelles commencent avant la collecte des données et se terminent après la diffusion.

Sources des erreurs :

Quel que soit le soin apporté à la conception du recensement, les données recueillies comporteront inévitablement des erreurs. Ces erreurs peuvent survenir pratiquement à tout moment du processus, depuis la préparation du matériel jusqu'à l'établissement de la liste des logements et de la collecte des données, tout comme elles peuvent se produire lors du traitement de celles-ci. Les utilisateurs de données du recensement doivent être conscients de l'existence des types d'erreurs qui peuvent survenir afin de pouvoir évaluer la pertinence des données, à savoir si elles répondent à leurs besoins.

Principaux types d'erreurs :

Les erreurs de couverture se produisent lorsque des logements et/ou des personnes sont omis, incorrectement dénombrés ou dénombrés plus d'une fois.
Les erreurs dues à la non-réponse surviennent lorsqu'une partie des renseignements ou tous les renseignements concernant des personnes, des ménages ou des logements n'ont pas été fournis.
Les erreurs de réponse se produisent lorsqu'une question est mal comprise ou lorsqu'une caractéristique est mal déclarée par le répondant, par l'agent recenseur ou par le téléphoniste de l'Assistance téléphonique du recensement.

Les erreurs de traitement peuvent se manifester à diverses étapes du traitement. Les erreurs de traitement comprennent des erreurs :

1) lors de la saisie des données
2) pendant les opérations de codage lorsque les réponses en toutes lettres sont converties en codes numériques et
3) à l'imputation, lorsqu'une réponse valide (pas nécessairement exacte) est insérée dans un enregistrement pour remplacer une réponse manquante ou invalide.

Les erreurs d'échantillonnage s'appliquent uniquement lorsque les réponses aux questions sont obtenues à partir d'un échantillon. Ce type d'erreur ne s'applique qu'au questionnaire détaillé du Recensement de 2016.

Mesure de la qualité des données :

Un bon nombre d'études sur la qualité des données ont été effectuées lors de recensements récents afin de permettre aux utilisateurs d'évaluer les répercussions des erreurs et d'améliorer leur propre compréhension de la façon dont les erreurs surviennent. Dans le cadre du Recensement de 2016, des études spéciales ont pour but d'examiner les erreurs de couverture et la qualité des données, c'est à dire la non réponse, la réponse et le traitement.

Trois études sont menées pour évaluer les erreurs de couverture :

(1) L'enquête sur la classification des logements (ECL) - Une des sources d'erreurs de couverture au Recensement est la mauvaise classification de logements le jour du Recensement. Cette erreur peut se produire quand un logement occupé est classifié comme étant inoccupé ou quand un logement inoccupé est classifié comme étant occupé. Le but de l'enquête sur la classification des logements (ECL) est de produire des estimations du nombre de ces erreurs de classification. Un échantillon de logements pour lesquels aucun questionnaire du Recensement n'a été retourné est contacté, de l'information est recueillie sur leur statut d'occupation et, si le logement est occupé, sur le nombre de résidents habituels.

Les estimations de l'ECL sont utilisées pour ajuster la distribution de la taille du ménage du Recensement à travers l'imputation des logements qui n'ont pas retourné un questionnaire. Ceci est fait à temps pour la diffusion initiale des chiffres de population.

2) Contre-vérification des dossiers - Cette étude permet d'estimer le nombre de personnes omises dans le cadre du recensement (une fois pris en compte les ajustements décrits dans l'Enquête sur la classification des logements, ci-dessus). Des estimations sont élaborées pour chaque province et territoire ainsi que pour divers sous-groupes de la population (p. ex., les groupes définis selon l'âge, le sexe et l'état matrimonial).

Pour les provinces, la Contre-vérification des dossiers se fait en deux étapes :
- Étape 1 : Sélection d'un échantillon de personnes qui auraient dû être dénombrées dans le cadre du recensement, à partir de diverses sources telles que le recensement antérieur, les registres des naissances, les dossiers d'immigration et de résidents non permanents, et l'échantillon des personnes omises de la Contre-vérification des dossiers du dernier recensement.
- Étape 2 : Couplage des personnes sélectionnées à l'étape 1 avec la base de données des réponses du recensement afin de déterminer si celles-ci ont été dénombrées. L'enquête vise ensuite à dépister et interviewer les personnes n'ayant pas pu être couplées avec certitude avec la base de données des réponses du recensement afin de recueillir des renseignements supplémentaires. Les personnes décédées ou qui ont émigré avant le jour du recensement sont identifiées à partir de sources de données administratives, tel le registre des décès, ou encore durant le dépistage ou lors d'interviews.

Pour ce qui est des territoires, l'étape 1 consiste à coupler les personnes présentes dans les fichiers d'assurance-maladie avec la base de données des réponses du recensement afin d'identifier les personnes qui ont été dénombrées lors du recensement. L'échantillon de la Contre-vérification des dossiers est ensuite choisi parmi les personnes non couplées.

Les résultats de la Contre-vérification des dossiers constituent la source de renseignements la plus importante sur les personnes omises dans le cadre du recensement. Toutefois, contrairement à l'Enquête sur la classification des logements, ces estimations ne servent pas à rajuster les données du recensement avant la diffusion initiale des chiffres de population.

3) Étude sur le surdénombrement du recensement - Dans le cadre des recensements de 2016 et de 2011, le dénombrement en double des personnes est détecté en cherchant des enregistrements couplés qui possèdent un haut degré de concordance quant au sexe, à la date de naissance et au nom. Les enregistrements couplés sont échantillonnés et vérifiés manuellement; les résultats sont utilisés pour estimer le surdénombrement (ou nombre de personnes en double) du recensement.

La combinaison des résultats de la Contre-vérification des dossiers et des résultats de l'Étude sur le surdénombrement du recensement a permis d'estimer l'erreur de couverture nette dans les données du recensement. Cette erreur nette a été utilisée pour calculer les estimations démographiques officielles.

Certification :

La certification consiste en plusieurs activités servant à évaluer rigoureusement la qualité des données du recensement à des niveaux géographiques précis afin d'assurer que les normes de qualité pour la diffusion au grand public soient respectées. Cette évaluation comprend la certification des chiffres de population et des logements ainsi que la certification des variables liées aux caractéristiques des logements et de la population.

Pendant la certification, les taux de réponse, les réponses invalides, les taux de rejet au contrôle ainsi que la comparaison des données avant et après l'imputation sont parmi les mesures utilisées. Les totalisations du Recensement de 2016 sont produites et comparées aux données correspondantes des recensements antérieurs, d'autres enquêtes et de sources administratives. Les tableaux croisés détaillés sont aussi vérifiés pour en assurer la cohérence et la précision.

Pour de plus amples détails sur les indicateurs de qualité et les résultats de la certification, se reporter aux guides de référence associés à chaque domaine d'intérêt.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Selon les résultats de la certification, les données du recensement peuvent être diffusées de trois façons.
- Premièrement, les données peuvent être diffusées sans restriction, reflétant des données de qualité suffisante.
- Deuxièmement, les données peuvent être diffusées de manière conditionnelle ou de façon restrictive. Dans ce cas, les données sont diffusées avec une note spéciale alertant les utilisateurs des limitations possibles. Les données peuvent aussi être traitées de façon particulière, par exemple, en combinant des catégories de déclaration pour répondre à des préoccupations en matière de qualité ou de confidentialité.
- Finalement, les données peuvent être supprimées pour des raisons de qualité.

Les données du recensement diffusées font l'objet de divers processus automatisés et manuels visant à déterminer s'il y a lieu de les supprimer. Ces processus sont mis en oeuvre principalement pour deux raisons : 1) pour garantir la non-divulgation de l'identité et des caractéristiques des répondants (notion représentée par le terme confidentialité dans le présent document) et 2) pour restreindre la diffusion de données de qualité inacceptable (notion représentée par l'expression qualité des données dans la suite du présent document).

Aperçu de la suppression reliée à la confidentialité

La confidentialité fait référence à la garantie que Statistique Canada ne divulgue aucune information qui permettrait d'identifier les répondants. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupements de données reconnaissables. Par conséquent, les régions géographiques dont la population est inférieure à un seuil donné ne sont pas rendues publiques.

Arrondissement aléatoire

Tous les chiffres présentés dans les totalisations du recensement font l'objet d'un arrondissement aléatoire, qui consiste à transformer les chiffres bruts en chiffres arrondis aléatoirement. Cette mesure réduit les risques de divulgation de l'identité des répondants dans les totalisations.

Prévention de la divulgation

Il faut également tenir compte des risques de divulgation directe ou par recoupements au moment de déterminer le contenu des produits. L'évaluation du risque nécessite la prise en considération d'un certain nombre de facteurs. Les données détaillées relatives aux diverses variables, le recoupement des variables et l'échelon géographique selon lequel les données sont réparties ont tous une incidence sur le niveau de risque. Par exemple, il se peut que la production de tableaux indiquant le nombre de personnes que compte le logement et la tranche de valeur détaillée de l'âge selon diverses caractéristiques des membres des ménages ne pose pas de risque de divulgation dans le cas de grandes régions géographiques, mais que ce risque augmente pour les unités géographiques de niveau inférieur.

Suppression des régions pour les régions géographiques normalisées et non normalisées

La suppression des régions a pour objet d'éliminer toutes les données relatives aux caractéristiques pour les régions géographiques dont la population est inférieure à un seuil donné. Le seuil de population défini pour toutes les régions normalisées ou les regroupements de régions normalisées, sauf les îlots, les côtés d'îlot et les régions définies selon le code postal, est de 40. Par conséquent, aucunes caractéristiques ni données totalisées ne sont diffusées pour les régions comptant moins de 40 habitants.
Par contre, le seuil de la population est établi à 100 habitants dans le cas des régions définies selon le code postal à six caractères, des régions constituées d'îlots et de côtés d'îlot. Ces seuils de population sont appliqués aux données du Recensement de 2016 et aux données de tous les recensements antérieurs.

Révisions et désaisonnalisation

Cette méthodologie ne s'applique pas à cette enquête.

Exactitude des données

Les estimations issues du questionnaire détaillé du recensement proviennent d'une enquête-échantillon et sont donc sujettes à la fois aux erreurs dues à l'échantillonnage et aux erreurs non-dues à l'échantillonnage. Les estimations issues du questionnaire abrégé proviennent quant à elles d'un recensement et ne sont donc sujettes qu'aux erreurs non-dues à l'échantillonnage.

Les erreurs non-dues à l'échantillonnage comprennent les erreurs de couverture, de non-réponse, de réponse et de traitement. Elles peuvent se produire au cours de la collecte et du traitement des données, malgré les efforts qui sont faits pour les minimiser.

On mesure les erreurs dues à l'échantillonnage des estimations du questionnaire détaillé à l'aide de l'erreur-type. Les erreurs-types calculées et diffusées estiment en plus de la variabilité d'échantillonnage la variabilité due à la non-réponse totale des ménages échantillonnés. La variabilité due à la non-réponse totale est aussi mesurée car elle peut représenter une portion importante de la variabilité totale des estimations étant donné qu'on échantillonne une grande fraction de la population.

TAUX DE RÉPONSE
Le taux de réponse est l'une des principales mesures de la qualité du Recensement de la population. Le tableau 10.1 dans le Guide du Recensement de la population, 2016 (http://www12.statcan.gc.ca/census-recensement/2016/ref/98-304/chap10-fra.cfm) présente le taux de réponse du Recensement de la population de 2016 à l'échelle nationale et pour chaque province et territoire. Les taux sont présentés pour l'ensemble du questionnaire abrégé et du questionnaire détaillé et pour le questionnaire détaillé seulement.

Le tableau 7 du Guide de référence sur le revenu (http://www12.statcan.gc.ca/census-recensement/2016/ref/guides/004/98-500-x2016004-fra.cfm) présente le taux de couplage aux données administratives pour l'ensemble du Canada et pour chaque province et territoire. La section de la qualité des données fournit aussi une description de l'indicateur de la qualité des données sur le revenu qui est présent dans tous les produits pour montrer la quantité de données qui ne viennent pas de sources administratives pour chaque région géographique. Des indicateurs de qualité des données séparés sont fournis pour les produits tirés du recensement abrégé et ceux tirés de l'échantillon du questionnaire détaillé.

ERREUR NON DUE À L'ÉCHANTILLONNAGE
Le Recensement de la population de 2016 a établi un programme d'assurance de la qualité afin de prévenir, entre autres, les erreurs non dues à l'échantillonnage. Les approches du programme d'assurance de la qualité qui minimisent les erreurs non dues à l'échantillonnage étaient en place lors de la conception du questionnaire, de la formation du personnel de la collecte, des opérations de collecte des données, du traitement des données ainsi qu'à l'étape de vérification et d'imputation.

Puisque les questionnaires ont un impact important sur le comportement des répondants, la performance des intervieweurs, la saisie des données et le traitement, et ainsi donc sur la qualité, des mises à l'essai quantitatives et qualitatives du contenu du questionnaire ont été effectuées avant le Recensement. Le test du contenu a indiqué si les réponses étaient affectées par des changements aux questions, à la formulation et à l'enchaînement du questionnaire papier et électronique. De plus, dans le questionnaire Internet, des fonctions telles que de l'aide en ligne, des vérifications et messages d'erreur automatisés ainsi que des sauts de questions automatisés ont été conçus afin de contribuer à la meilleure qualité des réponses internet tout comme l'élimination des erreurs de saisie des données.

Puisque la plupart du personnel de la collecte des données a été embauché sur une base temporaire sans véritable connaissance sur la façon qu'un recensement est mené, le Projet des opérations sur le terrain du recensement a créé des procédures détaillées de collecte de données incluant l'assurance de qualité et le matériel de formation pour le personnel de collecte des données. L'exactitude du matériel de formation était essentiel afin d'assurer que les bonnes procédures étaient appliquées de façon cohérente partout au pays. Tous les employés sur le terrain étaient sujets à la formation avant d'entrer en fonction. Le matériel de formation incluait les actions détaillées, étape par étape, que le personnel sur le terrain devait entreprendre pour effectuer leurs fonctions ainsi que toutes les procédures d'assurance de qualité pour chaque activité. La formation était donnée par une approche descendante. L'accent était mis sur les activités effectuées les plus fréquemment. De plus, un test des opérations sur le terrain a eu lieu afin de valider le comportement du personnel sur le terrain lorsqu'ils utilisent les nouvelles procédures, systèmes et outils ainsi que l'impact sur la qualité des données.

Au cours du suivi des cas de non-réponse (SCNR), plusieurs vérifications de contrôle de qualité étaient effectuées pour assurer que tous les questionnaires complétés par le personnel sur le terrain satisfaisaient les normes de qualité. Par exemple, la complétude des questionnaires était vérifiée, le contenu des envois reçus était vérifié pour assurer que tous les questionnaires requis étaient inclus et les codes de résultat utilisés dans le système de collecte par les agents recenseurs étaient validés.

Pour chacune des étapes de la saisie des données, des vérifications de couverture et de codage, des activités d'assurance de la qualité étaient menées pour mesurer la qualité et fournir de la rétroaction de façon continue aux opérations. L'assurance de la qualité consiste à traiter à nouveau des échantillons de travail (de champs saisies clés ou codés manuellement) et comparer au traitement initial. Les différences étaient traitées une troisième fois pour déterminer quel devait être le résultat approprié.

Les données recueillies pour n'importe quel enquête ou recensement contiennent des omissions ou incohérences. Ces erreurs peuvent être le résultat de répondants qui manquent une question, ou elles peuvent être dues à des erreurs générées durant le traitement. Après que les opérations initiales de vérification et de codage étaient complétées, les données ont été traitées par l'activité finale de vérification et imputation. Le processus final de vérifications a détecté des erreurs et le processus d'imputation les a corrigées.


BIAS DE NON RÉPONSE
Afin d'éviter un biais de non-réponse pour le Recensement de la population de 2016, un suivi des cas de non-réponse (SCNR) était mené vers la fin du processus de collecte du recensement. Le but était d'assurer des niveaux de réponse adéquats au recensement et à tous les niveaux géographiques. Un taux de réponse élevé est requis pour avoir des données de recensement de haute qualité. Il est bien connu que certains ménages ne répondent pas à l'intérieur d'un délai raisonnable et nécessitent une incitation pour remplir leur questionnaire, ou ont besoin que leur questionnaire soit rempli pour eux, au téléphone ou en personne. Les opérations du SCNR fournissaient des rappels aux occupants et assuraient que tous les occupants potentiels avaient une dernière chance de répondre. Les agents recenseurs pouvaient mener des entrevues par téléphone ou en personne lors d'une visite sur le terrain. Les agents recenseurs ont reçu des instructions qui leurs indiquaient de varier la façon de contacter les ménages afin de maximiser les chances de les rejoindre. Pour la même raison, ils pouvaient varier les heures et les jours des tentatives d'entrevues, puisqu'il est plus probable que les personnes soit à la maison en soirée et les week-ends.

En plus du SCNR, une stratégie de gestion de la tolérance a été appliquée. Le but de la stratégie de gestion de la tolérance pour le Recensement de la population de 2016 était d'obtenir un taux de réponse national d'au moins 98 % ainsi que des taux de réponse uniformes partout au pays. La stratégie de gestion de la tolérance pour le Recensement de la population de 2016 était composée de cinq niveaux (étapes) pour faire la gestion de la tolérance.

Pour chacun des niveaux, la collecte active a été arrêtée pour les logements des unités de collecte (UC) où il restait très peu de travail à faire, ayant ainsi un petit impact sur la qualité si la collecte est arrêtée. Ceci permettait aux ressources disponibles de se concentrer dans les régions où les gains en qualité étaient plus significatifs. Toutefois, la collecte active était arrêtée dans des UC seulement si l'UC avait atteint des critères liés au compte de logements, aux taux de logements inoccupés, de questionnaires incomplets, de refus et de ménages absents. Différentes actions ont été prises dans différentes régions et à différentes fréquences selon la situation locale et les besoins. À la fin de la collecte lorsque qu'une dernière poussée était nécessaire dans des régions où nous ne pourrions publier des données ou là où il y avait le plus à gagner et le plus grand impact, des instructions spéciales pouvaient être données au personnel de la collecte afin d'obtenir suffisamment d'information de base.

ERREUR DE COUVERTURE
La collecte et le traitement des données du recensement sont assujettis à des normes de qualité rigoureuses, mais il est très difficile d'éliminer toutes les erreurs possibles. Les sources possibles d'erreurs de couverture ont été définies au cours de l'étape de planification du Recensement de 2016 et des mesures ont été prises pour en réduire les risques. Par exemple, pour les secteurs d'envoi par la poste, l'envoi a été effectué en fonction d'une liste d'adresses provenant du Registre des adresses de Statistique Canada. Cette liste était mise à jour régulièrement et des activités de mise à jour ont eu lieu, principalement là où la plus forte croissance était observée. Pour ce qui est des secteurs de listage/livraison, le manuel de l'agent recenseur renfermait des instructions quant à la façon de recenser une unité de collecte (qui est la zone assignée à un agent recenseur) tout en minimisant les risques d'oublier des logements. De nombreuses autres mesures ont été mises en place afin de maximiser la couverture de la population par le recensement. Par exemple, le questionnaire incluait une partie intitulée « Qui inscrire », ce qui permettait aux répondants de savoir quelles personnes devaient être incluses. De plus, près de 70 % des réponses au Recensement de 2016 ont été obtenues par Internet, et le questionnaire sur Internet comprenait des questions de vérification additionnelles lorsque les répondants déclaraient un logement inoccupé ou inexistant, ou s'ils avaient de la difficulté à déterminer si une personne devait être incluse ou non. Aussi, un suivi téléphonique a été effectué après l'examen des questionnaires en cas d'incohérence quant à la couverture ou pour vérifier le statut des ménages, y compris les questionnaires ne comportant que des résidents étrangers ou temporaires. Ces procédures, ainsi qu'une formation appropriée du personnel impliqué dans ces opérations, des vérifications supervisées et des systèmes de contrôle qualitatif durant les étapes de collecte et de traitement ont permis de réduire le nombre d'erreurs de couverture.

Le Programme de mesure de l'erreur de couverture du Recensement de 2016 permet d'établir une estimation des erreurs de couverture pour l'univers de la population. Il existe deux types d'erreurs de couverture de la population. Le sous-dénombrement de la population désigne l'exclusion de personnes qui auraient dû être dénombrées, alors que le surdénombrement de la population désigne l'inclusion de personnes dénombrées plus d'une fois (généralement deux fois). Le surdénombrement inclut aussi les personnes dénombrées qui n'auraient pas dû l'être. Toutefois, on ne mesure pas ce type d'erreur, car les études précédentes ont montré qu'il est négligeable. Dans le contexte du recensement du Canada, le sous-dénombrement est en général plus élevé que le surdénombrement. Ainsi, l'incidence nette du sous-dénombrement et du surdénombrement sur la taille de la population étudiée est le sous-dénombrement net de la population. La population dénombrée au recensement et corrigée du sous-dénombrement net constitue la population de base des estimations démographiques produites par Statistique Canada.

L'Enquête sur la classification des logements (ECL) portait sur les erreurs de couverture attribuables aux erreurs de classification des logements. Cette enquête a été réalisée après le suivi des cas de non-réponse au recensement et fournit les renseignements utilisés lors du recensement pour tenir compte des personnes vivant dans les logements non répondants et des logements occupés classés à tort comme des logements inoccupés. Pour ce faire, on a imputé des personnes dans la base de données du recensement au moyen de la procédure d'imputation de ménages entiers (IME). Puisque l'ECL est utilisée pour effectuer l'ajustement des chiffres du recensement avant publication, elle permet de réduire significativement les erreurs de couverture du recensement.

Documentation

Signaler un problème sur cette page

Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?

S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.

Avis de confidentialité

Date de modification :