Enquête nationale auprès des ménages (ENM)

Information détaillée pour 2011

Statut :

Inactive

Fréquence :

Une fois

Numéro d'enregistrement :

5178

L'Enquête nationale auprès des ménages est un complément à la collecte de données du recensement et est conçue pour fournir des renseignements sur les caractéristiques démographiques, sociales et économiques des Canadiens ainsi que de l'information au sujet des logements qu'ils occupent.

Date de la parution - 8 mai 2013 (premier d'une série de communiqués) Pour les variables et définitions, veuillez référer au « Documentation » ci-dessous.

Aperçu

À compter de 2011, les renseignements recueillis antérieurement dans le questionnaire complet du recensement à participation obligatoire sont recueillis par le biais de l'Enquête nationale auprès des ménages (ENM), enquête à participation volontaire. L'ENM fournit de l'information sur les caractéristiques démographiques, sociales et économiques des Canadiens ainsi qu'au sujet des logements qu'ils occupent.

L'information recueillie fournit des données pour appuyer les gouvernements fédéral, provinciaux, territoriaux et locaux dans la planification et la distribution des programmes.

Activité statistique

On utilise le terme « Programme du recensement » pour désigner, de façon générale, le Recensement de la population (numéro d'enregistrement 3901) et, le cas échéant, toute enquête qui s'y rattache effectuée au moment du recensement. Le Programme du Recensement de la population comprend deux parties : un questionnaire abrégé (recensement), comprenant un ensemble de questions de base, distribué à 100 % des ménages, ou un questionnaire détaillé (Enquête nationale auprès des ménages - numéro d'enregistrement 5178), distribué à un échantillon de 33 % des ménages.

Sujets

  • Éducation, formation et apprentissage
  • Familles, ménages et logement
  • Immigration et diversité ethnoculturelle
  • Langues
  • Peuples autochtones
  • Population et démographie
  • Revenu, pensions, dépenses et richesse
  • Société et communauté
  • Travail

Sources de données et méthodologie

Population cible

L'ENM vise l'ensemble de la population qui vit habituellement au Canada, tant dans les provinces que les territoires. Sont incluses les personnes qui vivent dans les réserves indiennes et autres établissements indiens, les résidents permanents, les résidents non permanents tels que les revendicateurs du statut de réfugié, les détenteurs d'un permis de travail ou d'un permis d'études ainsi que les membres de leur famille vivant avec eux.

Les résidents étrangers tels que les représentants du gouvernement d'un autre pays affectés à une ambassade, un haut-commissariat ou un autre corps diplomatique au Canada, les membres des forces armées d'un autre pays basés au Canada ou les résidents d'un autre pays visitant temporairement le Canada ne sont pas dénombrés dans l'ENM.

L'enquête exclut également les personnes vivant dans les logements collectifs institutionnels tels que les hôpitaux, les établissements de soins infirmiers ou les établissements pénitentiaires; les citoyens canadiens vivant à l'étranger et les membres à temps plein des Forces armées canadiennes qui sont en poste à l'extérieur du Canada. Enfin, l'enquête exclut les personnes vivant dans les logements collectifs non institutionnels tels que les camps de travail, les hôtels et motels, les résidences pour étudiants.

Élaboration de l'instrument

Les questions de l'ENM ont été mises à l'essai au cours des processus de consultation et d'essai pour le Recensement de 2011. Ces processus ont permis à Statistique Canada de connaître les exigences des utilisateurs en matière de données et d'évaluer les questions. Les questions ont été testées auprès de groupes de discussions et au moyen d'entretiens individuels (tests qualitatifs) afin de s'assurer que les questions étaient bien comprises. La nature volontaire du contenu et la méthode de collecte de l'ENM n'ont pas été testées.

Deux types de questionnaires ont été développés pour l'ENM : un questionnaire pour le mode de collecte autoadministrée et un questionnaire pour la collecte dans les réserves indiennes et les régions éloignées où 100 % des ménages étaient appelés à répondre par le biais d'une entrevue avec un agent recenseur de Statistique Canada. Les questions de l'enquête concernaient la situation de chaque personne le 10 mai 2011 (le même jour de référence que le recensement) sous réserve d'inscription contraire dans le questionnaire.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

Un échantillon aléatoire de 4,5 millions de logements a été sélectionné pour participer à l'ENM. Cela représente environ un peu moins du tiers de tous les logements privés au Canada en 2011, soit 30 %. La taille de l'échantillon a été déterminée pour assurer une probabilité de diffusion uniforme pour les petites régions et pour les petites populations, tout en respectant le budget et les ressources disponibles. L'échantillon de l'ENM a été sélectionné à partir de la liste des logements du Recensement de la population 2011.

La fraction de sondage varie selon le mode de livraison du questionnaire. Pour le mode de livraison par la poste, approximativement 3 ménages sur 10 (soit 29 %) ont reçu un questionnaire. Pour le mode de livraison par un agent recenseur, la fraction de sondage est de 1 ménage sur 3 (soit 33 %); par contre, dans le cas où il a été nécessaire de joindre les ménages vivant en régions éloignées ou les ménages vivant dans les réserves indiennes, où seulement le mode de réponse par entrevue était offert, tous les ménages ont été invités à participer à l'ENM.

Sources des données

Collecte des données pour cette période de référence : 2011-05-10 à 2011-08-24

Il s'agit d'une enquête à participation volontaire.

Les données sont obtenues directement auprès des répondants.

Il y avait deux méthodes de collecte de base : un questionnaire papier et la collecte en ligne, cependant, dans quelques cas, le questionnaire pourrait avoir été rempli par l'agent recenseur par le biais d'une interview personnelle.

La collecte des données de l'ENM s'est étendue de mai à août 2011. Elle s'est déroulée principalement en trois vagues successives :

La vague 1, de mai à juin, priorise la collecte en ligne.

La vague 2, de juin à la mi-juillet, assure l'envoi des questionnaires en format version imprimée pour les ménages non répondants à la vague 1.

La vague 3, de la mi-juillet à la mi-août, assure le suivi de la non-réponse auprès des ménages non répondants des vagues 1 et 2 et vise à maximiser le taux de réponse à l'enquête.

L'opération de suivi de la non-réponse a débuté au mois de juin 2011. Lors de ce processus, les agents recenseurs ont communiqué avec les ménages non répondants sélectionnés, en personne ou par téléphone, afin d'obtenir leurs réponses au questionnaire. Par la suite, à la mi-juillet 2011, un sous-échantillon de 400 000 logements parmi les 1,2 million qui n'avaient pas encore répondu à l'ENM a été sélectionné dans le cadre du suivi de la non-réponse.

Le sous-échantillon de 400 000 logements a été réparti géographiquement en fonction du niveau de non-réponse observé et du degré d'hétérogénéité de la population. L'hétérogénéité reflète la diversité de la population pour une région géographique donnée. L'hétérogénéité a été déterminée à partir des données du questionnaire complet du Recensement de 2006 et a été calculée pour des régions géographiques de taille similaire aux aires de diffusion du recensement (une aire de diffusion compte environ 400 logements). Il existait donc une corrélation entre la taille du sous-échantillon et l'hétérogénéité : plus la population était hétérogène, plus la taille du sous-échantillon était grande, et ce, tout en respectant une taille minimale par région géographique. Le sous-échantillon a été mis en place pour minimiser le biais de non-réponse potentiellement présent lorsque les non-répondants sont différents des répondants.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

Le Centre des opérations des données de Statistique Canada (COD) était le point central de réception et d'enregistrement des questionnaires électroniques et version imprimée. Les questionnaires électroniques ont été transmis directement aux serveurs du COD alors que les questionnaires version imprimée ont été numérisés au moyen de l'imagerie. Une fois la qualité de l'image confirmée, les données ont été saisies grâce aux méthodes de reconnaissance optique des marques (ROM) et de reconnaissance intelligente des caractères (RIC). Si la qualité de l'image n'était pas suffisante, les données étaient saisies de façon manuelle par un opérateur.

Le codage, étape subséquente du traitement des données, a également eu lieu au Centre des opérations des données. Ainsi, toutes les réponses écrites en toutes lettres ont été soumises à un système de codage automatisé qui associait à chacune des réponses un code numérique, au moyen de fichiers de référence, d'ensembles de codes et de classifications types de Statistique Canada. Lorsque le système ne pouvait assigner un code de façon automatisé pour une réponse donnée, celle-ci était codée de façon manuelle par un opérateur. Le codage a été appliqué aux variables suivantes : lien avec la Personne 1, lieu de naissance, citoyenneté, langues non officielles, langue parlée à la maison, langue maternelle, origine ethnique, groupe de population, bande indienne/Première Nation, lieu de résidence 1 an auparavant, lieu de résidence 5 ans auparavant, lieu de naissance des parents, principal domaine d'études, lieu des études, langue de travail, industrie, profession et lieu de travail.

Une fois la saisie, le contrôle initial et les opérations de codage terminés, les données ont été traitées jusqu'à l'étape du contrôle final et de l'imputation. Le contrôle final détecte les réponses invalides et les incohérences. Ce contrôle est basé sur des règles déterminées par les analystes des domaines spécialisés de Statistique Canada. Les questions non répondues sont également identifiées. L'imputation remplace ces éléments manquants, invalides ou non cohérents par des valeurs plausibles. Lorsqu'elle est effectuée judicieusement, l'imputation peut améliorer la qualité des données en remplaçant les non-réponses par des réponses plausibles et similaires à celles que l'on aurait obtenues si les répondants avaient répondu à ces questions. Elle offre également l'avantage de produire un ensemble complet de données.

Imputation

L'imputation de l'ENM a été réalisée selon la méthode du plus proche voisin. Cette méthode est très répandue pour le traitement des non-réponses. Elle vise à remplacer l'information manquante, invalide ou incohérente relativement à un répondant par les valeurs fournies par un autre répondant qui lui est « similaire ». Les règles d'identification du répondant le plus similaire au non-répondant peuvent varier en fonction des variables à imputer. Les méthodes d'imputation des données par donneur ont des propriétés intéressantes et, de façon générale, ne nuisent pas à la distribution des données, comme le font de nombreuses autres techniques d'imputation. Après avoir procédé à l'imputation par la méthode du plus proche voisin, on s'assure de la cohérence des données.

Estimation

Les réponses finales sont pondérées afin que les données tirées de l'échantillon permettent de représenter la population canadienne cible de l'ENM. La pondération est le processus regroupant le calcul des poids de sondage, l'ajustement des poids pour corriger la non-réponse totale à l'enquête et le calage des poids à des totaux du recensement.

En premier lieu, un poids de sondage initial d'environ 3 est attribué à chaque ménage échantillonné. Le poids initial de 3 est l'inverse de la probabilité de sélection dans l'échantillon de l'ENM. Environ 3 ménages sur 10 ont été sélectionnés dans l'échantillon d'où un poids initial d'un peu plus de 3 (10/3). Ensuite, les poids de sondage sont ajustés pour tenir compte de la sélection du sous-échantillon. Ce dernier a été tiré parmi les ménages qui n'avaient pas répondu à l'ENM à la mi-juillet 2011. Il faut noter qu'à la fin de ces deux étapes de pondération, certains ménages ont un poids unitaire, car dans certaines régions tous les ménages sont choisis dans l'échantillon de l'ENM.

Par la suite, comme plusieurs ménages du sous-échantillon n'ont toujours pas répondu à la fin des activités de collecte, le poids de sondage est ajusté pour corriger la non-réponse résiduelle à l'enquête. Pour ce faire, le poids des ménages non répondants est transféré aux ménages répondants les plus proches voisins. Ceux-ci sont identifiés de façon similaire au processus d'imputation, à l'aide de variables connues pour les ménages non répondants et les ménages répondants telles que les variables du recensement et quelques variables résultant d'appariements à des bases de données administratives.

Finalement, un calage des poids à des totaux du recensement est fait à l'échelle de régions géographiques de calage. Celles-ci contiennent en moyenne environ 2 300 logements ou 5 600 personnes de la population cible de l'ENM. Elles sont formées en regroupant des aires de diffusion de manière à être contigües, à avoir un nombre de ménages répondants suffisant pour que le calage puisse être facilement effectué et à respecter les limites des divisions de recensement et, autant que possible, celles des sous-divisions de recensement et des secteurs de recensement. Le calage est fait afin que les estimations d'une région de calage de l'ENM soient approximativement égales aux chiffres du recensement pour cette région et cela, sur un ensemble d'une soixantaine de caractéristiques communes à l'ENM et au recensement. Les totaux de contrôle utilisés portent sur l'âge, le sexe, l'état matrimonial/union libre, la structure du logement, la taille du ménage, la structure familiale et les questions sur la langue. Ils incluent le nombre de ménages et de personnes de chaque aire de diffusion composant la région de calage. Il faut noter cependant que, pour une région donnée, plusieurs totaux de calage sont éliminés selon certains critères pour éviter de nuire à la qualité générale des estimations.

Évaluation de la qualité

La certification des estimations finales a été faite après la pondération. Elle consiste à s'assurer que les données sont cohérentes et fiables. À cette étape, les estimations finales sont entre autres comparées à différentes sources de données. Ces comparaisons permettent de déterminer si les estimations de l'ENM sont cohérentes et donc de bonne qualité. Parmi ces autres sources de données, on retrouve principalement les estimations d'autres enquêtes de Statistique Canada pour lesquelles des estimations pour des concepts communs sont disponibles (par exemple, l'Enquête sur la population active), les données des recensements précédents ainsi que les données de certains fichiers administratifs disponibles à Statistique Canada (par exemple, le fichier T1 sur le revenu des familles et la Base de données longitudinale sur l'immigration de Citoyenneté et Immigration Canada). Les projections de population, disponibles pour des sous-groupes de population (par exemple, les projections pour les peuples autochtones), qui s'appuient sur le Recensement de 2006 et sont produites à l'aide de micro-simulations, ont également été comparées aux estimations de l'ENM.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Cette méthodologie ne s'applique pas à cette enquête.

Exactitude des données

Dans une enquête par échantillon il y a deux types d'erreur : l'erreur due à l'échantillonnage et l'erreur non due à l'échantillonnage. La première est présente, car on estime une caractéristique en mesurant seulement une partie de la population au lieu de la population au complet. La seconde inclut toutes les erreurs qui ne sont pas liées à l'échantillonnage.

Erreur due à l'échantillonnage

L'ENM a pour objectif de produire des estimations pour une série de questions posées pour un large éventail de régions géographiques, allant des très grandes régions (comme les provinces et les régions métropolitaines de recensement) à de très petites régions (comme les quartiers et les municipalités), et pour divers groupes de population comme les peuples autochtones et les immigrants. Ces groupes ont également des tailles variables, notamment lorsque recoupés par région géographique. Ces regroupements sont généralement appelés « domaines d'intérêt ».

Quel que soit le domaine d'intérêt, en supposant un échantillonnage aléatoire, l'erreur d'échantillonnage dépend de plusieurs paramètres : la taille de la population, le nombre de répondants à l'enquête, la variabilité des variables mesurées, la stratification, l'échantillonnage par grappes.

Compte tenu du taux d'échantillonnage d'environ 3 sur 10 et du taux de réponse de 68,6 %, on estime qu'environ 21 % de la population canadienne a participé à l'ENM. Néanmoins, la qualité des estimations dans l'ensemble des domaines pourrait présenter une grande variabilité due, entre autres, à la variabilité dans les taux de réponse d'un domaine à l'autre.

Erreur non due à l'échantillonnage

Hormis l'échantillonnage, plusieurs facteurs peuvent introduire des erreurs dans les résultats de l'enquête. Les répondants peuvent ne pas comprendre les questions et y répondre de façon erronée; des réponses peuvent être entrées de façon incorrecte lors de la saisie et du traitement des données. Ce sont quelques exemples d'erreurs non dues à l'échantillonnage dont on a tenu compte de façon rigoureuse à chaque étape de la collecte et du traitement de façon à en réduire l'impact.

De plus, dans le cadre de toute enquête volontaire autoadministrée, l'erreur due à la non-réponse sur les variables de l'enquête représente une portion importante de l'erreur non due à l'échantillonnage. On distingue la non-réponse partielle (absence de réponse à une ou quelques questions) et la non-réponse totale (absence de réponse à l'enquête parce que le ménage n'a pu être joint ou qu'il a refusé de participer). La non-réponse totale est susceptible de biaiser les estimations tirées de l'enquête, car les non-répondants ont tendance à avoir des caractéristiques qui sont différentes de celles des répondants. Il existe donc un risque que les résultats ne soient pas représentatifs de la population réelle.

Avec un taux de réponse à l'ENM de 68,6 %, ce risque est envisagé. Statistique Canada a réalisé plusieurs études, ainsi que diverses simulations, avant et après la collecte, afin d'évaluer le risque de biais potentiel et son ampleur. Plusieurs mesures ont été prises pour en atténuer les effets.

Documentation

Date de modification :