Enquête canadienne sur le revenu - 2021 (ECR)

Information détaillée pour 2021

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

5200

L'Enquête canadienne sur le revenu (ECR) est une enquête transversale ayant pour but de dresser un portrait du revenu et des sources de revenu des Canadiens, selon leurs caractéristiques personnelles et celles de leur ménage.

Date de la parution - 2 mai 2023

Questionnaire(s) et guide(s) de déclaration
Aperçu
Sources de données et méthodologie
Exactitude des données

Aperçu

Le principal objectif de l'Enquête canadienne sur le revenu (ECR) est de fournir des renseignements sur le revenu et les sources de revenu des Canadiens, de même que sur leurs caractéristiques personnelles et celles de leur ménage. Les données recueillies dans le cadre de l'ECR sont jumelées avec les données de l'Enquête sur la population active (EPA, numéro d'enregistrement 3701) ainsi qu'avec des données fiscales.

Dans le cadre de l'enquête, on recueille de l'information sur l'activité sur le marché du travail, la fréquentation scolaire, l'incapacité, les besoins de santé non satisfaits, les paiements de pension alimentaire, les frais de garde d'enfants, les transferts entre ménages, le revenu personnel, la sécurité alimentaire et les caractéristiques et les coûts du logement. À ce contenu s'ajoutent des renseignements tirés de l'EPA sur les caractéristiques personnelles et familiales (p. ex., âge, niveau de scolarité, caractéristiques de l'emploi principal, type de famille) et certains détails géographiques (p. ex., province/territoire, régions métropolitaines de recensement (RMR)). Des données fiscales sur le revenu et les sources de revenu sont également combinées aux données d'enquête.

Les résultats de l'ECR sont mis à la disposition non seulement de divers ordres de gouvernement, mais aussi de particuliers et d'organisations. Tous les ordres de gouvernement peuvent utiliser les données de l'ECR pour élaborer des politiques et des programmes afférents au bien-être économique des Canadiens. Des organismes statistiques, notamment l'Organisation de coopération et de développement économiques (OCDE) utilisent les résultats pour réaliser des études de référence et de comparaison internationales.

Période de référence : Année civile

Période de collecte : Janvier à juin de l'année suivant l'année de référence.

Sujets

Faible revenu et inégalité
Familles, ménages et logement
Revenu du ménage, revenu familial et personnel
Revenu, pensions, dépenses et richesse
Travail

Sources de données et méthodologie

Population cible

L'enquête est menée dans l'ensemble du pays, tant dans les provinces que dans les territoires. Sont exclus du champ de l'enquête les personnes qui vivent dans les réserves et dans d'autres peuplements autochtones des provinces, les pensionnaires d'établissements institutionnels et les ménages situés dans des régions extrêmement éloignées où la densité de population est très faible. Dans l'ensemble, ces exclusions représentent moins de 2 % de la population.

Élaboration de l'instrument

Le Centre de ressources en conception de questionnaires (CRCQ) de Statistique Canada a procédé à des essais qualitatifs de certains modules du questionnaire de l'enquête, alors que les questions des autres modules ont été tirées d'autres enquêtes de Statistique Canada. La formulation des questions respecte le plus possible celle des questions établies par le Comité du contenu harmonisé de Statistique Canada.

Le questionnaire suit les pratiques et le texte normalisés utilisés dans un environnement d'interview assistée par ordinateur, tel que le contrôle automatisé des enchaînements de questions en fonction des réponses données à des questions antérieures ainsi que l'utilisation d'un ensemble de contrôles permettant de détecter les incohérences logiques et les erreurs de saisie. L'application informatique de collecte de données a été soumise à des essais rigoureux.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

Le questionnaire de l'Enquête canadienne sur le revenu est administré à un sous-échantillon de répondants à l'EPA. L'échantillon de l'EPA est prélevé à partir d'une base aréolaire et se fonde sur un plan stratifié à plusieurs degrés s'appuyant sur un échantillonnage probabiliste.

L'EPA utilise un plan de sondage avec renouvellement de panel. Dans les provinces, les logements sélectionnés restent dans l'échantillon de l'EPA pendant six mois consécutifs. Chaque mois, environ le sixième des logements sélectionnés dans le cadre de l'EPA en sont à leur premier mois d'enquête, le sixième des logements en sont à leur deuxième mois d'enquête et ainsi de suite. Ces six échantillons indépendants sont appelés groupes de renouvellement. Dans les territoires, l'échantillon est composé de huit groupes de renouvellement. Les logements sélectionnés sont interviewés chaque trimestre et ils demeurent dans l'échantillon de l'EPA pendant deux ans.

Pour l'ECR de 2021, six groupes de renouvellement de l'EPA ont été utilisés pour les provinces : les groupes qui ont répondu à l'EPA pour la dernière fois de janvier à juin 2022. Pour les territoires, des logements de chacun des groupes de renouvellement ont fait partie de l'ECR. La taille de l'échantillon de l'ECR était d'environ 55 000 ménages.

Sources des données

Collecte des données pour cette période de référence : 2022-01-16 à 2022-07-05

Il s'agit d'une enquête à participation volontaire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

Les interviews de l'ECR sont réalisées par téléphone par des intervieweurs travaillant dans un bureau régional ou par visite personnelle d'un intervieweur. De plus, les répondants qui remplissent certains critères ont l'option de compléter l'enquête par internet.

Pour un logement donné, l'intervieweur obtient habituellement les renseignements relatifs à tous les membres du ménage auprès d'un membre bien informé du ménage. Appelée réponse « par procuration », cette façon de procéder est appliquée parce qu'il serait trop coûteux et fastidieux de faire plusieurs visites ou appels pour obtenir l'information directement auprès de chaque personne du ménage.

Les données sur le revenu des particuliers de l'Agence du revenu du Canada (ARC) sont utilisées pour l'information sur le revenu et les sources de revenu.

L'Enquête canadienne sur le revenu a apporté des améliorations aux méthodes et aux systèmes utilisés pour produire les estimations sur le revenu. À partir de l'année de référence 2021, les données sur le revenu de l'ECR ont été produites à partir du Fichier administratif principal du revenu personnel, une source complète de données sur le revenu personnel provenant non seulement des déclarations de revenus T1, mais également des différents feuillets d'impôt associés. Les estimations pour les années de référence précédentes ont été produites uniquement à partir des déclarations de revenus T1. D'autres changements au traitement du revenu ont été effectués en même temps, et les estimations de 2021 comprennent des mises à jour de la méthodologie de pondération. Ces changements apportés à la source des données, au système de traitement et à la pondération améliorent la qualité des données, tout en ayant une incidence minime sur les estimations et les tendances clés de l'ECR.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

Le questionnaire de l'Interview assistée par ordinateur (IAO) comporte de nombreuses caractéristiques permettant de maximiser la qualité des données recueillies. Plusieurs contrôles sont intégrés au questionnaire IAO afin de comparer les données inscrites à des valeurs inhabituelles et de détecter des incohérences logiques. Lorsqu'une réponse est rejetée à la vérification, l'intervieweur est invité à corriger l'information (avec l'aide du répondant au besoin). L'intervieweur a la possibilité d'outrepasser la plupart des rejets à la vérification lorsqu'il n'est pas possible de résoudre l'incohérence apparente.

Une fois que les données sont transmises au bureau central, on entreprend une série complète d'étapes de traitement pour effectuer une vérification approfondie de chacun des enregistrements reçus. Cette vérification comprend l'examen des notes inscrites par l'intervieweur. L'étape de la vérification consiste à relever les données incohérentes et à apporter les corrections nécessaires. Dans la mesure où la valeur réelle de chaque inscription sur le questionnaire n'est pas connue, la seule façon de discerner les erreurs consiste à chercher les incohérences évidentes.

Imputation

Les ménages sont considérés répondants si des renseignements ont été fournis pour au moins une personne dans le ménage et les données manquantes des variables clés pour les personnes à l'intérieur des ménages répondants sont imputées. On effectue l'imputation pour les variables de revenu de même que pour les variables liées au travail, à la fréquentation scolaire, à la sécurité alimentaire, au logement et aux coûts des services.

L'ECR utilise la méthode d'imputation par voisin le plus proche pour la majorité des variables sur le revenu ainsi que pour les variables liées au travail, à la fréquentation scolaire, à la sécurité alimentaire et au logement. En premier lieu, un ensemble de variables d'appariement, corrélées avec la ou les variables à imputer, est déterminé. Ensuite, grâce à l'utilisation combinée d'une fonction de caractérisation (pour les variables d'appariement catégoriques) et d'une fonction de distance (pour les variables d'appariement numériques), l'enregistrement donneur le plus proche est identifié et utilisé pour imputer les données manquantes.

Enfin, la méthode d'imputation Cold-deck à l'aide de donneurs du Recensement de 2021 est utilisée pour les variables liées aux coûts des services. La méthode consiste d'abord à identifier des variables liées à celles qui ont besoin d'imputation pour établir des classes d'imputation. Ensuite, les donneurs du Recensement sont choisis aléatoirement dans la classe d'imputation et utilisés pour imputer les données manquantes de l'ECR.

Estimation

L'échantillon de l'ECR est un sous-échantillon de l'Enquête sur la population active. L'EPA s'appuie sur un plan de sondage aléatoire complexe pour sélectionner ses ménages. Chaque ménage de l'échantillon représente un certain nombre d'autres ménages dans la population. On obtient les estimations pour une caractéristique donnée en multipliant le poids d'enquête par la valeur correspondante de cette caractéristique. L'étape clé du processus d'estimation ponctuelle est donc le calcul des poids.

Les poids initiaux sont les sous-poids de l'EPA, qui sont ensuite rajustés pour tenir compte du fait que l'ECR est un sous-échantillon de l'EPA.

Deux types de correction s'appliquent alors à ces poids afin d'améliorer la fiabilité des estimations. Les poids sont d'abord augmentés pour tenir compte de la non-réponse à l'ECR. Puis, ces poids rajustés pour la non-réponse sont à nouveau rajustés pour que les estimations sur des caractéristiques démographiques pertinentes soient conformes aux agrégats provenant de sources autres que l'enquête.

Le premier ensemble de totaux utilisés par l'ECR est basé sur différents comptes de population estimés par le Centre de démographie de Statistique Canada à partir du Recensement de 2016. Pour chaque province, les comptes de population selon l'âge et le sexe, la taille du ménage et la taille de la famille économique sont utilisés. L'ECR utilise aussi les comptes de population de six régions métropolitaines de recensement (Montréal, Toronto, Winnipeg, Calgary, Edmonton et Vancouver).

Le deuxième ensemble de totaux provient de l'information des relevés T4 de l'Agence du revenu du Canada (ARC); il permet de s'assurer que la distribution pondérée du revenu (sur la base des salaires et traitements) dans l'ensemble de données correspond à celle de la population canadienne.

Afin d'estimer la variance d'échantillonnage, la méthode des poids bootstrap est utilisée. Un ensemble de 1 000 poids bootstrap est produit.

Un autre ensemble de poids est créé spécialement pour les estimations sur l'incapacité et les besoins de santé non satisfaits. Les poids initiaux utilisés sont les poids corrigés pour la non-réponse de l'ECR. Ces poids sont d'abords augmentés pour tenir compte du fait qu'une seule personne âgée de 16 ans et plus dans le ménage est sélectionnée pour répondre aux questions sur l'incapacité et les besoins de santé non satisfaits. Ces poids sont de plus augmentés pour tenir compte de la non-réponse à ces questions. Enfin, ces poids sont à nouveau rajustés pour que les estimations sur les caractéristiques démographiques soient conformes aux agrégats provenant des comptes de population selon l'âge, le sexe et la répartition du revenu pour chaque province.

Un ensemble de 1 000 poids bootstrap est également produit pour estimer la variance d'échantillonnage associée à l'incapacité et aux besoins de santé non satisfaits.

Évaluation de la qualité

Les résultats de l'enquête sont comparés à d'autres sources de données, notamment des bases de données administratives et d'autres enquêtes de Statistique Canada.

Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler de l'information obtenue en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Tableaux de l'ECR:
Les estimations fondées sur moins de 25 observations ou dont le coefficient de variation est supérieur à 33,3 % sont supprimées. Les estimations de population sont arrondies au millier près et les estimations de revenu sont arrondies à la centaine près.

Fichier de microdonnées à grande diffusion (FMGD) de l'ECR :
Dans le cadre de l'ECR, on utilise un certain nombre de techniques pour assurer la confidentialité :
- La réduction des données implique de limiter la quantité d'information pouvant permettre d'identifier quelqu'un sur le FMGD. Les techniques comprennent la suppression des variables permettant l'identification directe des personnes, le sous-échantillonnage, la réduction du niveau de détail, le regroupement des catégories et la suppression de certaines valeurs pour des enregistrements spécifiques.
- La perturbation des données consiste à appliquer des mesures protectrices afin d'empêcher les tentatives d'identification. L'addition de « bruit » et la permutation des données sont des exemples de techniques souvent utilisées.
- Les valeurs positives ou négatives très élevées sont généralement rares ou uniques au sein d'une population. De telles valeurs extrêmes sont souvent remplacées par une valeur moins élevée (ou moins faible) tout en préservant l'intégrité des données afin de permettre la production de statistiques exactes et précises.
- Toutes les valeurs de revenu sont arrondies.

Révisions et désaisonnalisation

Les données de l'ECR sont révisées environ tous les cinq ans à la suite de la diffusion des nouvelles estimations démographiques basées sur le dernier recensement. À ce moment-là, toutes les données de l'ECR remontant au recensement précédent sont repondérées en fonction des nouvelles estimations de la population (compte tenu que ces nouvelles estimations démographiques couvrent la période intercensitaire séparant les deux derniers recensements), et toutes les estimations chronologiques correspondantes de l'ECR sont révisées. Les estimations de l'ECR de 2012 à 2019 ont été révisées pour rendre compte des estimations de population fondées sur le Recensement de 2016 lors de la diffusion des données de 2020.

Exactitude des données

Compte tenu que l'ECR est une enquête-échantillon, toutes les estimations sont sujettes à la fois aux erreurs d'échantillonnage et aux erreurs non dues à l'échantillonnage.

Les erreurs non liées à l'échantillonnage peuvent se produire à toutes les étapes de la collecte et du traitement des données d'enquête. Il peut s'agir d'erreurs de couverture, de non-réponse, de réponse, d'erreurs de l'intervieweur, d'erreurs de codage et d'autres types d'erreur de traitement.

Il y a erreur de couverture quand les unités de la base de sondage ne représentent pas exactement la population cible. On peut avoir omis des unités de la base de sondage (sous-dénombrement), inclus des unités qui n'appartiennent pas à la population cible (sur-dénombrement) ou inclus les mêmes unités plus d'une fois (unités en double).

Le problème le plus commun est celui du sous-dénombrement. Le taux de glissement constitue une mesure de l'erreur de couverture de l'enquête. On le définit comme étant la différence en pourcentage entre les totaux de contrôle (estimations postcensitaires de la population) et les comptes pondérés de l'échantillon. En 2021, le taux de glissement de l'ECR (à l'échelle de la personne) était de 9,8 %.

En 2021, le taux de réponse final de l'ECR était de 70,8 %.

On mesure l'erreur d'échantillonnage associée aux estimations de l'ECR au moyen de coefficients de variation.

Date de modification :: 2023-05-01

Sélection de la langue

Recherche et menus

Recherche