Enquête canadienne sur le revenu (ECR)

Information détaillée pour 2015

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

5200

L'Enquête canadienne sur le revenu (ECR) est une enquête transversale ayant pour but de dresser un portrait du revenu et des sources de revenu des Canadiens, selon leurs caractéristiques personnelles et celles de leur ménage.

Date de la parution - 26 mai 2017

Aperçu

Le principal objectif de l'Enquête canadienne sur le revenu (ECR) est de fournir des renseignements sur le revenu et les sources de revenu des Canadiens, de même que sur leurs caractéristiques personnelles et celles de leur ménage. Les données recueillies dans le cadre de l'ECR sont jumelées avec les données de l'Enquête sur la population active (EPA, numéro d'enregistrement 3701) ainsi qu'avec des données fiscales.

Dans le cadre de l'enquête, on recueille de l'information sur l'activité sur le marché du travail, la fréquentation scolaire, l'incapacité, les paiements de pension alimentaire, les frais de garde d'enfants, les transferts entre ménages, le revenu personnel et les caractéristiques et les coûts du logement. À ce contenu s'ajoutent des renseignements tirés de l'EPA sur les caractéristiques personnelles et familiales (p. ex., âge, niveau de scolarité, caractéristiques de l'emploi principal, type de famille) et certains détails géographiques (p. ex., province, régions métropolitaines de recensement (RMR)). Des données fiscales sur le revenu et les sources de revenu sont également combinées aux données d'enquête.

Les résultats de l'ECR sont mis à la disposition non seulement de divers ordres de gouvernement, mais aussi de particuliers et d'organisations. Tous les ordres de gouvernement peuvent utiliser les données de l'ECR pour élaborer des politiques et des programmes afférents au bien-être économique des Canadiens. Des organismes statistiques, notamment l'Organisation de coopération et de développement économiques (OCDE) utilisent les résultats pour réaliser des études de référence et de comparaison internationales.

Période de référence : Année civile

Période de collecte : Janvier à avril de l'année suivant l'année de référence.

Sujets

  • Faible revenu et inégalité
  • Familles, ménages et logement
  • Revenu du ménage, revenu familial et personnel
  • Revenu, pensions, dépenses et richesse
  • Travail

Sources de données et méthodologie

Population cible

Toutes les personnes au Canada, à l'exclusion des résidents du Yukon, des Territoires du Nord-Ouest et du Nunavut, des pensionnaires d'un établissement institutionnel, des personnes qui vivent dans les réserves et dans d'autres établissements autochtones des provinces et des membres des Forces canadiennes qui vivent dans des camps militaires. Dans l'ensemble, ces exclusions représentent moins de 3% de la population.

Élaboration de l'instrument

Le Centre de ressources en conception de questionnaires (CRCQ) de Statistique Canada a procédé à des essais qualitatifs de certains modules du questionnaire de l'enquête, alors que les questions des autres modules ont été tirées d'autres enquêtes de Statistique Canada. La formulation des questions respecte le plus possible celle des questions établies par le Comité du contenu harmonisé de Statistique Canada.

Le questionnaire suit les pratiques et le texte normalisés utilisés dans un environnement d'interview assisté par ordinateur, tel que le contrôle automatisé des enchaînements de questions en fonction des réponses données à des questions antérieures ainsi que l'utilisation d'un ensemble de contrôles permettant de détecter les incohérences logiques et les erreurs de saisie. L'application informatique de collecte de données a été soumise à des essais rigoureux.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

Le questionnaire de l'Enquête canadienne sur le revenu a été administré à un sous-échantillon de répondants à l'EPA. L'échantillon de l'EPA est prélevé à partir d'une base aréolaire et se fonde sur un plan stratifié à plusieurs degrés s'appuyant sur un échantillonnage probabiliste. L'échantillon total est composé de six échantillons indépendants, appelés groupes de renouvellement puisqu'un sixième de l'échantillon (soit un groupe de renouvellement) est remplacé tous les mois.

L'ECR de 2015 a utilisé quatre groupes de renouvellement de l'EPA, soit le groupe de renouvellement qui a répondu à l'EPA pour la dernière fois en janvier, février, mars et avril 2016. La taille de l'échantillon de l'ECR est d'environ 9000 ménages par groupe de renouvellement.

Sources des données

Collecte des données pour cette période de référence : 2016-01-17 à 2016-05-02

Il s'agit d'une enquête à participation volontaire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

Les interviews de l'ECR sont réalisées par téléphone par des intervieweurs travaillant dans un bureau régional ou par visite personnelle d'un intervieweur. De plus, les répondants qui remplissent certains critères ont l'option de compléter l'enquête par internet.

Pour un logement donné, l'intervieweur obtient habituellement les renseignements relatifs à tous les membres du ménage auprès d'un membre bien informé du ménage. Appelée réponse « par procuration », cette façon de procéder est appliquée parce qu'il serait trop coûteux et fastidieux de faire plusieurs visites ou appels pour obtenir l'information directement auprès de chaque personne du ménage.

Les données sur le revenu des particuliers de l'Agence du revenu du Canada (ARC) sont utilisées pour l'information sur le revenu et les sources de revenu.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

Le questionnaire de l'Interview assistée par ordinateur (IAO) comporte de nombreuses caractéristiques permettant de maximiser la qualité des données recueillies. Plusieurs contrôles sont intégrés au questionnaire IAO afin de comparer les données inscrites à des valeurs inhabituelles et de détecter des incohérences logiques. Lorsqu'une réponse est rejetée à la vérification, l'intervieweur est invité à corriger l'information (avec l'aide du répondant au besoin). L'intervieweur a la possibilité d'outrepasser la plupart des rejets à la vérification lorsqu'il n'est pas possible de résoudre l'incohérence apparente.

Une fois que les données sont transmises au bureau central, on entreprend une série complète d'étapes de traitement pour effectuer une vérification approfondie de chacun des enregistrements reçus. Cette vérification comprend l'examen des notes inscrites par l'intervieweur. L'étape de la vérification consiste à relever les données incohérentes et à apporter les corrections nécessaires. Dans la mesure où la valeur réelle de chaque inscription sur le questionnaire n'est pas connue, la seule façon de discerner les erreurs consiste à chercher les incohérences évidentes.

Imputation

Les ménages sont considérés répondants si des renseignements ont été fournis pour au moins une personne dans le ménage et les données manquantes des variables clés pour les personnes à l'intérieur des ménages répondants sont imputées. On effectue l'imputation pour les variables de revenu de même que pour les variables liées au travail, à la fréquentation scolaire, au logement et aux coûts des services.

L'ECR utilise la méthode d'imputation par voisin le plus proche pour la majorité des variables sur le revenu ainsi que pour les variables liées au travail, à la fréquentation scolaire et au logement. En premier lieu, un ensemble de variables d'appariement, corrélées avec la ou les variables à imputer, est déterminé. Ensuite, grâce à l'utilisation combinée d'une fonction de caractérisation (pour les variables d'appariement catégoriques) et d'une fonction de distance (pour les variables d'appariement numériques), l'enregistrement donneur le plus proche est identifié et utilisé pour imputer les données manquantes.

L'imputation déductive est aussi utilisée pour certaines variables de revenu. Les montants associés à certains programmes gouvernementaux, comme les crédits d'impôt provinciaux remboursables, les prestations fiscales pour enfants et le crédit pour la taxe sur les produits et services/taxe de vente harmonisée, sont dérivés en fonction des critères d'admissibilité.

Enfin, la méthode d'imputation Cold-deck à l'aide de donneurs de l'Enquête nationale auprès des ménages (ENM) de 2011 est utilisée pour les variables liées aux coûts des services. La méthode consiste d'abord à identifier des variables liées à celles qui ont besoin d'imputation pour établir des classes d'imputation. Ensuite, les donneurs de l'ENM sont choisis aléatoirement dans la classe d'imputation et utilisés pour imputer les données manquantes de l'ECR.

Estimation

L'échantillon de l'ECR est un sous-échantillon de l'Enquête sur la population active. L'EPA s'appuie sur un plan de sondage aléatoire complexe pour sélectionner ses ménages. Chaque ménage de l'échantillon représente un certain nombre d'autres ménages dans la population. On obtient les estimations pour une caractéristique donnée en multipliant le poids d'enquête par la valeur correspondante de cette caractéristique. L'étape clé du processus d'estimation ponctuelle est donc le calcul des poids.

Les poids initiaux sont les sous-poids de l'EPA, qui sont ensuite rajustés pour tenir compte du fait que l'ECR est un sous-échantillon de l'EPA.

Deux types de correction s'appliquent alors à ces poids afin d'améliorer la fiabilité des estimations. Les poids sont d'abord augmentés pour tenir compte de la non-réponse à l'ECR. Puis, ces poids rajustés pour la non-réponse sont à nouveau rajustés pour que les estimations sur des caractéristiques démographiques pertinentes soient conformes aux agrégats provenant de sources autres que l'enquête.

Le premier ensemble de totaux utilisés par l'ECR est basé sur différents comptes de population estimés par la Division de la démographie de Statistique Canada à partir du Recensement de la population de 2011. Pour chaque province, les comptes de population selon l'âge et le sexe, la taille du ménage et la taille de la famille économique sont utilisés. L'ECR utilise aussi les comptes de population de six régions métropolitaines de recensement (Montréal, Toronto, Winnipeg, Calgary, Edmonton et Vancouver).

Le deuxième ensemble de totaux provient de l'information des relevés T4 de l'Agence du revenu du Canada (ARC); il permet de s'assurer que la distribution pondérée du revenu (sur la base des salaires et traitements) dans l'ensemble de données correspond à celle de la population canadienne.

Afin d'estimer la variance d'échantillonnage, la méthode des poids bootstrap est utilisée. Un ensemble de 1 000 poids bootstrap a été produit.

Un autre ensemble de poids est créé spécialement pour les estimations sur l'incapacité. Les poids initiaux utilisés sont les poids corrigés pour la non-réponse de l'ECR. Ces poids sont d'abords augmentés pour tenir compte du fait qu'une seule personne âgée de 16 ans et plus dans le ménage est sélectionnée pour répondre aux questions sur l'incapacité. Ces poids sont de plus augmentés pour tenir compte de la non-réponse à ces questions. Enfin, ces poids sont à nouveau rajustés pour que les estimations sur les caractéristiques démographiques soient conformes aux agrégats provenant des comptes de population selon l'âge, le sexe et la répartition du revenu pour chaque province.

Un ensemble de 1 000 poids bootstrap a également été produit pour estimer la variance d'échantillonnage associée à l'incapacité.

Évaluation de la qualité

Les résultats de l'enquête sont comparés à d'autres sources de données, notamment des bases de données administratives et d'autres enquêtes de Statistique Canada.

Contrôle de la divulgation

Tableaux de l'ECR:
Les estimations fondées sur moins de 25 observations ou dont le coefficient de variation est supérieur 33,3 % sont supprimées. Les estimations de population sont arrondies au millier près et les estimations de revenu sont arrondies à la centaine près.

Fichier de microdonnées à grande diffusion (FMGD) de l'ECR :
Dans le cadre de l'ECR, on utilise un certain nombre de techniques pour assurer la confidentialité :
- La réduction des données implique de limiter la quantité d'information pouvant permettre d'identifier quelqu'un sur le FMGD. Les techniques comprennent la suppression des variables permettant l'identification directe des personnes, le sous-échantillonnage, la réduction du niveau de détail, le regroupement des catégories et la suppression de certaines valeurs pour des enregistrements spécifiques.
- La perturbation des données consiste à appliquer des mesures protectrices afin d'empêcher les tentatives d'identification. L'addition de « bruit » et la permutation des données sont des exemples de techniques souvent utilisées.
- Les valeurs positives ou négatives très élevées sont généralement rares ou uniques au sein d'une population. De telles valeurs extrêmes sont souvent remplacées par une valeur moins élevée (ou moins faible) tout en préservant l'intégrité des données afin de permettre la production de statistiques exactes et précises.
- Toutes les valeurs de revenu sont arrondies.

Révisions et désaisonnalisation

Les données de l'ECR sont révisées tous les cinq ans à la suite de la diffusion des nouvelles estimations démographiques basées sur le dernier recensement. À ce moment-là, toutes les données de l'ECR remontant au recensement précédent sont repondérées en fonction des nouvelles estimations de la population (compte tenu que ces nouvelles estimations démographiques couvrent la période intercensitaire séparant les deux derniers recensements), et toutes les estimations chronologiques correspondantes de l'ECR sont révisées. La dernière révision a été effectuée lors de la diffusion des données de 2014.

Exactitude des données

Erreur non due à l'échantillonnage
Les erreurs non dues à l'échantillonnage découlant d'erreurs humaines comme de simples erreurs, des malentendus ou des interprétations erronées auront en général très peu d'effet sur l'exactitude globale des estimations. En revanche, les erreurs systématiques et les erreurs provenant de diverses sources telles que les erreurs de couverture, de réponse, de non-réponse et de traitement peuvent influer considérablement sur la fiabilité des estimations. Dans le cadre de l'ECR, on consacre beaucoup de temps et d'efforts à la réduction des erreurs non dues à l'échantillonnage.

Il y a erreur de couverture quand les unités de la base de sondage ne représentent pas exactement la population cible. On peut avoir omis des unités de la base de sondage (sous-dénombrement), inclus des unités qui n'appartiennent pas à la population cible (sur-dénombrement) ou inclus les mêmes unités plus d'une fois (unités en double). Le problème le plus commun est celui du sous-dénombrement. Le taux de glissement constitue une mesure de l'erreur de couverture de l'enquête. On le définit comme étant la différence en pourcentage entre les totaux de contrôle (estimations postcensitaires de la population) et les comptes pondérés de l'échantillon. En 2015, le taux de glissement de l'ECR (à l'échelle de la personne) était de 9,6%.

Date de modification :