Estimations annuelles du revenu des familles de recensement et des particuliers (Fichier des familles T1)

Information détaillée pour 2010

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

4105

Cette activité est menée en vue de l'élaboration et de la diffusion de données économiques annuelles sur les petites régions pour les Canadiens.

Date de la parution - 27 juin 2012

Aperçu

Cette activité a pour objet l'élaboration et la diffusion de données socioéconomiques régionales annuelles au sujet des Canadiennes et des Canadiens ainsi que de leur famille. Ces données, provenant principalement des déclarations de revenu produites auprès de l'Agence du revenu du Canada (ARC), fournissent de l'information démographique et des renseignements sur le revenu relativement à des régions géographiques infraprovinciales. Elles sont utilisées par les administrations municipales ainsi que par les ministères et organismes fédéraux et provinciaux pour évaluer des programmes et étayer des recommandations stratégiques. Elles sont utiles également dans le monde des affaires et dans le secteur de l'éducation pour en savoir davantage sur les marchés ciblés. Elles sont utiles aux universitaires et aux chercheurs pour l'analyse des conditions socioéconomiques.

Période de référence : Année civile « y » pour le revenu et les contributions, fin de l'année civile « y » pour l'âge, moment (en général, en avril de l'année civile « y+1 ») pour les renseignements sur l'adresse.

Période de collecte : Les déclarations de revenus sont principalement remplies au printemps suivant l'année de référence. Les fichiers T1 pour l'année civile « y » sont reçus de l'Agence du revenu du Canada (ARC) en janvier de l'année « y+2 ».

Sujets

  • Dépenses et épargne des ménages
  • Imposition des particuliers et des ménages
  • Régimes et fonds de pension et autres programmes de revenu de retraite
  • Revenu du ménage, revenu familial et personnel
  • Revenu, pensions, dépenses et richesse

Sources de données et méthodologie

Population cible

Les données portent sur toutes les personnes ayant complété une déclaration de revenu T1 pour l'année de référence ou ayant reçu la Prestation fiscale canadienne pour enfants (PFCE), sur les conjoints faisant partie des non déclarants (y compris les renseignements sur les traitements et salaires figurant dans le fichier T4), sur les enfants non déclarants (données d'identification provenant de trois sources : fichier de la PFCE, fichier des naissances et fichier historique) et sur les enfants ayant produit une déclaration et indiqué l'adresse de leurs parents. L'élaboration des données régionales sur les familles repose sur le concept de la famille de recensement. Le concept de la famille de recensement regroupe les individus en famille de recensement (parent(s) et les enfants vivant à la même adresse) ou les identifie comme étant des personnes hors famille de recensement.

Élaboration de l'instrument

Cette méthodologie ne s'applique pas.

Échantillonnage

Cette méthodologie ne s'applique pas.

Sources des données

Les données sont tirées de fichiers administratifs.

L'échantillon englobe 100 % des particuliers ayant rempli une déclaration de revenu (T1) ou ayant reçu la PFCE. À partir de cette information, on détermine les conjoints, les conjoints de fait et les enfants non déclarants. En bout de ligne, l'échantillon comprend environ 95 % de la population; il n'est ni pondéré, ni rajusté. Veuillez notez que les méthodes d'échantillonnage ne s'appliquent pas à cette enquête.

Les fichiers T1 et T4 ainsi que le fichier de la Prestation fiscale canadienne pour enfants (PFCE) sont transmis par l'Agence du revenu du Canada. Le traitement des fichiers, qui s'étend sur une période de quatre à cinq mois, aboutit à la création du Fichier sur la famille T1 (T1FF). Les enfants nés l'année précédente, dont il n'est pas fait état dans le fichier de la PFCE, sont pris en compte à partir d'un fichier des naissances. Les familles sont définies, et les conjoints et enfants absents sont imputés. Une fois achevé, le T1FF contient des données sur les déclarants et les personnes imputées (32,7 millions en 2010). Les déclarants décédés durant l'année ne sont pas inclus.

La période de revenu correspond à l'année civile. On calcule les composantes manquantes -- au titre du revenu pour l'ensemble du Canada, et au titre des impôts dans le cas de la province de Québec.

Détection des erreurs

Au cours du traitement, des vérifications manuelles et automatiques sont effectuées. Les variables ayant une valeur de 1 (ce qui constitue une catégorie d'indicateur à l'ARC) sont ramenées à zéro, et les variables dont la valeur est supérieure au maximum absolu sont automatiquement corrigées. Les variables qui présentent des valeurs aberrantes sont repérées puis examinées, et les erreurs décelées sont corrigées manuellement. Ainsi, dans le cas de l'année d'imposition 2010, il y a eu au total 7,1 % des enregistrements venant des déclarations de revenu dont la valeur d'au moins un des champs a été ramené de 1 à 0, soit 1 830 013 enregistrements; 0,38 % des enregistrements comptaient au moins une valeur négative qui a été changée pour une valeur positive. Il y a donc peu d'enregistrements modifiés, si l'on fait exception des « indicateurs » de 1 $ et de la correction du signe attribué à certaines valeurs.

Imputation

Parce que le fichier source contient des renseignements directs limités sur le nombre et les caractéristiques des personnes ne faisant pas de déclaration, il est nécessaire d'obtenir cette information. Le système familial crée des familles en mettant en relation des membres déclarants et évalue les membres non déclarants à partir de l'information contenue dans les déclarations des déclarants, se fondant sur le statut matrimonial, les déductions et l'information relative aux crédits d'impôt ou à partir d'un dossier historique des enfants. Par exemple, le système familial impute un conjoint non déclarant lorsqu'un déclarant s'est déclaré marié, mais qu'il n'a pas été relié à un conjoint déclarant. Les données sur les traitements et salaires des conjoints non déclarants sont tirées du fichier T4 lorsqu'elles sont disponibles.

Relativement à l'année d'imposition 2010, 25, 5 millions de particuliers ont produit une déclaration de revenu, et 7,2 millions de particuliers additionnels ont été identifiés à titre de non déclarants faisant partie de la famille d'un déclarant. Cela signifie que le quart environ des particuliers inclus dans le fichier étaient des non déclarants en 2010. Cette proportion diminue au fil du temps, étant donné que de plus en plus de particuliers produisent une déclaration, que ce soit aux fins de payer de l'impôt ou pour recevoir des paiements de transfert aux termes de programmes désormais gérés par l'Agence du revenu du Canada.

Entre 1982 et 1992, les renseignements sur les enfants étaient tirés directement du fichier d'impôt. À partir de 1993, une combinaison de fichiers a été utilisée pour déterminer les enfants non déclarants : le fichier de la Prestation fiscale canadienne pour enfants, les fichiers de naissances provinciaux et le fichier sur la famille (T1FF) de l'année précédente.

En 2010, environ 74 % des Canadiens ont produit une déclaration de revenu. Un T1FF rempli représente environ 95 %, la différence étant les non-déclarants identifiés à partir des renseignements des déclarants.

Estimation

La production des estimations comporte les principales étapes suivantes :
Vérification et imputation : s'il est déterminé qu'une valeur dépasse la valeur maximale de la fourchette applicable à sa catégorie, cette valeur sera ramenée à la valeur maximale. Cette méthode a été retenue parce que l'on a constaté que, parfois, des valeurs étaient exprimées en dollars et en cents alors qu'elles auraient dû l'être en dollars seulement. S'il est établi qu'une valeur aberrante est en fait une erreur, la correction manuelle peut être effectuée selon cette méthode ou toute autre méthode qui semblera raisonnable.

Géocodage : aux fins de géocodage, on utilise le Fichier de conversion des codes postaux (FCCP) de Statistique Canada pour convertir les codes postaux en régions géographiques normalisées (divisions de recensement, régions métropolitaines de recensement, agglomérations de recensement, secteurs de recensement).

Constitution des familles : aux fins de constitution des familles de recensement, on procède à un rapprochement portant sur le numéro d'assurance sociale, le nom de famille et le code postal, tout en tenant compte de l'âge, du sexe et de l'état civil. On fait l'hypothèse que les parents ont au moins quinze ans de plus que leurs enfants. Lorsqu'un conjoint est imputé, le sexe qui lui est attribué est l'opposé de celui du déclarant, et son âge lui est attribué selon une méthode probabiliste d'après la répartition par âge des époux et des épouses. On n'attribue pas de sexe aux enfants, et leur âge est généralement connu. Dans les quelques cas où l'âge des enfants n'est pas connu, un âge leur est attribué selon une méthode probabiliste en fonction de l'âge de la mère.

Revenu et impôt, estimation de valeurs manquantes : il existe certaines sources de revenu non imposables qui ne sont pas comprises dans les déclarations de revenu. Le revenu en question est calculé à partir des renseignements contenus dans les déclarations de revenu. Les données sur la Prestation fiscale canadienne pour enfants reçue proviennent directement du fichier de la PFCE. Les crédits d'impôt provinciaux remboursables et les prestations provinciales versées dans le cadre du programme de la Prestation nationale pour enfants sont calculées à partir des renseignements relatifs à l'année en cours. Le crédit d'impôt pour la TPS/TVH est calculé dans le cas des personnes qui demandent ce crédit. Les impôts du Québec sont calculés à partir des données contenues dans la déclaration fédérale.

Agrégation : les données sont agrégées de manière à correspondre de façon approximative aux régions géographiques normalisées de Statistique Canada. Les régions métropolitaines de recensement (RMR) et les agglomérations de recensement (AR) sont des territoires formés d'une ou de plusieurs municipalités voisines les unes des autres qui sont situées autour d'un grand noyau urbain. Une RMR doit avoir une population d'au moins 100 000 habitants, et le noyau urbain doit compter au moins 50 000 habitants. Une AR doit avoir un noyau urbain d'au moins 10 000 habitants.

D'autres niveaux de géographie postale et du recensement sont également disponibles.

Lors de l'exécution des calculs, les règles fiscales de l'Agence du revenu du Canada (ARC) sont utilisées.

Étant donné que les données sont basées sur l'ensemble du fichier T1, et non simplement sur un échantillon, les données sont laissées non pondérées et non ajustées.

Évaluation de la qualité

Plusieurs méthodes sont utilisées pour évaluer les estimations :

1. On évalue les données géographiques en comparant le nombre de déclarants et les estimations démographiques pour une même région.
2. On évalue les données démographiques à peu près de la même façon, c'est à dire en faisant des comparaisons avec les estimations de Statistique Canada pour les mêmes régions.
3. Les données sur le revenu sont évaluées au moyen d'analyses tendancielles et de comparaisons avec les données de l'Enquête sur la dynamique du travail et du revenue (EDTR) lorsque la chose est possible.
4. De nombreuses comparaisons sont effectuées (population, revenu, données démographiques) lorsque l'on dispose de données de recensement.
5. En outre, dans le cas du revenu des particuliers, des comparaisons sont effectuées avec l'information de l'ARC intitulé Statistiques sur le revenu.

Le Fichier sur la famille T1 pour 2010 fait état de 32 700 430 particuliers résidant au Canada, ce qui représente 94,8 % de la population selon les estimations officielles de Statistique Canada. Le pourcentage de la population couverte dépasse 92 % de la population estimative dans l'ensemble des provinces et des territoires. Les lois provinciales touchant l'assujettissement du revenu à l'impôt de la province ou régissant les crédits d'impôt provinciaux peuvent avoir une incidence sur le dénombrement au niveau provincial.

Des données relatives au revenu gagné en 2005 ont été recueillies en mai 2006 dans le cadre du Recensement de 2006. Ces données sont raisonnablement proches de celles du fichier d'impôt pour 2005, les déclarations de revenu ayant été pour l'essentiel produites à la fin d'avril 2006. Le Fichier sur la famille T1 pour 2005 a compté 31 099 150 particuliers, ce qui représente 98,3 % de la population recensée. Le pourcentage de la population couverte est d'au moins 96,0 % de la population recensée dans l'ensemble des provinces et des territoires. Le taux de couverture du T1FF en 2005 est de 100,1 % des familles comptant un couple et de 103,0 % des familles monoparentales comparativement aux données du recensement.

Des améliorations ont été apportées au processus identifiant les enfants. En premier lieu, des modifications au système de traitement de données ont amélioré le traitement des données de 2005 et 2006. En deuxième lieu, l'introduction de la Prestation universelle pour la garde d'enfants en 2006 a permis d'identifier plus d'enfants âgés de moins de six ans. Par conséquent la couverture d'enfants dans les données du FT1F s'est trouvée améliorée lorsque celle-ci est comparée aux prévisions démographiques officielles de Statistique Canada. L'impact de ces améliorations est le plus notable en ce qui a trait au compte et au revenu médian total des familles monoparentales bien qu'il ne soit pas possible de distinguer l'impact précis de ces améliorations séparément de celles des changements annuels réguliers.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'accès aux données confidentielles est limité à un petit nombre de personnes au sein de la Division de la statistique du revenu de Statistique Canada. Les utilisateurs doivent faire part à ces personnes de leurs besoins; ces dernières extraient ensuite les données. Avant d'être communiquées, les données font l'objet de mesures de non divulgation rigoureuses :

1. Il doit y avoir au moins 100 déclarants dans une région géographique donnée avant que des données soient produites.
2. Une cellule doit représenter au moins 15 observations sinon elle est supprimée.
3. On examine chaque cellule où il est possible qu'un déclarant (ou une famille) prédomine; si un problème de ce genre est décelé, la cellule est supprimée.
4. Pour les montants exprimés en dollars, les suppressions primaires sont suivies de suppressions complémentaires, le but étant d'éviter que le l'information supprimée puisse être trouvée par recoupement. Il s'agit d'un processus itératif, où chaque suppression complémentaire peut rendre nécessaire une autre suppression complémentaire. Des modèles sont créés de manière à réduire la chose le plus possible.
5. Enfin, les chiffres et montants sont arrondis; plus précisément, les chiffres sont arrondis au multiple de dix le plus près, les montants agrégés, au multiple de 5 000 $ le plus près et les mesures de distribution, par exemple les centiles, au multiple de 10 $ le plus près.
6. Les moyennes et pourcentages sont établis à partir des chiffres et des montants arrondis pour éviter de dévoiler la procédure de non divulgation.

Des contrôles additionnels aidant à prévenir la divulgation sont parfois appliqués.

Révisions et désaisonnalisation

Une fois les données établies, elles ne sont pas révisées. Pour les analyses, les données sont parfois rajustées en dollars constants pour fins de comparaison avec les données d'autres années, mais les dollars courants seulement sont conservés.

Exactitude des données

Les comparaisons avec les données du Recensement de 2006 - numéro d'enregistrement 3901 (revenu de 2005) et avec celles de l'Enquête sur la dynamique du travail et du revenu (EDTR - numéro d'enregistrement 3889) 2005 ont permis de constater une grande similitude au niveau des agrégations par source. Par exemple, le revenu d'emploi venant du Fichier T1 sur les familles se situe entre les valeurs de revenu d'emploi des deux autres sources de données. Les données, et particulièrement les données agrégées, provenant des trois sources d'information sur le revenu à l'échelle de l'ensemble du Canada sont très semblables.

Les données ne font l'objet d'aucun rajustement, exception faite des vérifications et de l'estimation des composantes manquantes en vue d'en arriver à une définition du revenu qui soit compatible avec celle de Statistique Canada. Il n'y a pas de coefficient de variation au titre de l'échantillonnage, car l'échantillon équivaut presque à un recensement complet (il comprend de 95 % de la population totale), et les données ne sont pas pondérées ni rajustées relativement à la fraction (5 %) de la population qui apparaît ne pas être prise en compte.

Date de modification :