Estimations annuelles du revenu des familles de recensement et des particuliers (Fichier des familles T1)

Information détaillée pour 2004

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

4105

Cette activité est menée en vue de l'élaboration et de la diffusion de données économiques annuelles sur les petites régions pour les Canadiens.

Date de la parution - 25 mai 2006 (Revenu familial); 23 mai 2006 (Revenu des particuliers)

Aperçu

Cette activité a pour objet l'élaboration et la diffusion de données socioéconomiques régionales annuelles au sujet des Canadiennes et des Canadiens ainsi que de leur famille. Ces données, provenant principalement des déclarations de revenu produites auprès de l'Agence du revenu du Canada (ARC), fournissent de l'information démographique et des renseignements sur le revenu relativement à des régions géographiques infraprovinciales. Elles sont utilisées par les administrations municipales ainsi que par les ministères et organismes fédéraux et provinciaux pour évaluer des programmes et étayer des recommandations stratégiques. Elles sont utiles également dans le monde des affaires et dans le secteur de l'éducation pour en savoir davantage sur les marchés ciblés. Elles sont utiles aux universitaires et aux chercheurs pour l'analyse des conditions socioéconomiques.

Période de référence : Année civile « y » pour le revenu et les contributions, fin de l'année civile « y » pour l'âge, moment (en général, en avril de l'année civile « y+1 ») pour les renseignements sur l'adresse.

Période de collecte : Les déclarations de revenus sont principalement remplies au printemps suivant l'année de référence. Les fichiers T1 pour l'année civile « y » sont reçus de l'Agence du revenu du Canada (ARC) en janvier de l'année « y+2 ».

Sujets

  • Dépenses et épargne des ménages
  • Imposition des particuliers et des ménages
  • Régimes et fonds de pension et autres programmes de revenu de retraite
  • Revenu du ménage, revenu familial et personnel
  • Revenu, pensions, dépenses et richesse

Sources de données et méthodologie

Population cible

Les données portent sur toutes les personnes ayant complété une déclaration de revenu T1 pour l'année de référence ou ayant reçu la Prestation fiscale canadienne pour enfants (PFCE), sur les conjoints faisant partie des non déclarants (y compris les renseignements sur les traitements et salaires figurant dans le fichier T4), sur les enfants non déclarants (données d'identification provenant de trois sources : fichier de la PFCE, fichier des naissances et fichier historique) et sur les enfants ayant produit une déclaration et indiqué l'adresse de leurs parents. L'élaboration des données régionales sur les familles repose sur le concept de la famille de recensement. Le concept de la famille de recensement regroupe les individus en famille de recensement (parent(s) et les enfants vivant à la même adresse) ou les identifie comme étant des personnes hors famille de recensement.

Élaboration de l'instrument

Cette méthodologie ne s'applique pas.

Échantillonnage

Cette méthodologie ne s'applique pas.

Sources des données

Collecte des données pour cette période de référence : 2006-01-01 à 2006-01-31

Les données sont tirées de fichiers administratifs.

L'échantillon englobe 100 % des particuliers ayant rempli une déclaration de revenu (T1) ou ayant reçu la PFCE. À partir de cette information, on détermine les conjoints, les conjoints de fait et les enfants non déclarants. En bout de ligne, l'échantillon comprend environ 96 % de la population; il n'est ni pondéré, ni rajusté. Veuillez notez que les méthodes d'échantillonnage ne s'appliquent pas à cette enquête.

Les fichiers T1 et T4 ainsi que le fichier de la Prestation fiscale canadienne pour enfants (PFCE) sont transmis par l'Agence du revenu du Canada. Le traitement des fichiers, qui s'étend sur une période de cinq à six mois, aboutit à la création du Fichier sur la famille T1 (T1FF). Les enfants nés l'année précédente, dont il n'est pas fait état dans le fichier de la PFCE, sont pris en compte à partir d'un fichier des naissances. Les familles sont définies, et les conjoints et enfants absents sont imputés. Une fois achevé, le T1FF contient des données sur les déclarants et les personnes imputées (31 millions en 2004). Les déclarants décédés durant l'année ne sont pas inclus.

La période de revenu correspond à l'année civile. On calcule les composantes manquantes -- au titre du revenu pour l'ensemble du Canada, et au titre des impôts dans le cas de la province de Québec.

Détection des erreurs

Au cours du traitement, des vérifications manuelles et automatiques sont effectuées. Les variables ayant une valeur de 1 (ce qui constitue une catégorie d'indicateur à l'ARC) sont ramenées à zéro, et les variables dont la valeur est supérieure au maximum absolu sont automatiquement corrigées. Les variables qui présentent des valeurs aberrantes sont repérées puis examinées, et les erreurs décelées sont corrigées manuellement. Ainsi, dans le cas de l'année d'imposition 2004, il y a eu au total 14,1 % des enregistrements dont la valeur d'au moins un des champs a été ramené de 1 à 0, soit 3 345 030 enregistrements; 0,34 % des enregistrements comptaient au moins une valeur négative qui a été changée pour une valeur positive. Il y a donc peu d'enregistrements modifiés, si l'on fait exception des « indicateurs » de 1 $ et de la correction du signe attribué à certaines valeurs.

Imputation

Parce que le fichier source contient des renseignements directs limités sur le nombre et les caractéristiques des personnes ne faisant pas de déclaration, il est nécessaire d'obtenir cette information. Le système familial crée des familles en mettant en relation des membres déclarants et évalue les membres non déclarants à partir de l'information contenue dans les déclarations des déclarants, se fondant sur le statut matrimonial, les déductions et l'information relative aux crédits d'impôt ou à partir d'un dossier historique des enfants. Par exemple, le système familial impute un conjoint non déclarant lorsqu'un déclarant s'est déclaré marié, mais qu'il n'a pas été relié à un conjoint déclarant. Les données sur les traitements et salaires des conjoints non déclarants sont tirées du fichier T4 lorsqu'elles sont disponibles.

Relativement à l'année d'imposition 2004, 23,6 millions de particuliers ont produit une déclaration de revenu, et 7,4 millions de particuliers additionnels ont été identifiés à titre de non déclarants faisant partie de la famille d'un déclarant. Cela signifie que le quart environ des particuliers inclus dans le fichier étaient des non déclarants en 2004. Cette proportion diminue au fil du temps, étant donné que de plus en plus de particuliers produisent une déclaration, que ce soit aux fins de payer de l'impôt ou pour recevoir des paiements de transfert aux termes de programmes désormais gérés par l'Agence du revenu du Canada.

Entre 1982 et 1992, les renseignements sur les enfants étaient tirés directement du fichier d'impôt. À partir de 1993, une combinaison de fichiers a été utilisée pour déterminer les enfants non déclarants : le fichier de la Prestation fiscale canadienne pour enfants, les fichiers de naissances provinciaux et le fichier sur la famille (T1FF) de l'année précédente.

En 2004, environ 73 % des Canadiens ont produit une déclaration de revenu. Un T1FF rempli représente environ 96 %, la différence étant les non-déclarants identifiés à partir des renseignements des déclarants.

Estimation

La production des estimations comporte les principales étapes suivantes :

Vérification et imputation : s'il est déterminé qu'une valeur dépasse la valeur maximale de la fourchette applicable à sa catégorie, cette valeur sera souvent divisée par 10 jusqu'à ce qu'elle se situe à l'intérieur de la fourchette. Cette méthode a été retenue parce que l'on a constaté que, parfois, des valeurs étaient exprimées en dollars alors qu'elles auraient dû l'être en dollars et en cents. S'il est établi qu'une valeur aberrante est en fait une erreur, la correction manuelle peut être effectuée selon cette méthode ou toute autre méthode qui semblera raisonnable.

Géocodage : aux fins de géocodage, on utilise le Fichier de conversion des codes postaux (FCCP) de Statistique Canada pour convertir les codes postaux en régions géographiques normalisées (divisions de recensement, régions métropolitaines de recensement, agglomérations de recensement, secteurs de recensement). Les codes postaux servent également d'unités élémentaires pour la création de « régions postales » en géographie postale.

Constitution des familles : aux fins de constitution des familles de recensement, on procède à un rapprochement portant sur le numéro d'assurance sociale, le nom de famille et le code postal, tout en tenant compte de l'âge, du sexe et de l'état civil. On fait l'hypothèse que les enfants ont au moins quinze ans de plus que leurs enfants. Lorsqu'un conjoint est imputé, le sexe qui lui est attribué est l'opposé de celui du déclarant, et son âge lui est attribué selon une méthode probabiliste d'après la répartition par âge des époux et des épouses. On n'attribue pas de sexe aux enfants, et leur âge est généralement connu. Dans les quelques cas où l'âge des enfants n'est pas connu, un âge leur est attribué selon une méthode probabiliste en fonction de l'âge de la mère.

Revenu et impôt -- estimation de valeurs manquantes : il existe certaines sources de revenu non imposable qui ne sont pas comprises dans les déclarations de revenu. Le revenu en question est calculé à partir des renseignements contenus dans les déclarations de revenu. Les données sur la Prestation fiscale canadienne pour enfants reçue proviennent directement du fichier de la PFCE. Les crédits d'impôt provinciaux remboursables et les prestations provinciales versées dans le cadre du programme de la Prestation nationale pour enfants sont extrapolées à partir des renseignements relatifs à l'année en cours. Le crédit d'impôt pour la TPS/TVH est calculé dans le cas des personnes qui demandent ce crédit. Les impôts du Québec sont calculés à partir des données contenues dans la déclaration fédérale.

Agrégation : les données sont agrégées de manière à correspondre de façon approximative aux régions géographiques normalisées de Statistique Canada et aux régions postales.

Évaluation de la qualité

Plusieurs méthodes sont utilisées pour évaluer les estimations :

1. On évalue les données géographiques en comparant le nombre de déclarants et les estimations démographiques pour une même région.
2. On évalue les données démographiques à peu près de la même façon, c'est à dire en faisant des comparaisons avec les estimations de Statistique Canada pour les mêmes régions.
3. Les données sur le revenu sont évaluées au moyen d'analyses tendancielles et de comparaisons avec les données de l'Enquête sur les finances des consommateurs (EFC) et de l'Enquête sur la dynamique du travail et du revenu (EDTR) lorsque la chose est possible.
4. De nombreuses comparaisons sont effectuées (population, revenu, données démographiques) lorsque l'on dispose de données de recensement.
5. En outre, dans le cas du revenu des particuliers, des comparaisons sont effectuées avec l'information contenue dans le document de l'ARC intitulé Statistiques sur le revenu.

Le Fichier sur la famille T1 pour 2004 fait état de 31 041 180 particuliers résidant au Canada, ce qui représente 96,2 % de la population selon les estimations officielles de Statistique Canada. Le pourcentage de la population couverte dépasse 93 % de la population estimative dans l'ensemble des provinces et des territoires. Les lois provinciales touchant l'assujettissement du revenu à l'impôt de la province ou régissant les crédits d'impôt provinciaux peuvent avoir une incidence sur le dénombrement au niveau provincial.

Des données relatives au revenu gagné en 2000 ont été recueillies en mai 2001 dans le cadre du Recensement de 2001. Ces données sont raisonnablement proches de celles du fichier d'impôt pour 2000, les déclarations de revenu ayant été pour l'essentiel produites à la fin d'avril 2001. Le Fichier sur la famille T1 pour 2000 a compté 29 891 290 particuliers, ce qui représente 99,6 % de la population recensée. Le pourcentage de la population couverte est d'au moins 98 % de la population recensée dans l'ensemble des provinces et des territoires. Le taux de couverture du T1FF en 2000 est de 99,6 % des familles comptant un couple et de 103 % des familles monoparentales comparativement aux données du recensement.

Contrôle de la divulgation

La Loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler de l'information obtenue en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'accès aux données confidentielles est limité à un petit nombre de personnes au sein de la Division. Les utilisateurs doivent faire part à ces personnes de leurs besoins; ces dernières extraient ensuite les données. Avant d'être communiquées, les données font l'objet de mesures de non divulgation rigoureuses :

1. Il doit y avoir au moins 100 déclarants dans une région géographique donnée avant que des données soient produites.
2. Une cellule doit représenter au moins 15 déclarants, sinon elle est supprimée.
3. On examine chaque cellule où il est possible qu'un déclarant (ou une famille) prédomine; si un problème de ce genre est décelé, la cellule est supprimée.
4. Les suppressions primaires sont suivies de suppressions complémentaires, le but étant d'éviter que le l'information supprimée puisse être trouvée par recoupement. Il s'agit d'un processus itératif, où chaque suppression complémentaire peut rendre nécessaire une autre suppression complémentaire. Des modèles sont créés de manière à réduire la chose le plus possible.
5. Enfin, les chiffres et montants sont arrondis; plus précisément, les chiffres sont arrondis au multiple de dix le plus près, les montants agrégés, au multiple de 5 000 $ le plus près et les mesures de distribution, par exemple les centiles, au multiple de 10 $ le plus près.
6. Les moyennes et pourcentages sont établis à partir des chiffres et des montants arrondis pour éviter de dévoiler la procédure de non divulgation.

Révisions et désaisonnalisation

Une fois les données établies, elles ne sont pas révisées. Pour les analyses, les données sont parfois rajustées en dollars constants pour fins de comparaison avec les données d'autres années, mais les dollars courants seulement sont conservés.

Exactitude des données

Les données sont perçues par certains comme constituant la norme en matière de renseignements sur le revenu. Les comparaisons avec les données du Recensement de 2001 - numéro d'enregistrement 3901 (revenu de 2000) et avec celles de l'Enquête sur la dynamique du travail et du revenu (EDTR - numéro d'enregistrement 3889) ont permis de constater une grande similitude au niveau des agrégations par source -- le revenu d'emploi est moins élevé mais le revenu de placements et les paiements de transfert sont plus élevés. Les données, et particulièrement les données agrégées, provenant des trois sources d'information sur le revenu à l'échelle de l'ensemble du Canada sont très semblables.

Les données ne font l'objet d'aucun rajustement, exception faite des vérifications et de l'estimation des composantes manquantes en vue d'en arriver à une définition du revenu qui soit compatible avec celle de Statistique Canada. Il n'y a pas de coefficient de variation au titre de l'échantillonnage, car l'échantillon équivaut presque à un recensement complet (il comprend de 96 à 97 % de la population totale), et les données ne sont pas pondérées ni rajustées relativement à la fraction (3 à 4 %) de la population qui apparaît ne pas être prise en compte.

Documentation

Date de modification :