Estimations annuelles du revenu des familles de recensement et des particuliers (Fichier des familles T1)

Information détaillée pour 2001

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

4105

Cette activité est menée en vue de l'élaboration et de la diffusion de données économiques annuelles sur les petites régions pour les Canadiens.

Date de la parution - 3 septembre 2003

Aperçu

Cette activité a pour objet l'élaboration et la diffusion de données socioéconomiques régionales annuelles au sujet des Canadiennes et des Canadiens ainsi que de leur famille. Ces données, provenant principalement des déclarations de revenu produites auprès de l'Agence du revenu du Canada (ARC), fournissent de l'information démographique et des renseignements sur le revenu relativement à des régions géographiques infraprovinciales. Elles sont utilisées par les administrations municipales ainsi que par les ministères et organismes fédéraux et provinciaux pour évaluer des programmes et étayer des recommandations stratégiques. Elles sont utiles également dans le monde des affaires et dans le secteur de l'éducation pour en savoir davantage sur les marchés ciblés. Elles sont utiles aux universitaires et aux chercheurs pour l'analyse des conditions socioéconomiques.

Période de référence : Année civile « y » pour le revenu et les contributions, fin de l'année civile « y » pour l'âge, moment (en général, en avril de l'année civile « y+1 ») pour les renseignements sur l'adresse.

Période de collecte : Les déclarations de revenus sont principalement remplies au printemps suivant l'année de référence. Les fichiers T1 pour l'année civile « y » sont reçus de l'Agence du revenu du Canada (ARC) en janvier de l'année « y+2 ».

Sujets

  • Dépenses et épargne des ménages
  • Imposition des particuliers et des ménages
  • Régimes et fonds de pension et autres programmes de revenu de retraite
  • Revenu du ménage, revenu familial et personnel
  • Revenu, pensions, dépenses et richesse

Sources de données et méthodologie

Population cible

Les données portent sur toutes les personnes ayant complété une déclaration de revenu T1 pour l'année de référence ou ayant reçu la Prestation fiscale canadienne pour enfants (PFCE), sur les conjoints faisant partie des non déclarants (y compris les renseignements sur les traitements et salaires figurant dans le fichier T4), sur les enfants non déclarants (données d'identification provenant de trois sources : fichier de la PFCE, fichier des naissances et fichier historique) et sur les enfants ayant produit une déclaration et indiqué l'adresse de leurs parents. L'élaboration des données régionales sur les familles repose sur le concept de la famille de recensement. Le concept de la famille de recensement regroupe les individus en famille de recensement (parent(s) et les enfants vivant à la même adresse) ou les identifie comme étant des personnes hors famille de recensement.

Élaboration de l'instrument

Cette méthodologie ne s'applique pas.

Échantillonnage

Cette méthodologie ne s'applique pas.

Sources des données

Collecte des données pour cette période de référence : 2003-01-01 à 2003-01-31

Les données sont tirées de fichiers administratifs.

Les données recueillies englobent tous les particuliers ayant rempli une déclaration de revenu (T1) ou ayant reçu la PFCE. À partir de cette information, on détermine les conjoints, conjoints de fait et enfants non déclarants. En bout de ligne, l'échantillon comprend environ 96 % de la population; il n'est ni pondéré, ni rajusté.

Détection des erreurs

Au cours du traitement, des vérifications manuelles et automatiques sont effectuées. Les variables ayant une valeur de 1 (ce qui constitue une catégorie d'indicateur à l'ADRC) sont ramenées à zéro, et les variables dont la valeur est supérieure au maximum absolu sont automatiquement corrigées. Les variables qui présentent des valeurs aberrantes sont repérées puis examinées, et les erreurs décelées sont corrigées manuellement. Ainsi, dans le cas de l'année d'imposition 2001, il y a eu au total 5,5 % des enregistrements dont la valeur d'au moins un des champs a été ramené de 1 à 0, soit 1 258 990 enregistrements; 0,29 % des enregistrements comptaient au moins une valeur négative qui a été changée pour une valeur positive; dans 0,02 % des enregistrements, au moins un rajustement a été apporté à un montant de revenu. Il y a donc peu d'enregistrements modifiés, si l'on fait exception des « indicateurs » de 1 $ et de la correction du signe attribué à certaines valeurs.

Imputation

Parce que le fichier source contient des renseignements directs limités sur le nombre et les caractéristiques des personnes ne faisant pas de déclaration, il est nécessaire d'obtenir cette information. Le système familial crée des familles en mettant en relation des membres déclarants et évalue les membres non déclarants à partir de l'information contenue dans les déclarations des déclarants, se fondant sur le statut matrimonial, les déductions et l'information relative aux crédits d'impôt ou à partir d'un dossier historique des enfants. Par exemple, le système familial impute un conjoint non déclarant lorsqu'un déclarant s'est déclaré marié, mais qu'il n'a pas été relié à un conjoint déclarant. Les données sur les traitements et salaires des conjoints non déclarants sont tirées du fichier T4 lorsqu'elles sont disponibles.

Relativement à l'année d'imposition 2001, 22,7 millions de particuliers ont produit une déclaration de revenu, et 7,4 millions de particuliers additionnels ont été identifiés à titre de non déclarants faisant partie de la famille d'un déclarant. Cela signifie que le quart environ des particuliers inclus dans le fichier étaient des non déclarants en 2001. Cette proportion diminue au fil du temps, étant donné que de plus en plus de particuliers produisent une déclaration, que ce soit aux fins de payer de l'impôt ou pour recevoir des paiements de transfert aux termes de programmes désormais gérés par l'Agence des douanes et du revenu du Canada.

Entre 1982 et 1992, les renseignements sur les enfants étaient tirés directement du fichier d'impôt. À partir de 1993, une combinaison de fichiers a été utilisée pour déterminer les enfants non déclarants : le fichier de la Prestation fiscale canadienne pour enfants, les fichiers de naissances provinciaux et le fichier sur la famille (T1FF) de l'année précédente.

Environ 70 % des Canadiens produisent une déclaration de revenue. Un T1FF rempli représente environ 96 %, la différence étant les non-déclarants identifiés à partir des renseignements des déclarants.

Estimation

La production des estimations comporte les principales étapes suivantes :

Vérification et imputation : s'il est déterminé qu'une valeur dépasse la valeur maximale de la fourchette applicable à sa catégorie, cette valeur sera souvent divisée par 10 jusqu'à ce qu'elle se situe à l'intérieur de la fourchette. Cette méthode a été retenue parce que l'on a constaté que, parfois, des valeurs étaient exprimées en dollars alors qu'elles auraient dû l'être en dollars et en cents. S'il est établi qu'une valeur aberrante est en fait une erreur, la correction manuelle peut être effectuée selon cette méthode ou toute autre méthode qui semblera raisonnable.

Géocodage : aux fins de géocodage, on utilise le Fichier de conversion des codes postaux (FCCP) de Statistique Canada pour convertir les codes postaux en régions géographiques normalisées (divisions de recensement, régions métropolitaines de recensement, agglomérations de recensement, secteurs de recensement). Les codes postaux servent également d'unités élémentaires pour la création de « régions postales » en géographie postale.

Constitution des familles : aux fins de constitution des familles de recensement, on procède à un rapprochement portant sur le numéro d'assurance sociale, le nom de famille et le code postal, tout en tenant compte de l'âge, du sexe et de l'état civil. On fait l'hypothèse que les enfants ont au moins quinze ans de plus que leurs enfants. Lorsqu'un conjoint est imputé, le sexe qui lui est attribué est l'opposé de celui du déclarant, et son âge lui est attribué selon une méthode probabiliste d'après la répartition par âge des époux et des épouses. On n'attribue pas de sexe aux enfants, et leur âge est généralement connu. Dans les quelques cas où l'âge des enfants n'est pas connu, un âge leur est attribué selon une méthode probabiliste en fonction de l'âge de la mère.

Revenu et impôt -- estimation de valeurs manquantes : il existe certaines sources de revenu non imposable qui ne sont pas comprises dans les déclarations de revenu. Le revenu en question est calculé à partir des renseignements contenus dans les déclarations de revenu. Les données sur la Prestation fiscale canadienne pour enfants reçue proviennent directement du fichier de la PFCE. Les crédits d'impôt provinciaux remboursables et les prestations provinciales versées dans le cadre du programme de la Prestation nationale pour enfants sont extrapolées à partir des renseignements relatifs à l'année en cours. Le crédit d'impôt pour la TPS/TVH est calculé dans le cas des personnes qui demandent ce crédit. Les impôts du Québec sont calculés à partir des données contenues dans la déclaration fédérale.

Agrégation : les données sont agrégées de manière à correspondre de façon approximative aux régions géographiques normalisées de Statistique Canada et aux régions postales.

Évaluation de la qualité

Plusieurs méthodes sont utilisées pour évaluer les estimations :

1. On évalue les données géographiques en comparant le nombre de déclarants et les estimations démographiques pour une même région.
2. On évalue les données démographiques à peu près de la même façon, c'est à dire en faisant des comparaisons avec les estimations de Statistique Canada pour les mêmes régions.
3. Les données sur le revenu sont évaluées au moyen d'analyses tendancielles et de comparaisons avec les données de l'Enquête sur les finances des consommateurs (EFC) et de l'Enquête sur la dynamique du travail et du revenu (EDTR) lorsque la chose est possible.
4. De nombreuses comparaisons sont effectuées (population, revenu, données démographiques) lorsque l'on dispose de données de recensement.
5. En outre, dans le cas du revenu des particuliers, des comparaisons sont effectuées avec l'information contenue dans le document de l'ADRC intitulé Statistiques sur le revenu.

Des données relatives au revenu gagné en 2000 ont été recueillies en mai 2001 dans le cadre du Recensement de 2001. Ces données sont raisonnablement proches de celles du fichier d'impôt pour 2000, les déclarations de revenu ayant été pour l'essentiel produites à la fin d'avril 2001. Les comparaisons ont été effectuées à la fois avec les estimations les plus récentes et avec les résultats du recensement.

Le Fichier sur la famille T1 pour 2000 fait état de 29 891 290 particuliers résidant au Canada, ce qui représente 97 % de la population estimative selon Statistique Canada et 99,6 % de la population recensée. Le pourcentage de la population couverte dépasse 93 % de la population estimative dans l'ensemble des provinces et des territoires, et il est d'au moins 98 % comparativement aux résultats du recensement. Les lois provinciales touchant l'assujettissement du revenu à l'impôt de la province ou régissant les crédits d'impôt provinciaux peuvent avoir une incidence sur le dénombrement au niveau provincial. Le taux de couverture du T1FF en 2000 est de 102,2 % des familles comptant un couple et de 98,6 % des familles monoparentales comparativement aux estimations de la Division de la démographie, de Statistique Canada. Par rapport aux données du recensement, le taux de couverture est de 99,6 % et de 103 % dans le cas des familles comptant un couple et des familles monoparentales, respectivement.

Contrôle de la divulgation

La Loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler de l'information obtenue en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'accès aux données confidentielles est limité à un petit nombre de personnes au sein de la Division. Les utilisateurs doivent faire part à ces personnes de leurs besoins; ces dernières extraient ensuite les données. Avant d'être communiquées, les données font l'objet de mesures de non divulgation rigoureuses :

1. Il doit y avoir au moins 100 déclarants dans une région géographique donnée avant que des données soient produites.
2. Une cellule doit représenter au moins 15 déclarants, sinon elle est supprimée.
3. On examine chaque cellule où il est possible qu'un déclarant (ou une famille) prédomine; si un problème de ce genre est décelé, la cellule est supprimée.
4. Les suppressions primaires sont suivies de suppressions complémentaires, le but étant d'éviter que le l'information supprimée puisse être trouvée par recoupement. Il s'agit d'un processus itératif, où chaque suppression complémentaire peut rendre nécessaire une autre suppression complémentaire. Des modèles sont créés de manière à réduire la chose le plus possible.
5. Enfin, les chiffres et montants sont arrondis; plus précisément, les chiffres sont arrondis au multiple de dix le plus près, les montants agrégés, au multiple de 5 000 $ le plus près et les mesures de distribution, par exemple les centiles, au multiple de 10 $ le plus près.
6. Les moyennes et pourcentages sont établis à partir des chiffres et des montants arrondis pour éviter de dévoiler la procédure de non divulgation.

Révisions et désaisonnalisation

Une fois les données établies, elles ne sont pas révisées. Pour les analyses, les données sont parfois rajustées en dollars constants pour fins de comparaison avec les données d'autres années, mais les dollars courants seulement sont conservés.

Exactitude des données

Les données sont perçues par certains comme constituant la norme en matière de renseignements sur le revenu. Les comparaisons avec les données du Recensement de 2001 - numéro d'enregistrement 3901 (revenu de 2000) et avec celles de l'Enquête sur la dynamique du travail et du revenu (EDTR - numéro d'enregistrement 3889) ont permis de constater une grande similitude au niveau des agrégations par source -- le revenu d'emploi est moins élevé mais le revenu de placements et les paiements de transfert sont plus élevés. Les données, et particulièrement les données agrégées, provenant des trois sources d'information sur le revenu à l'échelle de l'ensemble du Canada sont très semblables.

Les données ne font l'objet d'aucun rajustement, exception faite des vérifications et de l'estimation des composantes manquantes en vue d'en arriver à une définition du revenu qui soit compatible avec celle de Statistique Canada. Il n'y a pas de coefficient de variation au titre de l'échantillonnage, car l'échantillon équivaut presque à un recensement complet (il comprend de 96 à 97 % de la population totale), et les données ne sont pas pondérées ni rajustées relativement à la fraction (3 à 4 %) de la population qui apparaît ne pas être prise en compte.

Documentation

Date de modification :