Base de données sur la dynamique canadienne entre employeurs et employés (BDCEE)

Information détaillée pour 1 janvier 2001 au 31 décembre 2020

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

5228

Fournir des données appariées entre les employés et les employeurs du marché du travail canadien provenant de sources de données administratives.

Date de la parution - Les données ne sont pas accessibles au public, puisque les observations individuelles sont confidentielles en vertu de la Loi sur la statistique.

Aperçu

La BDCEE est un ensemble de fichiers qui peuvent être couplés pour obtenir des données appariées entre les employés et les employeurs du marché du travail canadien. Les variables sélectionnées à partir de différents fichiers de composantes sont accessibles à des fins analytiques. L'analyse peut être faite de façon transversale, selon l'année civile, ou de façon longitudinale, d'une année à l'autre, à partir de 2001 jusqu'aux renseignements les plus récents qui peuvent être tirés des fichiers de composantes sources (généralement, l'année en cours moins deux).

Période de collecte : La BDCEE commence en 2001.

Sources de données et méthodologie

Population cible

Les données de la BDCEE sont basées sur des fichiers couplables provenant de sources administratives. La population couverte par la base de données comprend donc l'ensemble des particuliers et des entreprises associées aux dossiers administratifs.

Élaboration de l'instrument

Cette méthodologie ne s'applique pas.

Échantillonnage

Les fichiers composant la BDCEE permettent d'obtenir des données longitudinales couplées entre les employés et les employeurs.

Sources des données

Les données sont tirées de fichiers administratifs et sont dérivées de diverses enquêtes de Statistique Canada et/ou d'autres sources.

Les données de la BDCEE sont tirées des sources suivantes à partir de 2001 :
- Fichier maître des particuliers T1 (FMPT1)
- Fichier maître historique T1 (HT1)
- Fichier sur la famille T1 (FFT1)
- Fichier des déclarations financières T1 (DFT1, à partir de 2005)
- Fichier des déclarations d'entreprise T1 (DET1, à partir de 2005)
- Déclaration de revenus des sociétés T2
- Fichiers sur l'état de la rémunération payée T4 (T4)
- Relevé d'emploi (RE)
- Commerce selon les caractéristiques des exportateurs (CCE, à partir de 2010)
- Commerce selon les caractéristiques des importateurs (CCI, à partir de 2010)
- Fichier de microdonnées longitudinales des comptes nationaux (FMLCN)
- Base de données longitudinales sur les immigrants (BDIM)
- Fichier des résidents temporaires (RT)

Détection des erreurs

Les données des déclarants au niveau des particuliers sont tirées des fichiers FMPT1 et HT1. Certaines variables du formulaire T1 annuel sont extraites et traitées aux fins des fichiers de sortie analytiques de la BDCEE. Trois principaux traitements sont exécutés : a) l'harmonisation des noms de variables et des codes; b) l'identification des titulaires de plusieurs NAS et le couplage longitudinal des données fiscales d'un même particulier possédant des NAS différents; c) la production de données démographiques cohérentes.

Des efforts ont été déployés pour suivre les mêmes entreprises au fil du temps afin de distinguer les entrées et sorties « véritables » des « fausses ». Les entrées et sorties véritables rendent compte d'événements démographiques réels (la création de nouvelles entreprises et l'échec d'entreprises existantes), tandis que les fausses entrées et sorties peuvent simplement rendre compte de la restructuration organisationnelle d'une entreprise ou d'un changement dans ses pratiques de déclaration. Le recours à des méthodes telles que le suivi de la main-d'oeuvre et le suivi des prédécesseurs et successeurs pour chaque paire de deux années a facilité ce processus.

Imputation

Le traitement des variables sélectionnées à partir des différents fichiers composant l'environnement de couplage de la BDCEE peut nécessiter le recours à l'imputation afin de compléter les données manquantes ou erronées des fichiers sources. L'imputation effectuée pendant le traitement est décrite dans leur propre documentation afin d'en informer les utilisateurs.

Estimation

Les données au niveau des particuliers sont déclarées en fonction de l'année civile, alors que la plupart des données au niveau des entreprises sont déclarées en fonction de l'exercice financier. Une procédure a été appliquée dans le but de convertir tous les enregistrements au niveau des entreprises en fonction de l'année civile à des fins d'uniformité. Plus précisément, tous les enregistrements au niveau des entreprises sont d'abord répartis au prorata selon le nombre de jours de l'année civile couverts par chaque exercice déclaré. Ces enregistrements pondérés sont ensuite agrégés pour l'année civile correspondante à partir d'enregistrements de plusieurs exercices financiers.

Évaluation de la qualité

Les problèmes de données propres aux variables des différents fichiers composants de la BDCEE sont décrits plus en détail dans leur propre documentation.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

La BDCEE est mise à jour tous les ans en y ajoutant une autre année de données. Les variables propres à chaque année sont conservées dans les fichiers annuels, mais les variables harmonisées grâce au suivi de l'information au fil du temps peuvent changer en raison de l'ajout de l'information pour l'année la plus récente et de la mise à jour de l'information liée aux variables existantes.

Exactitude des données

Dans l'environnement de couplage de la BDCEE, il y a maintenant plus de cas où l'information peut être tirée de plusieurs fichiers sources (par exemple, la rémunération totale du T4 peut être trouvée dans les feuillets T4 et dans les fichiers T1). Dans de tels cas, il est important que les utilisateurs soient conscients de la situation et prennent la décision analytique nécéssaire pour le projet lorsqu'ils trouvent des renseignements incohérents.

Les problèmes de données propres aux variables des différents fichiers composants sont décrits plus en détail dans leur propre documentation.

Documentation

Date de modification :