Environnement de fichiers couplables - Entreprises (EFC-E)

Information détaillée pour 2019, 2020, 2021

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

6000

L'Environnement de fichiers couplables - Entreprises (EFC-E) utilise un processus de couplage pour tirer parti de la capacité des enquêtes et des données administratives existantes qui portent sur un seul sujet d'éclairer les enjeux commerciaux et économiques. Il positionne ces enquêtes et données administratives de manière à appuyer les analyses longitudinales et transversales et il permet notamment d'utiliser d'autres variables pour évaluer l'entrepreneuriat, l'emploi, la productivité, la compétitivité .

Date de la parution - 10 septembre 2024 (Nombre d'entreprises au Canada selon des indicateurs de la diversité des propriétaires d'entreprises)

Aperçu

L'objectif de l'Environnement de fichiers couplables - Entreprises (EFC-E) 2021 est de mettre à jour les fichiers couplés en utilisant la plus récente année de données disponibles de différentes sources. Cette mise à jour fournira une plus longue série de données pour les analyses longitudinales et transversales.

Sujets étudiés

Les administrations publiques, les milieux universitaires, les organisations internationales ainsi que les analystes et chercheurs internes de Statistique Canada utilisent les différentes variables de l'EFC-E pour étudier le comportement des entreprises. La croissance des industries en termes d'emploi, de revenus et de productivité sontdes sujets d'intérêts pour les ministères qui doivent élaborer des politiques en matière de développement économique, particulièrement en ce qui concerne les programmes axés sur les petites et moyennes entreprises. L'EFC-E permet également aux chercheurs et aux analystes de mesurer les répercussions des programmes stratégiques sur les groupes d'entreprises ciblés. Les gestionnaires d'enquête de Statistique Canada peuvent aussi utiliser l'EFC-E pour élaborer des bases de sondage. L'EFC-E est la source de données pour le programme des indicateurs de l'entrepreneuriat.

Période de référence : Chaque source de données a sa propre période de référence. Les appariements se font chaque année pour inclure les données les plus récentes mises à jour.

Période de collecte : Dans l'environnement de fichiers couplables - Entreprises, les périodes de collecte varient selon chaque source de données.

Sujets

  • Balance des paiements internationaux
  • Commerce international
  • Comptes économiques
  • Création, disparitions, fusions et croissance
  • Exportation de marchandises
  • Fiscalité des entreprises
  • Importation de marchandises
  • Innovation
  • Petites et moyennes entreprises
  • Recherche et développement
  • Rendement des entreprises et propriété
  • Sciences et technologie
  • Technologie de l'information et des communications

Sources de données et méthodologie

Population cible

L'Environnement de fichiers couplables - Entreprises comprend une liste complète, à jour et unique de toutes les entreprises au Canada, qui se fonde sur le Registre des entreprises de Statistique Canada. Le Registre des entreprises (RE) contient des renseignements sur la stratification, la collecte de données et le profil de réponse pour les entreprises canadiennes qui ont un compte d'impôt sur le revenu des sociétés (T2), qui sont un employeur ou qui ont un compte de TPS.

Les populations cibles des différentes sources de données utilisées dans l'EFC-E sont désignées par leurs numéros SDDS respectifs lorsque ceux-ci sont disponibles pour les produits de Statistique Canada.

Élaboration de l'instrument

Cette méthodologie ne s'applique pas.

Échantillonnage

L'Environnement de fichiers couplables - Entreprises, qui intègre les microdonnées provenant de différentes sources, se fonde sur l'ensemble de l'univers des entreprises du Registre des entreprises.

Sources des données

L'EFC-E est un environnement où les sources de données administratives et d'enquête sont couplées. Les sources de données, leurs périodes de référence et les numéros de référence des programmes statistiques ou d'enquête (SDDS) sont indiqués ci-après :

Sources de données administratives

- Registre des entreprises (RE) - 1996 à 2022 (SDDS 1105)
- Programme d'analyse longitudinale de l'emploi (PALE) - 2000 à 2019 (SDDS 8013)
- Index général des renseignements financiers (IGRF - T1) - Entreprises non constituées en sociétés - 2005 à 2021
- Index général des renseignements financiers (IGRF-T2) - Entreprises constituées en sociétés - 2000 à 2021
- T4 (État de la rémunération Payée) fichier supplémentaire - 1997 à 2021
- FPP (Fichier Principal Personnel) du propriétaire principal de l'entreprise (avec des variables du recensement 2006 à 2021 [SDDS 3901] et de la base de données longitudinales sur l'immigration 2000 à 2021 [SSDS 5057]) - 2007 à 2014
- BDA (Base de données T1 améliorée) du propriétaire principal de l'entreprise (avec des variables du recensement 2006 à 2021 [SDDS 3901] et de la base de données longitudinales sur l'immigration 2000 à 2021 [SSDS 5057]) - 2012 à 2021
- Compte de retenues sur la paye (PD7) - 2001 à 2021
- Registre des exportateurs - 2010 à 2021 (SDDS 2201)
- Registre des importateurs - 2012 à 2021 (SDDS 2201)
- Brevets (Office de la propriété intellectuelle du Canada) -2001 à 2006
- United States Patent Office (USPTO) - Entreprises canadiennes seulement - 2000 à 2011
- Soutien à la croissance et à l'innovation en entreprise - 2007-2008 à 2020-2021 (SDDS 5304)
- Programme des données fiscales agricoles (PDFA) - 2016-2019 (SDDS 3447)
- Organismes de bienfaisance - 2003-2020
- Base de données de recherche sur les brevets canadiens (BDRBC) - 2001-2015
- Base de données sur la diversité et les compétences (BDDC) - 2001-2019 (SDDS 5228)

Sources de données d'enquête

- Enquête annuelle Recherche et développement dans l'industrie canadienne (RDIC) - 2000 à 2020 (SDDS 4201)
- Balance des paiements : investissements directs canadiens à l'étranger (IDCE) - 2000 à 2013 (SDDS 1537)
- Balance des paiements : investissements directs étrangers au Canada (IDEC) - 2000 à 2013 (SDDS 1537)
- Échanges de services commerciaux (ESC) - 2000 à 2020 (SDDS 1536)
- Enquête sur l'innovation et les stratégies d'entreprise (EISE) - 2009, 2012, 2017, 2019 (SDDS 5171)
- Enquête sur l'innovation (INNO) - 2003, 2005 (SDDS 4218)
- Enquête sur le commerce électronique et la technologie (ECET) - 2000 à 2007 (SDDS 4432)
- Enquête sur les technologies de pointe (ETP) - 2007, 2014 (SDDS 4223)
- Enquête sur la commercialisation de l'innovation (ECI) - 2007 (SDDS 5140)
- Enquête sur le financement et la croissance des petites et moyennes entreprises (EFCPME) - 2004, 2007, 2011, 2014, 2017, 2020 (SDDS 2941)
- Enquête sur la gestion de la propriété intellectuelle (EGPI) - 2010 (SDDS 5183)
- Enquête sur la technologie numérique et l'utilisation d'Internet (ETNUI) - 2012, 2013, 2019, 2021 (SDDS 4225)
- Enquête sur le coût de la mise en conformité à la réglementation (SDD 5093) - 2011, 2016
- Demande pour les dépenses de recherche scientifique et développement expérimental (RS&DE) - T661 - 2000 à 2021
- Enquête sur la connaissance et l'utilisation de la propriété intellectuelle (CUPI) - 2019 (SDDS 5291)

En tant que base de données centrale de Statistique Canada pour les enquêtes-entreprises, le Registre des entreprises a servi de « base » à l'appariement des autres sources de données visant à obtenir un couplage univoque des enregistrements. La méthodologie déterministe de couplage des enregistrements a été utilisée pour créer ces fichiers couplés du RE. Cela a permis d'assurer l'uniformisation avec les autres programmes d'entreprises de Statistique Canada et d'accroître l'efficacité du processus de couplage. L'appariement probabiliste a été utilisé pour apparier les deux ensembles de données sur les brevets ne provenant pas de Statistique Canada dans l'EFC-E.

Selon le sujet de recherche, les variables d'intérêt des fichiers couplables appropriés sont extraites sous forme d'ensembles de données de recherche et fournies aux chercheurs et analystes dans un environnement sécurisé et contrôlé au Centre canadien d'élaboration de données et de recherche économique (CDRE). Les résultats d'analyse et de recherche sont surveillés et examinés avec soin et rigueur avant leur publication pour que toutes les règles en matière de confidentialité et de divulgation soient respectées.

Détection des erreurs

Cette méthodologie ne s'applique pas.

Imputation

Cette méthodologie ne s'applique pas à ce programme statistique.

Estimation

Ce type de méthodologie ne s'applique pas à ce programme statistique.

Évaluation de la qualité

La qualité des produits statistiques, qui sont les fichiers couplés créés par couplage des autres données administratives ou d'enquête de base au Registre des entreprises (RE), est mesurée par la qualité de l'appariement. Des taux élevés d'appariement des enregistrements du RE aux autres sources de données indiquent une bonne qualité, tandis que des taux faibles dénotent une mauvaise qualité. Pour obtenir un taux d'appariement élevé, on effectue l'appariement dans l'Environnement de fichiers couplables - Entreprises (EFC-E) dans l'ordre suivant :

1. par numéro d'entreprise;
2. par numéro d'entreprise statistique;
3. par numéro d'établissement.

Les autres sources de données sont d'abord appariées au RE par numéro d'entreprise. On utilise ensuite le numéro d'entreprise statistique, puis le numéro d'établissement. Les enregistrements non appariés après ces trois étapes font l'objet d'un examen manuel où ils sont appariés au RE par nom d'entreprise, ou d'une consultation avec le personnel de la région où le fichier a été créé ou avec la Division du Registre des entreprises.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Si les données de base ou les méthodologies sont révisées, les données disponibles dans l'EFC-E le sont aussi. La dernière version de l'EFC-E inclurait donc des révisions émanant des sources. Les microdonnées utilisées dans l'Environnement de fichiers couplables - Entreprises ne sont pas désaisonnalisées.

Exactitude des données

Comme l'Environnement de fichiers couplables - Entreprises (EFC-E) est basé sur l'appariement de plusieurs micro-données administratives et d'enquête au Registre des entreprises, il ne produit pas d'estimations statistiques pour lesquelles des erreurs peuvent être fournies. Par contre l'EFC-E indique plutôt les taux d'appariements (99,90 % pour T2 IGRF en 2018), qui montrent la mesure dans laquelle les enregistrements des enquêtes ou des sources de données administratives sont appariés au Registre des entreprises.

Date de modification :