Enquête annuelle sur les industries manufacturières et de l'exploitation forestière (EAMEF)

Information détaillée pour 2016

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

2103

Cette enquête recueille les renseignements en matière de finances et de produits qui servent à établir les statistiques des secteurs de la fabrication et de l'exploitation forestière au Canada.

Date de la parution - Prevue pour le...

Aperçu

L'Enquête annuelle sur les industries manufacturières et de l'exploitation forestière (EAMEF) est une enquête des secteurs de la fabrication et de l'exploitation forestière au Canada. Elle est destinée à couvrir tous les établissements dont l'activité principale est la fabrication ou l'exploitation forestière ainsi que certains bureaux de vente et entrepôts se rattachant à ces établissements.

Les données recueillies incluent les principales statistiques industrielles (revenus, salaires et traitements, coût des matières premières et fournitures utilisées, coût en énergie et en approvisionnement en eau, stocks, etc.), ainsi que des renseignements au sujet des produits fabriqués et consommés. Les données recueillies auprès des entreprises sont regroupées avec l'information provenant d'autres sources pour produire des estimations officielles de la production économique nationale et provinciale pour cette industrie. L'Enquête annuelle sur les industries manufacturières et de l'exploitation forestière contenue supplémentaire (EAMEFCS) recueille de l'information détaillée sur les marchandises fabriquées et consommées dans la fabrication de produits sur le bois résineux. Ces informations comprennent les quantités et les valeurs des matériaux achetés et vendus.

Les données recueillies par l'Enquête annuelle sur les industries manufacturières et de l'exploitation forestière sont importantes, car elles aident en mesurant la production des secteurs de la fabrication et des ressources primaires au Canada, en plus de fournir un indice de la bonne santé de chaque industrie faisant l'objet de l'enquête et de sa contribution à l'économie canadienne. Au sein de Statistique Canada, les données sont utilisées par le Système de comptabilité nationale du Canada, l'Enquête mensuelle sur les industries manufacturières (numéro d'enregistrement 2101) et les programmes de la Division des prix. Les données sont également utilisées par le monde des affaires, les associations commerciales, les ministères fédéraux et provinciaux, ainsi que les organisations et associations internationales dans le but de tracer un profil des secteurs de la fabrication et de l'exploitation forestière, d'entreprendre des études de marché, de prévoir la demande et de mettre sur pied des politiques en matière de droit tarifaire et de commerce.

Activité statistique

L'enquête est menée dans le cadre du Programme intégré de la statistique des entreprises (PISE). Le PISE a été conçu pour intégrer les quelques 200 enquêtes auprès des entreprises dans un même programme d'enquête principal. Le PISE vise à recueillir des données sur les industries et les produits à l'échelle provinciale, tout en évitant les chevauchements entre les différents questionnaires d'enquête. Les questionnaires d'enquête sur les entreprises ainsi restructurés ont une présentation, une structure et un contenu harmonisé.

L'approche intégrée rend la déclaration plus facile pour les entreprises ayant des activités dans différentes industries, puisqu'elles peuvent ainsi fournir des renseignements similaires pour chaque succursale. Elles n'ont ainsi pas à remplir des questionnaires dont la présentation, la formulation et même les concepts changent d'une industrie à l'autre. Les résultats combinés donnent des statistiques économiques plus cohérentes et précises.

Période de référence : La période de déclaration correspond à l'exercice financier de 12 mois se terminant entre le 1er avril de l'année de référence et le 31 mars de l'année suivante.

Période de collecte : De avril à septembre suivant l'année de référence.

Sujets

  • États financiers et rendement
  • Fabrication
  • Rendement des entreprises et appartenance

Sources de données et méthodologie

Population cible

La population cible de l'EAMEF inclut tous les établissements dont l'activité principale est la fabrication ou l'exploitation forestière. À compter de l'année de référence 2013, la classification de l'industrie est basée sur le système de classification des industries de l'Amériques du Nord (SCIAN) 2012. En vertu du Système de classification des industries de l'Amérique du Nord (SCIAN), les établissements forestiers sont classés dans SCIAN 1133 et les établissements manufacturiers dans les secteurs SCIAN 31, 32 et 33.

La population cible de l'EAMEFS (contenue supplémentaire) est un sous-ensemble de l'enquête EAMEF. Celle-ci comprend tous les établissements oeuvrant dans la fabrication de produits couverts dans le cadre de l'accord sur le bois d'oeuvre 2006 entre le Canada et les Etats-Unis.

Élaboration de l'instrument

Les questionnaires d'enquêtes contiennent des modules génériques qui ont été conçus pour couvrir tous les secteurs manufacturiers et l'exploitation forestière. Ces modules incluent des renseignements reliés aux revenus, aux dépenses, et à l'effectif. Les questionnaires incluent également des modules propres à l'industrie et aux activités faisant l'objet de l'enquête dont le but est d'obtenir des caractéristiques financières et autres qui se rapportent particulièrement à cette industrie.

Afin de réduire le fardeau de réponse, les petites entreprises reçoivent un questionnaire (version abrégée) portant sur les caractéristiques propres à leur industrie et qui ne comprend pas les modules portant sur les revenus et les dépenses. Cette version abrégée est conçue pour recueillir des données caractéristiques financières et non financières alors que les données portant sur les revenus et dépenses sont tirées des fichiers administratifs.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

Sources des données

Collecte des données pour cette période de référence : 2017-04-21 à 2017-08-31

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

Les données sont recueillies principalement à l'aide d'un questionnaire électronique, tout en offrant la possibilité de recevoir un questionnaire papier, répondre par entrevue téléphonique ou par d'autres méthodes de production électronique. Un suivi sur les non-réponses et pour la validation des données est effectué par téléphone ou télécopieur.

Données administratives
Une stratégie de remplacement des données d'enquête par des données fiscales a été instaurée afin de réduire le fardeau du répondant et les coûts d'enquête. Cette stratégie consiste à utiliser des données fiscales plutôt que des données d'enquête pour certaines unités simples (p. ex., un seul emplacement et une seule activité). Dans le cadre du Programme intégré de la statistique des entreprises (PISE), on utilise les données fiscales des formulaires T1 pour les entreprises non constituées en société et celles des formulaires T2 pour les entreprises constituées en société. Le remplacement de données peut être utilisé afin de corriger des données aberrantes, remplacer des données manquantes soit partielles ou complètes. Les données fiscales peuvent également servir à la réconciliation des données d'enquêtes.

L'intégration des données combine les données de multiples sources de données, y compris les données d'enquête recueillies auprès des répondants, les données administratives de l'Agence du revenu du Canada et d'autres formes de données auxiliaires, le cas échéant. Au cours du processus d'intégration, les données sont importées, transformées, validées, agrégées et couplées à partir des différents fournisseurs de données selon les formats, les structures et les niveaux requis pour être traitées par le PISE. Les données administratives sont utilisées dans le cadre d'une stratégie de remplacement des données pour un grand nombre de variables financières concernant la plupart des petites et moyennes entreprises, ainsi qu'un groupe restreint de grandes entreprises, afin d'éviter la collecte de ces variables. Les données administratives sont également utilisées comme source de données auxiliaire pour l'édition et l'imputation lorsqu'il manque des données sur les répondants.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

La détection des erreurs fait partie intégrante des activités de collecte et de traitement des données. Des règles de validation automatisées sont appliquées aux enregistrements de données durant la collecte afin de repérer les erreurs de déclaration et de saisie. Ces règles permettent de repérer les erreurs potentielles d'après les variations d'une année à l'autre des variables clés, des totaux et des ratios qui dépassent les seuils de tolérance, ainsi que les problèmes de cohérence des données recueillies (p. ex., le total d'une variable n'est pas égal à la somme de ses parties). D'autres règles de validation sont utilisées durant le traitement des données afin de détecter automatiquement les erreurs ou les incohérences qui subsistent après la collecte. Ces règles comprennent les contrôles de valeurs (p. ex. Valeur > 0, Valeur > -500, Valeur = 0), les contrôles d'égalité linéaire (p. ex. Valeur1 + Valeur2 = Valeur Totale), les contrôles d'inégalité linéaire (p. ex. Valeur1 >= Valeur2) et les contrôles d'équivalence (p. ex. Valeur1 = Valeur2). Les erreurs repérées peuvent être corrigées en suivant le processus de suivi des questionnaires rejetés au contrôle durant la collecte ou par imputation. Les valeurs extrêmes sont aussi signalées comme étant des valeurs aberrantes, à l'aide de méthodes automatisées fondées sur la distribution des renseignements recueillis. Les valeurs détectées font ensuite l'objet d'un examen visant à en évaluer la fiabilité. L'examen manuel d'autres unités peut entraîner la détection d'autres valeurs aberrantes. Ces valeurs sont exclues du calcul des ratios et des tendances utilisés pour l'imputation et durant l'imputation par donneur. En général, tous les efforts ont été déployés pour réduire les erreurs non dues à l'échantillonnage, à savoir les erreurs d'omission, de dédoublement, de classification erronée, de déclaration et de traitement.

Imputation

En cas de non-réponse ou de réponses incomplètes au questionnaire ou lorsque les données déclarées sont considérées comme incorrectes aux étapes de la détection des erreurs, on utilise l'imputation pour compléter ou corriger les renseignements. De nombreuses méthodes d'imputation peuvent être utilisées pour compléter un questionnaire, y compris les modifications manuelles apportées par un analyste. Les techniques statistiques automatisées employées pour imputer les données manquantes comprennent : l'imputation déterministe, le remplacement par des données historiques (avec calcul de tendance, s'il y a lieu), le remplacement par des renseignements auxiliaires obtenus auprès d'autres sources, le remplacement fondé sur les relations connues entre les données pour l'unité échantillonnée et le remplacement par des données tirées d'une unité semblable de l'échantillon (appelé imputation par donneur). En général, on commence par imputer les variables clés, qu'on utilise ensuite aux étapes subséquentes pour imputer d'autres variables connexes.

L'imputation permet de produire un fichier de micro données complet et cohérent qui couvre toutes les variables d'enquête.

Estimation

L'échantillon utilisé pour l'estimation résulte d'un processus d'échantillonnage à deux phases. Un poids d'échantillonnage initial (le poids déterminé par le plan d'échantillonnage) est calculé pour chaque unité de l'enquête et correspond simplement à la multiplication de l'inverse de la probabilité de sélection à chaque phase qui est conditionnelle à la taille d'échantillon réalisé. Le poids calculé pour chaque unité d'échantillonnage indique combien d'autres unités elle représente. Les poids finaux sont habituellement égaux ou supérieurs à un. Les unités d'échantillonnage à tirage complet ont un poids d'échantillonnage de un et ne représentent qu'elles-mêmes.

L'estimation des totaux se fait à l'aide d'une simple agrégation des valeurs pondérées de toutes les unités d'estimation qui se trouvent dans le domaine d'estimation. Les estimations sont calculées pour plusieurs domaines d'estimation tels que les groupes industriels et les provinces ou territoires, en se fondant sur les données de classification les plus récentes disponibles pour l'unité d'estimation et la période de référence de l'enquête. Il est à noter que ces données de classification peuvent différer de la classification d'échantillonnage initiale parce que la taille, l'industrie ou l'emplacement pourraient avoir changé dans les enregistrements. Les changements de classification sont immédiatement pris en compte dans les estimations.

La répartition des données est nécessaire lorsque certaines entreprises déclarent leurs données en regroupant un grand nombre d'unités situées dans plus d'une province ou territoire ou appartenant à plus d'une catégorie industrielle dans la classification. Les facteurs fondés sur l'information provenant de sources telles que les fichiers de données fiscales et les profils du Registre des entreprises sont utilisés afin de répartir les données déclarées dans le rapport combiné entre les différentes unités d'estimation où l'entreprise exerce ses activités. On utilise les caractéristiques des unités d'estimation pour dériver les domaines d'estimation, y compris la classification des industries et la géographie.

Les unités dont la taille est plus grande que prévu sont considérées comme étant mal classées et leur poids est ajusté afin qu'elles ne représentent qu'elles-mêmes (les grandes unités se retrouvant dans une strate de petites unités, par exemple).

Les poids peuvent être modifiés et corrigés au moyen des renseignements à jour tirés des données fiscales. On utilise une technique statistique appelée calage pour ajuster l'ensemble final de poids de manière à ce que l'échantillon représente le plus fidèlement possible les données fiscales de la population de l'industrie.

Dans le cas de la partie non admissible pour l'échantillonnage (également appelée partie à tirage nul) de la population cible, les informations auxiliaires disponibles (telles que les données fiscales connexes) sont simplement regroupées pour obtenir une estimation. Si une estimation est nécessaire et que les informations auxiliaires ne sont pas disponibles pour une variable particulaire, la modélisation utilisant d'autres données auxiliaires connues est effectuée afin de créer des données pour chaque unité dans la partie à tirage nul. Ceux-ci sont simplement agrégés pour produire l'estimation. L'estimation globale inclut les estimations à la fois de la partie étudiée et de la partie à tirage nul.

Évaluation de la qualité

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité. Il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement pour les grandes entreprises), de la conjoncture économique générale, de la cohérence avec les résultats de l'indicateur économique connexe, des tendances historiques et des renseignements d'autres sources externes (p. ex., associations, publications spécialisées, articles de journaux).

Les estimations de l'enquête sont aussi analysées avec les tendances observées dans les séries de données connexes de Statistique Canada (p. ex., Enquête mensuelle sur les industries manufacturières (enregistrement no 2101), enquêtes infra-annuelles sur les produits manufacturés).

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir la divulgation d'information, l'analyse de la confidentialité des variables financières et de marchandises est effectuée au moyen du Système G-CONFID. G-CONFID est utilisé pour l'analyse primaire de la confidentialité ainsi que pour la suppression secondaire (divulgation par recoupement). La divulgation directe ou la confidentialité primaire peut se produire lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou lorsque la cellule est dominée par quelques entreprises. La divulgation par recoupement peut se produire lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Les données annuelles les plus récentes font l'objet d'une politique de révision d'une année.

Exactitude des données

Toutes les enquêtes sont sujettes aux erreurs d'échantillonnage et aux erreurs non dues à l'échantillonnage. Les erreurs d'échantillonnage se produisent parce que les estimations proviennent d'un échantillon de la population plutôt que de la population entière. Les erreurs non dues à l'échantillonnage ne sont pas liées à l'échantillonnage et peuvent survenir pour différentes raisons au cours de la collecte et du traitement des données. La non-réponse, par exemple, est une source importante d'erreurs non dues à l'échantillonnage. Le sous dénombrement ou le surdénombrement de la population, les écarts dans l'interprétation des questions ainsi que les erreurs d'enregistrement, de codage et de traitement des données sont d'autres exemples d'erreurs non dues à l'échantillonnage. Dans la mesure du possible, ces erreurs sont réduites au minimum par la conception minutieuse du questionnaire d'enquête, la vérification des données de l'enquête et le suivi auprès des non-répondants afin de maximiser les taux de réponse.

Des mesures de l'erreur d'échantillonnage sont calculées pour chaque estimation. De plus, lorsqu'il y a de la non-réponse, celle-ci est prise en compte et la qualité est réduite en fonction de son importance dans l'estimation. Sont aussi fournis d'autres indicateurs de la qualité tels que le taux de réponse.

L'erreur d'échantillonnage et le taux de non-réponse sont combinés en un seul code d'évaluation de la qualité. Ce code utilise les lettres de A à F où A indique que les données sont d'excellente qualité et F signifie qu'elles ne sont pas fiables. Les estimations de qualité F ne sont pas publiées. Ces codes d'évaluation de la qualité peuvent être demandés et doivent toujours être pris en considération.

Les indicateurs de qualités indiquent ce qui suit : A - Excellent ; B - Très bon; C - Bon; D - Acceptable; E - À utiliser avec prudence; F - Trop peu fiable pour être publié.

Date de modification :