Enquête mensuelle sur les industries manufacturières (EMIM)

Information détaillée pour novembre 2019

Statut :

Active

Fréquence :

Mensuelle

Numéro d'enregistrement :

2101

L'Enquête mensuelle sur les industries manufacturières (EMIM) produit des séries statistiques sur l'activité de l'industrie manufacturière -- ventes de biens fabriqués, stocks, commandes en carnet, nouvelles commandes et le taux d'utilisation de la capacité.

Date de la parution - 21 janvier 2020

Aperçu

L'EMIM présente la valeur (en dollars courants canadiens) des ventes de biens fabriqués, des stocks, des commandes et des taux d'utilisation de la capacité.

Lors de la diffusion des données du 17 mars 2017, l'EMIM a publié la valeur réelle (déflation par les prix) des ventes de biens fabriqués, des commandes, des stocks possédés et le ratio des stocks aux ventes. Les données réelles selon les industries sont maintenant disponibles dans le tableau 16-10-0013-01.

Les données de cette enquête servent aux secteurs public et privé, ce qui comprend les ministères des gouvernements fédéraux et provinciaux, la Banque du Canada, Industrie Canada, le Système de comptabilité nationale, le monde de la fabrication, les experts-conseils et les organismes de recherche au Canada, aux États-Unis et à l'étranger de même que la presse d'affaires. Les données recueillies par l'EMIM tracent le « portrait » de la valeur des ventes de biens fabriqués, réalisées par le secteur manufacturier canadien et nous permettent d'analyser la situation de l'économie canadienne, ainsi que la santé d'industries spécifiques à court et à moyen termes.

Période de référence : mois

Période de collecte : La collecte des données débute environ 7 jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois civil en question.

Sujets

  • Fabrication
  • Machines, produits informatiques et électroniques

Sources de données et méthodologie

Population cible

Le Registre des entreprises de Statistique Canada a fourni la base de sondage pour l'EMIM. La population cible de l'EMIM comprend tous les établissements statistiques figurant au Registre des entreprises qui sont classés dans le secteur manufacturier (selon le SCIAN), lesquels sont catégorisés en plus de 156 industries. La base de sondage de l'EMIM est déterminée à partir de la population cible, après avoir enlevé les établissements faisant partie de la tranche inférieure de 10 % de l'estimation totale des ventes de biens fabriqués pour chaque cellule. Ces établissements ont été exclus de la base afin de réduire la taille de l'échantillon sans influer significativement sur la qualité.

Élaboration de l'instrument

Un questionnaire électronique et un questionnaire papier sont utilisés pour recueillir les données de l'EMIM. Les questionnaires ont été élaborés à Statistique Canada, puis examinés et mis à l'essai sur le terrain dans les deux langues officielles. À l'étape de l'élaboration de la nouvelle version de l'enquête, Statistique Canada a consulté un certain nombre de grands détaillants ainsi que des associations industrielles. En février 2016, on a ajouté le taux d'utilisation de la capacité au questionnaire de l'EMIM et le questionnaire est devenu disponible aux répondants en format électronique en mai 2017.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

L'échantillon de l'EMIM est un échantillon aléatoire formé de quelque 6 500 établissements.

Un nouvel échantillon a été choisi au cours de l'automne 2017, puis un essai parallèle a été réalisé sur une durée de six mois (du mois de référence de septembre 2017 au mois de référence de février 2018). L'échantillon renouvelé est officiellement devenu le nouvel échantillon de l'EMIM à partir de décembre 2017.

Cette étape marque le premier processus de renouvellement de l'échantillon de l'EMIM depuis 2012. Le processus consiste à faire en sorte que l'échantillon soit aussi récent et à jour que possible. Tous les établissements de l'échantillon sont renouvelés en tenant compte des changements dans la valeur de leurs ventes de biens fabriqués; les unités qui ne sont plus actives sont enlevées de l'échantillon et certaines petites unités sont remplacées par d'autres dans la partie de l'échantillon alors que d'autres s'alternent dans l'échantillon.

Avant la sélection, la base de sondage est subdivisée en cellules industrie-province. Selon le nombre d'établissements dans chaque cellule, on a regroupé au sein d'autres subdivisions (appelées strates) les établissements de taille similaire. Pour déterminer la taille d'un établissement, on s'est basé sur les chiffres les plus récents disponibles quant à la valeur du revenu annuelle du Registre des entreprises.

Chaque cellule industrie-province comporte une strate à tirage complet où on retrouve les établissements échantillonnés chaque mois avec certitude. Cette strate comprend les plus grandes entreprises statistiques, c'est-à-dire celles qui ont le plus d'impact sur les estimations d'une cellule industrie-province particulière. Ces grands établissements statistiques représentent environ 50 % de l'estimation nationale des ventes de biens fabriqués.

Chaque cellule industrie-province ne peut compter plus de deux strates à tirage partiel. Les établissements de ces strates n'ont pas tous à être échantillonnés avec certitude. On prélève un échantillon aléatoire sur les strates restantes. Un poids égal à l'inverse de la probabilité de sélection est attribué aux réponses de ces établissements échantillonnés. Au sein des cellules à tirage partiel, un échantillon doit être composé au minimum de 3 établissements.

La partie à tirage nul de l'échantillon est désormais estimée à partir des données administratives, ce qui fait que 100 % de l'environnement de l'échantillon est couvert. L'estimation de la partie à tirage nul a également permis d'améliorer l'efficacité puisqu'une partie à tirage nul plus importante a été délimitée et l'échantillon a pu être utilisé de manière plus efficace sur la plus petite partie échantillonnée de la base.

Sources des données

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

L'ensemble des établissements de l'échantillon est envoyé pour la collecte. La collecte des données est réalisée par les bureaux régionaux de Statistique Canada. Ces derniers envoient un questionnaire électronique ou en papier aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes, de leurs ventes électroniques, de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ 7 jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entreprises qui participent à l'enquête pour la première fois y sont introduites à l'aide de questions préliminaires qui confirment l'activité commerciale du répondant et ses coordonnées.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées.

Utilisation de données administratives:
La gestion du fardeau de réponse est un défi constant pour Statistique Canada. Afin de tenter de réduire le fardeau de réponse, particulièrement auprès des petites entreprises, l'EMIM dérive les données sur les ventes des établissements à faibles revenus des fichiers de la taxe sur les produits et services (TPS) en utilisant un estimateur par quotient. L'estimateur par quotient augmente aussi la précision de la portion de l'estimation déterminée au moyen de l'enquête. Pour en savoir plus sur estimateur par le quotient, veuillez consulter la section sur l'estimation.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

Les données sont analysées à l'intérieur de chaque cellule industrie-province. Les valeurs extrêmes sont inscrites sur une liste, pour qu'on puisse en faire un contrôle en fonction de l'ampleur de l'écart par rapport à la moyenne. On communique avec les répondants afin de vérifier les valeurs extrêmes. Les enregistrements qui sont rejetés à la vérification statistique sont considérés comme des valeurs aberrantes et ne servent pas au calcul des valeurs d'imputation.

Des valeurs d'imputation sont attribuées aux cas de non-réponse, pour les établissements qui n'ont pas répondu ou qui n'ont répondu que partiellement au questionnaire d'enquête. Diverses méthodes d'imputation (tendances des cellules industrie-province et des réponses antérieures) sont employées selon la variable exigeant le traitement. Après l'imputation, le personnel de l'EMIM effectue une vérification finale des réponses qui ont été imputées.

Imputation

Le processus d'imputation de l'EMIM a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMIM, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois méthodes d'imputation d'après des données historiques. La première est l'application d'une tendance générale qui s'appuie sur une source unique de données historiques (données recueillies pour le mois précédent, pour le mois suivant ou pour le même mois l'année précédente). La deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques. Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d'imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu'un seul établissement) ou complexe.

Estimation

L'estimation est le processus que Statistique Canada applique pour obtenir des valeurs se rapportant à la population d'intérêt afin de pouvoir tirer des conclusions sur cette population à partir d'information provenant d'un échantillon seulement de la population. L'EMIM utilise plus précisément un estimateur par quotient.

L'estimation par quotient consiste à remplacer les poids de sondage initiaux (définis comme étant l'inverse de la probabilité de sélection dans l'échantillon) par de nouveaux poids de façon à satisfaire les contraintes de calage. Le calage veille à ce que le total d'une variable auxiliaire estimé à partir de l'échantillon soit égal au total de cette même variable auxiliaire pour toute la population et que les nouveaux poids de sondage soient aussi proches que possible (selon une certaine mesure de distance) des poids de sondage initiaux.

Supposons, par exemple, que le total connu de la variable auxiliaire pour la population soit égal à 100 et que le total estimé soit égal à 90 si l'on se fonde sur un échantillon; nous obtenons donc une sous-estimation d'environ 10 %. Puisque nous connaissons le total de la variable auxiliaire pour la population, il serait raisonnable d'augmenter les poids des unités échantillonnées afin que l'estimation soit exactement égale à cette valeur. Puisque la variable d'intérêt est liée à la variable auxiliaire, il n'est pas déraisonnable de penser que l'estimation des ventes fondée sur les mêmes échantillons et poids que l'estimation de la variable auxiliaire puisse également être une sous-estimation d'environ 10 %. Si c'est en effet le cas, les poids ajustés pourraient donc permettre de produire un autre estimateur des ventes totales. Cet autre estimateur s'appelle l'estimateur par quotient.

L'estimateur par quotient essaie essentiellement de compenser les échantillons « malchanceux » et rapproche l'estimation du total réel. Le gain de variance dépendra de la solidité du lien entre la variable d'intérêt et les données auxiliaires.

La portion à tirage nul est prise en compte par l'estimateur par quotient. Cette prise en compte se fait en incluant simplement la portion à tirage nul dans les totaux de contrôle pour la portion échantillonnée. Cela augmente les poids de la portion échantillonnée de telle sorte que les estimations seront ajustées afin de prendre en compte la portion à tirage nul.

Les valeurs calculées des ventes pondérées sont additionnées selon le domaine, pour produire les estimations des ventes totales pour chaque combinaison de groupe industriel/région géographique. Un domaine est défini comme les valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage initiales parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps.

Pour le taux d'utilisation de la capacité, l'estimation pour un domaine donné nécessite d'abord le calcul de la production totale et la capacité de la production mensuelle et ensuite on divise la production totale par la capacité de la production mensuelle.

La variance est la mesure de précision utilisée dans le cas de l'EMIM pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible d'évaluer la variabilité de l'estimation de l'échantillon par rapport à sa valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à la valeur prévue.

Estimation des ventes par région métropolitaine de recensement

Les estimations des ventes pour douze régions métropolitaines de recensement (RMR) ont été dérivées en utilisant une technique d'estimation pour petits domaines (EPD) fondée sur le modèle des estimateurs de Fay-Herriot. Dans cette technique, un modèle décrivant le lien entre les ventes estimées provenant de l'EMIM et les ventes provenant des données sur la taxe sur les produits et services (TPS) à un niveau géographique précis est combiné avec les estimations traditionnelles obtenues à partir de l'échantillon de l'EMIM. Les estimations résultantes sont souvent significativement plus précises que les estimations pondérées traditionnelles de l'EMIM, particulièrement pour les régions où ces dernières sont moins fiables en raison de faibles tailles d'échantillon. Cette amélioration de la précision est obtenue par l'introduction d'hypothèses sur le modèle. Contrairement aux estimations traditionnelles de l'EMIM, les estimations de petits domaines peuvent ainsi être sujettes à des erreurs de spécifications du modèle qui peuvent résulter en biais. Pour limiter le risque de biais, une validation minutieuse du modèle a été faite avant la publication des estimations. Plus de détails concernant la méthodologie de l'EPD est disponible dans la documentation complémentaire.

Déflation des ventes de biens fabriqués, des commandes et des stocks manufacturiers

La variation des valeurs des données publiées dans le cadre de l'Enquête mensuelle sur les industries manufacturières (EMIM) peut être attribuable à l'évolution des prix ou des quantités mesurées, ou des deux. Pour analyser l'activité du secteur manufacturier, il est souvent souhaitable de séparer les variations causées par des changements de prix de celles causées par des changements des quantités produites. Cet ajustement est connu sous le nom de déflation.

La déflation consiste à diviser les valeurs aux prix courants obtenues grâce à l'enquête par des indices de prix pertinents afin d'obtenir des estimations évaluées aux prix d'une période antérieure, actuellement l'année 2012. On dit des valeurs finales qu'elles sont « aux prix de 2012 ». Il faut noter que l'expression « aux prix courants » désigne le moment où s'est déroulée l'activité et non le moment présent, ni le moment de la compilation.

Les estimations déflatées de l'EMIM reflètent les prix de 2012 qui constitue l'année de base. On a choisi l'année 2012 parce qu'elle correspond à l'année de base des indices de prix utilisés pour déflater les estimations de l'EMIM. L'utilisation des prix d'une année de base pour mesurer l'activité courante produit une mesure représentative du volume d'activité actuel par rapport à cette année de base. Les variations actuelles du volume ne se reflètent convenablement dans les mesures à prix constants que si l'importance relative actuelle des industries n'est pas très différente de celle observée pendant l'année de base.

La déflation des estimations de l'EMIM est effectuée à un niveau industriel très détaillé, équivalant aux classes à 6 chiffres du Système de classification des industries de l'Amérique du Nord (SCIAN). Pour chaque industrie à ce niveau, on utilise des indices de prix composites qui décrivent la fluctuation des prix des différents groupes de produits fabriqués par cette industrie.

Sauf quelques rares exceptions, les indices de prix sont des moyennes pondérées des indices des prix des produits industriels (IPPI). Les poids utilisés sont tirés des tableaux annuels des entrées-sorties du Canada et varient d'année en année. Comme les tableaux d'entrées-sorties sont publiés avec un retard d'environ deux ans et demi, les poids utilisés pour les plus récentes années sont fondés sur les tableaux d'entrées-sorties les plus récents.

On utilise le même indice de prix pour déflater les ventes de biens fabriqués, les nouvelles commandes et les commandes en carnet d'une industrie. Les poids servant à la compilation de cet indice de prix sont tirés des tableaux de sorties, évalués aux prix à la production. Les prix à la production sont les prix des produits à leur sortie de l'établissement de fabrication et ne comprennent pas des éléments tels que les frais de transport, les taxes, etc. Ainsi, l'indice de prix de chaque industrie reflète la production des établissements de l'industrie.

Les indices de prix qu'on utilise pour déflater les stocks de biens/travaux en cours de fabrication et les stocks de produits finis fabriqués d'une industrie sont des moyennes mobiles de l'indice de prix utilisé pour les ventes de biens fabriqués. En ce qui concerne les stocks de biens/travaux en cours de fabrication, le nombre de termes de la moyenne mobile correspond à la durée du processus de fabrication. On obtient la durée en calculant la moyenne, au cours des 48 mois précédents, du ratio entre les stocks de biens/travaux en cours de fabrication à la fin du mois et la production de l'industrie, cette dernière étant égale aux ventes de biens fabriqués additionnées des variations des stocks de biens/travaux en cours de fabrication et de produits finis fabriqués.

En ce qui a trait aux stocks de produits finis fabriqués, le nombre de termes dans la moyenne mobile reflète la durée pendant laquelle un produit fini demeure en stock. On obtient ce chiffre, connu sous le nom de période de rotation des stocks, en calculant la moyenne, au cours des 48 mois précédents, du ratio entre les stocks de produits finis fabriqués à la fin du mois et les ventes de biens fabriqués.

Pour déflater les stocks de matières premières et composantes, les indices de prix correspondant à la consommation des matières premières sont obtenus en tant que moyennes pondérées des IPPI. Les poids sont tirés des tableaux d'entrées évalués aux prix à la consommation, c'est-à-dire que ces prix comprennent les marges de gros, les frais de transport et les taxes, etc. L'indice de prix qui en découle reflète donc la structure des coûts des matières premières de chaque industrie.

Les stocks de matières premières et composantes sont ensuite déflatés à l'aide d'une moyenne mobile de l'indice de prix correspondant à la consommation des matières premières. Le nombre de termes de la moyenne mobile correspond au taux de consommation des matières premières. Le taux est calculé comme étant la moyenne, au cours des quatre années précédentes, du ratio entre les stocks de matières premières et composantes à la fin de l'année et les entrées intermédiaires de l'industrie.

La technique d'estimation permet à l'enquête de produire des estimations à partir du SCIAN. Les séries continueront également à faire l'objet d'un rapprochement avec l'EAMEF. Des estimations au niveau national seront produites pour toutes les variables, mais seulement les ventes de biens fabriqués seront produites au niveau provincial. Une mesure de la qualité (CV) sera également produite.

Évaluation de la qualité

Les séries finales de données sont soumises à des analyses rigoureuses qui incluent la comparaison avec les séries historiques et les comparaisons avec d'autres sources de données afin de faire ressortir les changements économiques de l'heure. L'information disponible des médias, d'autres organisations gouvernementales et des économistes chevronnés est aussi utilisée dans le processus de validation.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité porte sur la détection d'une divulgation directe possible, laquelle se produit lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou lorsque la cellule est dominée par quelques entreprises.

Révisions et désaisonnalisation

Parallèlement à l'élaboration des estimations préliminaires du mois courant, les estimations des trois mois précédents sont révisées pour tenir compte des réponses tardives. Les données sont révisées lorsqu'on reçoit des réponses tardives ou lorsqu'on a reçu antérieurement des réponses erronées.

Jusqu'en 2003 (inclusivement), l'Enquête mensuelle sur les industries manufacturières (EMIM) était étalonnée en fonction de l'Enquête annuelle sur les manufactures et l'exploitation forestière (EAMEF). L'étalonnage consistait en l'examen régulier des estimations de l'EMIM dans le cadre des données annuelles fournies par l'EAMEF. L'étalonnage réalignait le niveau annualisé de l'EMIM en fonction des dernières données annuelles vérifiées fournies par l'EAMEF.

En 2006-2007, Statistique Canada a mené une enquête importante pour déterminer s'il était judicieux de conserver le processus d'étalonnage. Les résultats ont indiqué que l'étalonnage des estimations de l'EMIM en fonction de l'EAMEF devrait cesser. Grâce au renouvellement de l'échantillon de l'EMIM en 2007, on a déterminé que l'étalonnage ne serait plus nécessaire (rétroactif à l'année 2004) puisque l'EMIM représentait depuis précisément 100 % de l'univers de l'échantillon. Le rapprochement entre les données de l'EMIM et l'EAMEF sera maintenu afin de résoudre d'éventuelles anomalies.

Depuis le mois de référence de décembre 2017, un nouvel échantillon a été introduit. La pratique normale veut qu'au bout de quelques années l'échantillon soit renouvelé afin de garantir que la base de sondage est à jour sur le plan des naissances, des décès et des autres changements relatifs à la population. L'échantillon renouvelé est lié au niveau détaillé pour empêcher les ruptures de données et pour s'assurer de la continuité de la série chronologique. Il est conçu de façon à mieux représenter l'industrie manufacturière aux échelles nationale et provinciale.

Les séries chronologiques économiques comportent les éléments essentiels à la description, l'explication et la prévision du comportement d'un phénomène économique. Ce sont des enregistrements statistiques de l'évolution des processus économiques dans le temps. L'observation par les économistes et les statisticiens de l'activité économique à l'aide des séries chronologiques a donc permis de distinguer quatre composantes principales du comportement de ces séries : le mouvement à long terme ou tendance, le mouvement cyclique, les variations saisonnières et les fluctuations irrégulières. Ces mouvements sont causés par différents facteurs, soit économiques, climatiques ou institutionnels. Les variations saisonnières sont les fluctuations périodiques plus ou moins régulières qui se produisent au cours d'une année en raison du cycle météorologique normal, des congés fixes et d'autres événements qui se répètent à intervalles avec une certaine régularité pour influencer de façon significative le taux d'activité économique.

Afin de favoriser l'interprétation exacte de l'évolution fondamentale d'un phénomène économique et de produire une meilleure prévision, Statistique Canada rajuste les séries chronologiques au moyen de la méthode de désaisonnalisation X12-ARMMI de façon à minimiser l'impact des variations saisonnières sur les séries. Cette technique consiste essentiellement à ajouter les estimations d'une année de données brutes à la fin de la série initiale avant de procéder à la désaisonnalisation proprement dite. Les données estimées proviennent de prévisions réalisées par des modèles ARMMI (modèles autorégressifs à moyennes mobiles intégrées) du type Box-Jenkins.

Le programme X12 fait surtout appel à la méthode de rapport aux moyennes mobiles pour effectuer le lissage de la série modifiée et obtenir une estimation provisoire de la tendance-cycle, calculer les rapports de la série initiale (ajustée) aux estimations de la tendance-cycle, et estimer les facteurs saisonniers à partir de ces dits rapports. Les facteurs saisonniers définitifs ne sont produits que lorsque ces opérations ont été exécutées à plusieurs reprises. La technique utilisée consiste essentiellement, dans un premier temps, à corriger la série initiale de toute sorte d'effets indésirables, tels l'effet des jours ouvrables et l'effet de Pâques, par un module appelé regARIMA.

L'estimation de ces effets se fait grâce à l'utilisation de modèles de régression à erreurs ARMMI. On peut également extrapoler la série d'au moins une année à l'aide du modèle. Dans un deuxième temps, la série brute, pré-ajustée et extrapolée s'il y a lieu, est désaisonnalisée par la méthode X-12.

Les étapes déterminant les facteurs saisonniers nécessaires au calcul des données désaisonnalisées finales sont exécutées à chaque mois. Cette approche garantit que la série non désaisonnalisée, à partir de laquelle sont calculées les estimations des facteurs saisonniers, inclut toutes les données les plus récentes relativement à ladite série, c.-à-d., les données non désaisonnalisées qui portent sur le mois courant et les données non désaisonnalisées révisées du mois précédent.

Bien que la désaisonnalisation permette de mieux comprendre la tendance-cycle fondamentale d'une série, la série désaisonnalisée n'en contient pas moins une composante irrégulière. De légères variations d'un mois à l'autre dans la série désaisonnalisée peuvent n'être que de simples mouvements irréguliers. Pour avoir une meilleure idée de la tendance fondamentale, les utilisateurs doivent donc examiner les séries désaisonnalisées d'un certain nombre de mois.

Les séries de données agrégées au niveau du Canada sont maintenant désaisonnalisées de façon directe, ce qui signifie que les totaux désaisonnalisés sont obtenus au moyen de X12 ARMMI. Ces totaux sont ensuite utilisés pour réconcilier les séries de totaux provinciaux qui ont été désaisonnalisés séparément au préalable.

Pour ce qui est des autres séries agrégées, on a utilisé la désaisonnalisation indirecte. En d'autres mots, leurs totaux désaisonnalisés sont dérivés de façon indirecte en faisant la somme des genres de commerce désaisonnalisés séparément au préalable.

Tendance
Une série désaisonnalisée peut montrer encore les effets d'irrégularités et de circonstances spéciales ; et cela peut masquer la tendance. La tendance à court terme montre la direction prise dans une série désaisonnalisée en affectant une moyenne à travers les mois de sorte que ces mouvements irréguliers soient aplanis. Le résultat est une série plus stable. La tendance pour le dernier mois apparaît sous réserve de rectification, car les valeurs des mois à venir sont incluses dans le calcul de la moyenne.

Exactitude des données

Bien que des efforts considérables aient été déployés pour que toutes les opérations de collecte et de traitement obéissent à des normes élevées, les estimations obtenues sont inévitablement entachées, jusqu'à un certain point, d'erreurs non dues à l'échantillonnage. Ces erreurs ne sont pas liées à l'échantillonnage et peuvent survenir pour différentes raisons. La non-réponse, par exemple, est une source importante d'erreurs non dues à l'échantillonnage. La couverture de la population, les écarts dans l'interprétation des questions ainsi que et les erreurs de consignation, de codage et de traitement des données représentent d'autres exemples d'erreurs non liées à l'échantillonnage.

Les erreurs non liées à l'échantillonnage sont contrôlées par la conception minutieuse du questionnaire, par l'utilisation d'un nombre minime de concepts simples et par des vérifications de la cohérence. Des mesures telles que les taux de réponse sont utilisées comme indicateurs de l'étendue potentielle des erreurs non dues à l'échantillonnage.

Le taux moyen pondéré de réponse de l'EMIM en ce qui concerne les données recueillies sur les ventes de biens fabriqués au niveau national est entre 94 % et 96 % en 2017. Le tableau 2 du document « Concepts, définitions et qualité des données » indique les taux pondérés de réponse et de vérification ainsi celui d'imputation pour les données recueillies ainsi que pour la portion à tirage nul des données basées sur la TPS des cinq éléments suivants : ventes de biens fabriqués, stocks de matières premières et composantes, stocks de biens/travaux en cours de fabrication, stocks de produits finis fabriqués, commandes en carnet et taux d'utilisation de la capacité.

L'erreur type (ou l'écart type) de l'estimation peut servir à mesurer l'erreur d'échantillonnage. Le coefficient de variation (CV) représente l'erreur type estimée de l'estimation de l'enquête. Les estimations comprenant un CV de moindre importance sont plus fiables que les estimations dont le CV est plus élevé. Le tableau 1 du document « Concepts, définitions et qualité des données » indique les CV nationaux des cinq éléments suivants: ventes de biens fabriqués, stocks de matières premières et composantes, stocks de biens/travaux en cours de fabrication, stocks de produits finis fabriqués commandes en carnet et taux d'utilisation de la capacité.

Évaluation de l'erreur d'échantillonnage et de l'erreur non liée à l'échantillonnage

1. Évaluation de l'erreur d'échantillonnage
L'échantillon utilisé aux fins de la présente enquête est un des nombreux échantillons de même taille qui auraient pu être choisis selon le même plan et les mêmes conditions. Si chaque échantillon pouvait faire l'objet d'une enquête menée essentiellement dans les mêmes conditions, il faudrait s'attendre à ce que l'estimation calculée varie d'un échantillon à l'autre.

On nomme valeur probable l'estimation moyenne obtenue de tous les échantillons possibles. Autrement dit, la valeur probable est celle qu'on obtiendrait en recensant toute la population dans des conditions identiques de collecte et de traitement. Une estimation calculée à partir d'une enquête par échantillonnage est dite précise lorsqu'elle s'approche de la valeur probable.

Les estimations fondées sur un échantillon peuvent ne pas correspondre à la valeur probable. Cependant, comme les estimations proviennent d'un échantillon probabiliste, il est possible d'en mesurer la variabilité par rapport à leur valeur probable. La variance d'une estimation, qui en mesure la précision, se définit comme la moyenne, parmi tous les échantillons possibles, des carrés de la différence entre l'estimation et la valeur probable.

Une fois qu'on a calculé l'estimation et sa variance, il devient possible de calculer d'autres mesures de précision. Par exemple, l'erreur-type, soit la racine carrée de la variance, mesure l'erreur d'échantillonnage dans la même unité que l'estimation (en dollars, notamment). Autrement dit, l'erreur-type mesure la précision en termes absolus. Par contre, le coefficient de variation, c'est-à-dire l'erreur-type divisée par l'estimation, mesure la précision en termes relatifs. Ainsi, l'emploi du coefficient de variation facilite la comparaison de l'erreur d'échantillonnage de deux estimations.

Dans cette publication, on utilise le coefficient de variation pour évaluer l'erreur d'échantillonnage des estimations. Cependant, puisque le coefficient de variation publié pour cette enquête est calculé à partir des réponses des unités, il mesure aussi une certaine erreur non liée à l'échantillonnage.

2. Évaluation de l'erreur non liée à l'échantillonnage
L'enquête par échantillonnage et le recensement cherchent tous deux à déterminer la valeur exacte de l'ensemble. L'estimation est dite précise si elle se rapproche de cette valeur. Bien qu'il s'agisse d'une valeur souhaitable, il n'est pas réaliste de supposer que la valeur exacte de chaque unité de l'ensemble ou de l'échantillon peut être obtenue et traitée sans erreur. La différence entre la valeur probable et la valeur exacte de l'ensemble s'appelle le biais. On ne peut calculer les biais systématiques des données en recourant aux mesures de probabilité de l'erreur d'échantillonnage décrites auparavant. La précision d'une estimation est déterminée par l'effet conjugué des erreurs d'échantillonnage et des erreurs non liées à l'échantillonnage.

Les types d'erreur non liée à l'échantillonnage dans l'EMIM comprennent l'erreur due à la non-réponse, l'erreur d'imputation et l'erreur due à la vérification. Afin d'aider l'utilisateur à évaluer ces types d'erreur, le tableau explicatif 2 présente les taux pondérés correspondants. Voici un exemple qui illustre ce qu'est un taux pondéré. Supposons que le taux de réponse d'une cellule comportant un échantillon de 20 unités dont cinq répondent lors d'un mois donné atteint 25 %. Si les cinq unités déclarantes représentent 8 millions de dollars sur l'estimation globale de 10 millions de dollars, le taux de réponse pondéré s'élève à 80 %.

Les taux pondérés mentionnés dans le tableau explicatif 2 se définissent comme suit : le taux de réponse et de vérification pondéré est le pourcentage de l'estimation globale d'un élément qui est basé sur des données déclarées, incluant les données qui furent vérifiées; le taux d'imputation pondéré est le pourcentage de l'estimation globale d'un élément qui est imputé; le taux de données TPS pondéré est le pourcentage de l'estimation globale d'un élément qui est dérivé des fichiers sur la Taxe sur les Produits et Services ; le taux de partie à tirage nul pondéré est le pourcentage de l'estimation globale d'un élément qui est modelé à partir de données administratives.

Interprétation simultanée des mesures d'erreur

Il faut tenir compte simultanément de la mesure d'erreurs non liées à l'échantillonnage ainsi que du coefficient de variation pour avoir un aperçu de la qualité des estimations. Plus le coefficient de variation sera bas et que le taux de réponse pondéré sera élevé, meilleure sera l'estimation publiée.

Dans le cas des estimations des ventes par RMR, la qualité des estimations est mesurée à partir d'une variance globale qui tient compte à la fois de la variance due à l'échantillonnage, de la variance due à l'imputation et de l'erreur quadratique moyenne du modèle d'EPD. Plus de détails concernant la qualité des estimations des ventes par RMR est disponible dans la documentation complémentaire.

Date de modification :