Enquête mensuelle sur le commerce de gros (EMCG)
Information détaillée pour avril 2018
Statut :
Active
Fréquence :
Mensuelle
Numéro d'enregistrement :
2401
Cette enquête fournit des renseignements sur le rendement du secteur du commerce de gros, et lorsqu'ils sont combinés à d'autres statistiques, constituent un indicateur important de l'économie canadienne.
Date de la parution - 21 juin 2018
- Questionnaire(s) et guide(s) de déclaration
- Aperçu
- Sources de données et méthodologie
- Exactitude des données
- Documentation
Aperçu
Cette enquête fournit des renseignements sur le rendement du secteur du commerce de gros et constitue un indicateur important de la santé de l'économie canadienne. Le milieu des affaires utilise aussi les données pour analyser le comportement du marché.
Cette enquête fournit des estimations mensuelles des ventes et des stocks des marchands en gros pour le Canada, ainsi que pour chaque province et territoire.
Divers organismes, associations sectorielles et administrations publiques utilisent l'information tirée de cette enquête. Les données de l'enquête aident les administrations publiques à comprendre le rôle des grossistes dans l'économie (de 5 % à 6 % du produit intérieur brut, selon l'année), ce qui facilite l'élaboration des politiques et des encouragements fiscaux.
Période de référence : Mois
Période de collecte : La collecte des données commence environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.
Sujets
- Commerce de détail et de gros
- Ventes et stocks de grossistes
Sources de données et méthodologie
Population cible
La population cible de l'Enquête mensuelle sur le commerce de gros comprend tous les établissements statistiques figurant dans le Registre des entreprises (RE) qui sont classés dans le secteur du commerce de gros conformément au Système de classification des industries de l'Amérique du Nord (SCIAN 2017).
Le RE est une liste structurée d'entreprises productrices de biens et de services au Canada.
L'établissement statistique constitue le niveau contenant toutes les données comptables requises pour mesurer la production. L'établissement, en tant qu'unité statistique, est défini comme l'unité la plus homogène de production pour laquelle l'entreprise tient des documents comptables. À partir de ces documents, il est possible de regrouper tous les éléments de données requis pour compiler la structure complète de la valeur brute de la production (ventes totales ou expéditions et stocks), du coût du matériel et des services, et de la main-d'oeuvre et du capital utilisés aux fins de production. Toutefois, en délimitant l'établissement, il est possible de regrouper les unités de production. Un établissement comprend au moins un emplacement, mais peut aussi en avoir plusieurs. Les établissements peuvent aussi faire référence à des centres de profit.
Le SCIAN est le cadre commun reconnu pour la production de statistiques comparables par les organismes statistiques du Canada, du Mexique et des États-Unis. Le SCIAN est fondé sur un cadre conceptuel axé sur la production, ou l'offre. La fourchette de codes du SCIAN pour le secteur du commerce de gros varie de 410000 à 419999.
Sont exclus de la population cible les établissements pour lesquels les signaux économiques indiquent un revenu manquant ou nul, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :
- 41112 (grossistes-marchands de graines oléagineuses et de grains céréaliers)
- 412 (grossistes-marchands de pétrole et de produits pétroliers)
- 419 (commerce électronique de gros entre entreprises, et agents et courtiers)
Élaboration de l'instrument
Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de grossistes des données sur les ventes en gros, sur le nombre d'emplacements d'affaires, selon la province ou le territoire, et sur les biens en stocks et les biens destinés à la revente.
Échantillonnage
Il s'agit d'une enquête transversale par échantillon.
Le Registre des entreprises est une base de données sur la population des entreprises canadiennes. Statistique Canada l'a créé principalement pour établir les bases de sondage de ses enquêtes économiques. Il a été conçu de manière à faciliter la coordination de la couverture des enquêtes auprès des entreprises ainsi qu'à uniformiser la classification des unités statistiques déclarantes. Le registre permet également de rassembler des données démographiques sur les entreprises.
Les principales données recueillies dans le cadre du programme d'enquêtes de Statistique Canada ainsi que les fichiers du numéro d'entreprise de l'Agence de revenu du Canada (ARC) sont les principales sources d'information du Registre des entreprises. Grâce aux données administratives de l'ARC, on peut créer l'univers de toutes les entités commerciales.
Les données fournies dans les produits de cette enquête font état du nombre d'emplacements statistiques, selon l'activité (Système de classification des industries de l'Amérique du Nord), les codes de classification géographique et les tranches d'effectif.
Sources des données
Il s'agit d'une enquête à participation obligatoire.
Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.
La collecte des données est réalisée par les bureaux régionaux de Statistique Canada. Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des cas de non-réponse. La collecte des données commence environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.
Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d'informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.
Beaucoup d'efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées comprennent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs la façon d'aborder les répondants qui refusent de participer à l'enquête.
Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.
Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte des données de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.
Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement attribués au même intervieweur chaque mois. L'intervieweur peut ainsi établir une relation personnelle avec le répondant et renforcer la confiance de ce dernier.
Sources de données administratives :
Réduire le fardeau de réponse est un continuel défi pour Statistique Canada. Afin d'alléger le fardeau de réponse et de réduire les coûts reliés à l'enquête, notamment en ce qui a trait aux petites entreprises, les chiffres de ventes pour ces établissements sont dérivés à partir des fichiers de la TPS en utilisant un estimateur par le quotient. Cet estimateur permet également d'améliorer la précision des estimations provenant de la partie sondée.
Pour en savoir plus sur l'utilisation des données administratives, veuillez consulter le document intitulé « Enquête mensuelle sur le commerce de gros : Utilisation de données administratives ».
Les stocks des entreprises dont les ventes sont tirées du fichier de la TPS sont dérivés au moyen du système d'imputation de l'Enquête mensuelle sur le commerce de gros. Le système d'imputation se rapporte aux chiffres du mois précédent, aux variations d'un mois à l'autre et d'une année à l'autre, pour des entreprises sondées de même taille.
Voir le(s) Questionnaire(s) et guide(s) de déclaration .
Détection des erreurs
La vérification des données est effectuée au moyen de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'Enquête mensuelle sur le commerce de gros, les données sont vérifiées à deux moments distincts.
Premièrement, une vérification est faite durant la collecte des données. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples.
Tout enregistrement de données rejeté lors des contrôles provisoires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validées, les données recueillies sont transmises de façon régulière au bureau central, à Ottawa.
Deuxièmement, après la collecte, les données sont soumises à une vérification statistique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs aberrantes très élevées risquant de perturber une tendance mensuelle ne pourront servir de base à l'étape de l'imputation. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.
Les contrôles sont fondés sur la méthode d'Hidiroglou-Berthelot qui consiste à analyser le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. le dernier mois ou le même mois de l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui a trait au groupe industriel ou à la région géographique, la réponse est considérée comme étant une valeur extrême. Les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios).
Imputation
Le processus d'imputation de l'Enquête mensuelle sur le commerce de gros (EMCG) a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations sont de grande qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.
Dans le cas de l'EMCG, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.
Il existe trois méthodes d'imputation d'après des données historiques. La première est l'utilisation d'une tendance générale fondée sur une source unique de données historiques (données recueillies pour le mois précédent, pour le mois suivant ou pour le même mois de l'année précédente). La deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois de l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes pour un non-répondant par des données historiques. Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de la meilleure qualité possible. Le troisième type de méthode d'imputation historique est toujours la dernière option envisagée pour chaque mois de référence.
La méthode d'imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (p. ex. les entreprises ne comptant qu'un seul établissement) ou plus complexe.
Estimation
L'estimation est un processus qui permet à Statistique Canada d'obtenir des valeurs pour la population d'intérêt et de tirer des conclusions sur cette population à partir de l'information obtenue auprès d'un échantillon seulement de la population. Plus précisément, la technique utilisée dans le cadre de l'Enquête mensuelle sur le commerce de gros (EMCG) est l'estimation par le quotient.
L'estimation par le quotient consiste à remplacer les poids de sondage initiaux (définis comme étant l'inverse de la probabilité de sélection dans l'échantillon) par de nouveaux poids de façon à satisfaire des contraintes de calage (le total d'une variable auxiliaire estimé à partir de l'échantillon doit être égal au total de cette même variable auxiliaire obtenu à partir de toutes les unités de la population) et de sorte que ces nouveaux poids de sondage soient aussi proches que possible (selon une certaine mesure de distance) des poids de sondage initiaux.
Supposons, par exemple, que le total connu de la variable auxiliaire pour la population soit égal à 100 et qu'il soit estimé à 90 en se fondant sur un échantillon, ce qui donne une sous-estimation d'environ 10 %. Puisque le total de la variable auxiliaire pour la population est connu, il serait raisonnable d'augmenter les poids des unités échantillonnées afin que l'estimation soit exactement égale à cette valeur. Puisque la variable d'intérêt est liée à la variable auxiliaire, il n'est pas déraisonnable de penser que l'estimation des ventes fondée sur le même échantillon et les mêmes poids que l'estimation de la variable auxiliaire puisse également représenter une sous-estimation d'environ 10 %. Si c'est en effet le cas, les poids ajustés pourraient donc permettre de produire un autre estimateur des ventes totales. Cet autre estimateur s'appelle l'estimateur par le quotient.
L'estimateur par le quotient permet essentiellement de compenser les échantillons « malchanceux » et de rapprocher l'estimation du total réel. Le gain de variance dépendra de la solidité du lien entre la variable d'intérêt et les données auxiliaires.
La portion à tirage nul est prise en compte par l'estimateur par le quotient. Cette prise en compte se fait en incluant simplement la portion à tirage nul dans les totaux de contrôle pour la portion échantillonnée, ce qui permet d'augmenter les poids de la portion échantillonnée de telle sorte que les estimations seront ajustées afin de prendre en compte la portion à tirage nul.
Les valeurs pondérées des ventes ainsi calculées sont totalisées, selon le domaine, pour produire une estimation du total des ventes pour chaque combinaison groupe industriel/région géographique ainsi que du total des stocks pour chaque groupe industriel. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le Registre des entreprises pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au fil du temps.
Ventes en volume : La valeur du commerce de gros est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l'élimination des effets de la variation des prix. La première mesure est la valeur du commerce de gros en dollars courants et la seconde, la valeur du commerce de gros en volume. Pour calculer l'estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente de gros. Pour calculer l'estimation en volume, il faut d'abord rajuster la valeur des ventes par rapport à une année de base en utilisant des indices de prix, puis additionner les valeurs résultantes. Voir à ce sujet le document « Enquête mensuelle sur le commerce de gros (EMCG) - Les ventes en volume » (sous « Documentation » ci-dessous).
La variance est la mesure de précision utilisée dans le cadre de l'EMCG pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement au moyen d'un échantillon aléatoire simple stratifié sans remise.
Les estimations de l'échantillon peuvent différer de la valeur prévue des estimations. Toutefois, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible de mesurer la variabilité de l'estimation de l'échantillon par rapport à sa valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation de l'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à la valeur prévue.
Évaluation de la qualité
Avant la publication, les résultats combinés de l'enquête sont analysés afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.
Contrôle de la divulgation
La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.
Révisions et désaisonnalisation
Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important décelé, qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lorsque des révisions historiques ou de restratification sont effectuées.
Depuis avril 2008, les données de l'Enquête mensuelle sur le commerce de gros sont désaisonnalisées en utilisant la méthode X-12-ARIMA. Cette méthode consiste à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées) et à désaisonnaliser la série brute. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.
Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l'effet des influences saisonnières et du calendrier. Pour cette raison, la désaisonnalisation des données permet d'effectuer des comparaisons plus significatives de la conjoncture économique d'un mois à l'autre. Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées.
Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.
Pour obtenir plus de renseignements sur la désaisonnalisation, voir « La désaisonnalisation et le repérage des tendances économiques » (http://www5.statcan.gc.ca/olc-cel/olc.action?ObjId=11-010-X201000311141&ObjType=47&lang=fr&limit=0) et « Données désaisonnalisées - Foire aux questions » (http://www.statcan.gc.ca/dai-quo/btd-add/btd-add-fra.htm).
Exactitude des données
La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population.
Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements incorrects ou qu'il ne répond pas à certaines questions, quand une unité hors du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie. Bien que l'effet des erreurs non dues à l'échantillonnage soit difficile à évaluer, certaines mesures, comme les taux de réponse et d'imputation, peuvent donner une idée du niveau éventuel de ce type d'erreur.
Les coefficients de variation (CV) et les taux de réponse sont d'importantes mesures de la qualité des données qui permettent de valider les résultats de l'EMCG.
Le coefficient de variation, défini comme étant l'erreur type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.
TAUX DE RÉPONSE
Le taux de réponse moyen pondéré pour 2016 est de 88 %.
ERREUR NON DUE À L'ÉCHANTILLONNAGE
Quand un répondant fournit des renseignements incorrects ou qu'il ne répond pas à certaines questions, quand une unité hors du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie. Bien que l'effet des erreurs non dues à l'échantillonnage soit difficile à évaluer, certaines mesures, comme les taux de réponse et d'imputation, peuvent donner une idée du niveau éventuel de ce type d'erreur.
BIAIS DE NON-RÉPONSE
Beaucoup d'efforts sont déployés en vue de réduire au minimum la non-réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.
Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.
Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.
ERREUR DE COUVERTURE
Les erreurs de couverture comprennent les omissions, les inclusions erronées, les doubles comptes et les erreurs de classification des unités dans la base de sondage.
Le Registre des entreprises (RE) est la base de sondage de l'enquête mensuelle sur le commerce de gros. Le RE est un centre de service de données mis à jour à l'aide de plusieurs sources, notamment les fichiers de données administratives, les commentaires reçus dans le cadre des enquêtes-entreprises de Statistique Canada, et les activités d'établissement de profils, qui comprennent un contact direct avec les entreprises pour obtenir des renseignements sur leurs activités, ainsi que les résultats de recherche sur Internet. L'utilisation du RE assure la qualité de données, tout en évitant les chevauchements entre les enquêtes et en allégeant le fardeau de réponse le plus possible.
AUTRES ERREURS NON DUES À L'ÉCHANTILLONNAGE
L'erreur peut se produire lors des diverses étapes du traitement (codage, entrée, vérification, pondération, totalisation, etc.). Il est difficile de mesurer les erreurs non liées à l'échantillonnage. De plus, il faut les cerner à un niveau où elles ne nuisent pas à l'utilisation ou à l'interprétation des chiffres définitifs.
Des mesures ont été prises afin de minimiser les erreurs non liées à l'échantillonnage. Ainsi, les unités ont été définies avec beaucoup de précision au moyen des listes les plus à jour. Les questionnaires ont été conçus avec soin afin de réduire au minimum les différentes interprétations possibles. De plus, les diverses étapes de vérification et de traitement ont fait l'objet de contrôles d'acceptation détaillés et on n'a absolument rien négligé pour que le taux de non-réponse et le fardeau de réponse soient faibles.
Documentation
- Enquête mensuelle sur le commerce de gros (EMCG) - Les ventes en volume
- Enquête mensuelle sur le commerce de gros : Utilisation de données administratives
- Date de modification :