Enquête sur les marchandises vendues au détail (EMVD)
Information détaillée pour octobre 2021
Statut :
Active
Fréquence :
Mensuelle
Numéro d'enregistrement :
2008
Cette enquête a pour but de recueillir des renseignements détaillés sur les ventes de marchandises au détail au Canada afin de produire des estimations des ventes de diverses marchandises à l'échelle nationale, pour différents types de points de vente au Canada.
Date de la parution - 10 janvier 2022
- Questionnaire(s) et guide(s) de déclaration
- Aperçu
- Sources de données et méthodologie
- Exactitude des données
Aperçu
L'Enquête sur les marchandises vendues au détail (EMVD) permet de recueillir des renseignements détaillés sur les ventes de marchandises au détail au Canada. Son objectif est de produire des estimations des ventes de diverses marchandises à l'échelle nationale pour différents types de points de vente au Canada. L'enquête est réalisée à titre de complément à l'Enquête mensuelle sur le commerce de détail (EMCD - numéro d'enregistrement 2406). L'EMCD permet de recueillir des données sur le total des ventes au détail mensuelles, tandis que dans le cadre de l'EMVD, les données sur ces ventes sont ventilées, selon le type de marchandise.
Les renseignements fournis au moyen de l'EMVD peuvent servir à suivre les ventes de marchandises au sein et entre divers types de magasins de détail, de même qu'à calculer la part du marché des marchandises et à mieux comprendre l'industrie du commerce de détail qui évolue rapidement. Les données montrent les types de points de vente où les consommateurs préfèrent acheter certaines marchandises et les changements sur le plan des différents types de marchandises qu'offrent les détaillants. L'analyse de ces données aide à établir les tendances des ventes de marchandises au fil du temps.
Les données de l'EMVD sont utilisées dans le cadre du Système de comptabilité nationale de Statistique Canada afin d'établir des estimations des dépenses des particuliers. Les autres utilisateurs de ces données comprennent les ministères fédéraux et provinciaux, les analystes du commerce de détail, les spécialistes des études de marché, les spécialistes de l'industrie et les experts-conseils.
Période de référence : Mensuelle
Période de collecte : Le mois suivant la période de déclaration.
Sujets
- Commerce de détail et de gros
- Ventes au détail selon le type de produit
Sources de données et méthodologie
Population cible
L'Enquête sur les marchandises vendues au détail (EMVD) a la même population cible que l'Enquête mensuelle sur le commerce de détail (EMCD). La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le Registre des entreprises de Statistique Canada qui sont classés dans le secteur du commerce de détail selon le SCIAN 2017. La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 454110.
Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels la valeur du revenu brut d'entreprise est nulle, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :
- 4542 (exploitants de distributeurs automatiques)
- 45431 (marchands de combustibles)
- 45439 (autres établissements de vente directe)
Élaboration de l'instrument
Les questionnaires ont été élaborés à Statistique Canada, puis examinés et mis à l'essai sur le terrain dans les deux langues officielles. À l'étape de l'élaboration de l'enquête, Statistique Canada a consulté un certain nombre de grands détaillants ainsi que des associations industrielles. Des modifications importantes ont été apportées au questionnaire en 2016 en vue de l'utilisation d'un questionnaire électronique et du Système de classification des produits de l'Amérique du Nord.
Échantillonnage
Il s'agit d'une enquête transversale par échantillon.
L'échantillon de l'Enquête sur les marchandises vendues au détail (EMVD) contient tous les détaillants de l'Enquête mensuelle sur le commerce de détail (EMCD). L'échantillon de l'EMCD est composé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés dans le Registre des entreprises (RE) de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'une même industrie et d'une même région géographique. L'EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels en utilisant les codes à trois, quatre ou cinq chiffres du SCIAN, selon le sous-secteur et la région géographique, c'est-à-dire selon la province ou le territoire et les neuf régions infraprovinciales (Vancouver, Edmonton, Calgary, Winnipeg, Toronto, Ottawa, Gatineau, Montréal et la ville de Québec). Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir les revenus d'entreprise bruts, les ventes assujetties à la TPS et le revenu figurant sur les revenus T2 (de la déclaration de revenus des sociétés).
Les strates de taille comptent une strate à tirage complet (recensement), au plus deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul sert à réduire le fardeau du répondant en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % des ventes totales.
L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles à l'échelle du Canada, de la province ou du territoire, de l'industrie et des groupes échantillonnés, selon la province ou le territoire. L'échantillon est également gonflé pour tenir compte des unités disparues, non répondantes ou classées incorrectement.
L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d'un mois à l'autre et, chaque mois, on y ajoute de nouvelles unités (naissances) et on détermine les entités disparues. Pour déterminer les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux utilisés pour la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont cessé leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE en fonction des renseignements provenant de sources administratives et des commentaires reçus lors des enquêtes, y compris ceux des entreprises participant à l'EMCD.
Les méthodes utilisées pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.
Il y a une industrie ayant le code du SCIAN à cinq chiffres pour l'EMVD qui est soumise à un traitement d'échantillon différent - l'industrie des concessionnaires d'automobiles neuves (code 441110). Pour cette industrie, environ 20 fabricants et importateurs de nouvelles voitures sont sondés dans le cadre de l'Enquête sur les ventes de véhicules automobiles neufs afin de recueillir les renseignements de la part de ces marchands.
Sources des données
Il s'agit d'une enquête à participation obligatoire.
Les données sont obtenues directement auprès des répondants.
Un répondant peut déclarer ses données sur les marchandises mensuellement à Statistique Canada, si cela lui convient mieux. Les répondants peuvent faire leur déclaration annuellement si la répartition de leurs ventes ne varie pas en cours d'année. La période de déclaration est la période durant laquelle les marchandises ont été vendues dans les magasins de détail. La période de collecte est la période où les intervieweurs ont recueilli les données sur les ventes.
Les données sont recueillies au moyen d'un questionnaire électronique et des bureaux régionaux de Statistique Canada. Un certain nombre d'unités sont recueillies au moyen du bureau central, situé à Ottawa.
Les répondants peuvent choisir entre de répondre en utilisant diverses méthodes de collecte : questionnaire électronique ou papier, ou par téléphone. En outre, ils ont le choix de déclarer leurs données sur les marchandises en dollars ou en pourcentage du total des ventes et des recettes. Un suivi téléphonique est effectué pour résoudre les problèmes cernés lors de la vérification des questionnaires renvoyés par la poste et pour recueillir les données des répondants qui n'ont pas retourné le questionnaire.
Le premier contact avec le répondant consiste à lui envoyer une trousse contenant une lettre d'introduction l'informant qu'un représentant de Statistique Canada l'appellera. Une ébauche du questionnaire est incluse. Cette trousse est suivie d'un appel téléphonique dans le but de présenter l'enquête au répondant, de déterminer la personne la plus compétente pour fournir les données et obtenir un profil détaillé des marchandises vendues par l'entreprise au cours d'une période d'un an. Ce profil est une liste de toutes les marchandises vendues par le détaillant. Le questionnaire électronique est par la suite adapté selon les marchandises vendues par le détaillant.
On a élaboré deux index des marchandises pour aider les intervieweurs et les répondants à choisir les codes de marchandise les plus appropriés aux fins de la classification du type d'articles vendus par les détaillants. Le premier est organisé selon les codes du Système de classification des produits de l'Amérique du Nord et l'autre comprend une liste alphabétique des marchandises en accord avec les catégories de codes à cinq chiffres du Système de classification des industries de l'Amérique du Nord.
Voir le(s) Questionnaire(s) et guide(s) de déclaration.
Détection des erreurs
Durant la collecte des données, on procède à des vérifications en ligne pour s'assurer de la cohérence des données de la période en cours et de celles de la dernière période. Si les marchandises déclarées pour la période en cours ne sont pas conformes à celles de la période précédente, on vérifie les données auprès du répondant. On effectue aussi des vérifications pour s'assurer de la validité sur le plan numérique de l'information saisie, que tous les champs de données sont remplis et que les dates des périodes de déclaration sont valides.
Une fois les données retournées au bureau central, on entreprend de nombreuses étapes de traitement pour vérifier minutieusement chaque enregistrement reçu. On effectue des vérifications au niveau microéconomique pour s'assurer que les marchandises vendues correspondent au type de magasin, que la somme des différentes marchandises est égale aux ventes totales déclarées et qu'il n'y a pas de données manquantes, que les ventes totales déclarées dans le cadre de cette enquête concordent avec les ventes déclarées dans le cadre de l'Enquête mensuelle sur le commerce de détail et qu'il n'y a pas de fluctuations importantes des ventes de marchandises d'une période à l'autre. Les enregistrements rejetés à la vérification font l'objet d'un contrôle manuel et d'éventuelles mesures correctives.
Imputation
On se sert d'un système automatisé pour imputer les données manquantes ou erronées. On effectue des imputations pour les non-répondants ainsi que pour les répondants ayant un ou plusieurs champs signalés à des fins d'imputation (le processus de vérification ayant permis de relever les données incomplètes ou incohérentes). Comme l'échantillon de l'Enquête sur les marchandises vendues au détail (EMVD) est construit sur une base mensuelle, le système d'imputation traite les données un mois de référence à la fois. Dans ce système, l'information auxiliaire disponible découlant de l'Enquête mensuelle sur le commerce de détail (EMCD) est utilisée. Comme les mêmes détaillants sont visés par l'EMVD et par l'EMCD, on obtient les ventes totales pour chaque enregistrement du fichier de l'EMCD une fois le processus de vérification et d'imputation des données de l'EMCD terminé. Les champs de marchandises sont ensuite imputés un à la fois.
Tout d'abord, le système permet de déterminer au moyen des plus récentes données historiques les marchandises vendues par le détaillant. Par la suite, le système impute des valeurs de vente par marchandise. Différentes méthodes sont utilisées selon l'information disponible. La première méthode utilisée dans le système consiste à effectuer une imputation déductive, lorsque possible. Ensuite, pour les valeurs manquantes restantes, une imputation historique est effectuée pour imputer les valeurs des marchandises. On utilise les données du détaillant pour le même mois de l'année précédente. Si ces données ne sont pas disponibles, on utilise celles du mois précédent.
Lorsque les données historiques ne sont pas disponibles, la valeur des marchandises est imputée au moyen de la méthode d'imputation par le plus proche voisin. Quand cela n'est pas possible, la valeur des marchandises est imputée au moyen de la méthode de l'imputation par le ratio en utilisant une variable auxiliaire actuelle. Des groupes d'imputation de détaillants similaires sont créés selon le type de magasin et la région géographique. Les répondants considérés comme comportant des valeurs aberrantes ne sont pas retenus dans le groupe. Lorsqu'il n'y a pas suffisamment de répondants dans un groupe d'imputation, on utilise des groupes à des niveaux plus agrégés selon le type de magasin et la région géographique. Finalement, en dernier recours, si une unité contient toujours des champs manquants, un pourcentage des ventes totales est attribué.
La dernière étape consiste à ajuster les valeurs imputées de sorte à s'assurer que la somme des parties correspond aux totaux indiqués pour chaque hiérarchie du Système de classification des produits de l'Amérique du Nord.
Les valeurs des marchandises de l'industrie des concessionnaires d'automobiles neuves (code 441110 du Système de classification des industries de l'Amérique du Nord) sont dérivées d'une manière différente que les autres industries. Comme les répartitions des marchandises sont recueillies dans les réponses de l'Enquête sur les ventes de véhicules automobiles neufs, ces répartitions sont appliquées aux ventes au détail de l'Enquête sur les marchandises vendues au détail de cette industrie afin de dériver les répartitions des marchandises pour chaque marchand d'automobiles neuves.
Estimation
L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage, tel que le poids de sondage. Cette étape est effectuée en utilisant le Système généralisé d'estimation de Statistique Canada.
Le poids de l'estimation appliqué aux unités faisant partie de l'échantillon de l'Enquête sur les marchandises vendues au détail (EMVD) se compose de trois éléments qui sont multipliés l'un par l'autre. Le premier élément est le poids qui reflète le plan d'échantillonnage (en vue de gonfler les données de l'échantillon pour représenter l'ensemble de la population). Le deuxième poids est un ajustement pour améliorer la représentativité et la précision des estimations en utilisant la méthode de l'estimation par le ratio. Le troisième poids est un ajustement pour assurer la cohérence avec l'Enquête mensuelle sur le commerce de détail (EMCD).
L'estimation par le ratio consiste à remplacer les poids de sondage initiaux (définis comme étant l'inverse de la probabilité de sélection dans l'échantillon) par de nouveaux poids de façon à satisfaire les contraintes de calage. Le calage permet de veiller à ce que le total d'une variable auxiliaire estimé à partir de l'échantillon soit égal au total de cette même variable auxiliaire pour toute la population et que les nouveaux poids de sondage soient aussi proches que possible (selon une certaine mesure de distance) des poids de sondage initiaux.
Supposons, par exemple, que le total connu de la variable auxiliaire pour la population soit égal à 100 et que le total estimé soit égal à 90 si l'on se fonde sur un échantillon; nous obtenons donc une sous-estimation d'environ 10 %. Puisque nous connaissons le total de la variable auxiliaire pour la population, il serait raisonnable d'augmenter les poids des unités échantillonnées afin que l'estimation soit exactement égale à cette valeur. Puisque la variable d'intérêt est corrélée à la variable auxiliaire, il n'est pas déraisonnable de penser que l'estimation des ventes fondée sur le même échantillon et les mêmes poids que l'estimation de la variable auxiliaire puisse également être une sous-estimation d'environ 10 %. Si c'est en effet le cas, les poids ajustés permettent de produire une estimation des ventes totales plus exacte.
L'estimateur par le ratio essaie essentiellement de compenser les échantillons « malchanceux » et rapproche l'estimation du total réel. Il permet aussi de réduire la variance. Le gain de variance dépendra de la solidité du lien entre la variable d'intérêt et les données auxiliaires.
Finalement, le dernier élément est un facteur d'ajustement visant à garantir que l'estimation des ventes totales de l'EMVD soit égale à l'estimation des ventes de l'EMCD au niveau du code à trois chiffres du Système de classification des industries de l'Amérique du Nord (SCIAN).
Rappelons que l'EMVD permet de produire des estimations mensuelles, selon le Système de classification des produits de l'Amérique du Nord (SCPAN), et des estimations trimestrielles plus détaillées, selon le SCPAN et le code à trois chiffres du SCIAN, des ventes au détail totales.
Comme les échantillons de l'EMCD et de l'EMVD sont tirés sur une base mensuelle, on calcule les estimations des marchandises et leurs variances pour chaque mois. Les variances sont dérivées directement d'un échantillonnage aléatoire simple stratifié sans remplacement. Pour les estimations trimestrielles, on calcule la somme des estimations mensuelles pour obtenir les estimations des marchandises pour le trimestre. On calcule ensuite une variance des estimations trimestrielles comme si les répondants avaient déclaré leurs données trimestriellement.
Évaluation de la qualité
Les résultats d'enquête combinés sont analysés avant la publication; en général, cela comprend un examen détaillé des réponses individuelles (particulièrement pour les entreprises les plus importantes) ainsi qu'un examen de la situation économique générale et des tendances historiques.
On examine les données au niveau macroéconomique pour s'assurer que les tendances à long terme sont logiques lorsqu'on les compare aux renseignements accessibles au public fournis dans les reportages des médias, les communiqués des entreprises, etc. On analyse les fluctuations importantes des ventes de marchandises d'une année à l'autre pour déterminer s'il s'agit d'erreurs ou si les ventes de ces marchandises reflètent fidèlement l'activité de commerce de détail. Des spécialistes du domaine assurent le suivi auprès de la compagnie pour confirmer l'exactitude des données et préciser les raisons des fluctuations importantes des ventes.
Contrôle de la divulgation
La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.
L'analyse de la confidentialité porte sur la détection d'une divulgation directe possible, laquelle se produit lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou lorsque la cellule est dominée par quelques entreprises.
Révisions et désaisonnalisation
À chaque communiqué, les estimations provisoires du mois actuel ainsi que les estimations révisées du mois précédent sont publiées. Une fois par année, des révisions annuelles sont effectuées. Les révisions découlent principalement de réponses reçues après la publication initiale des données du mois actuel. Les données sont également révisées suite aux révisions des ventes au détail totales, fournies par l'Enquête mensuelle sur le commerce de détail (EMCD).
Les estimations des ventes totales de l'Enquête sur les marchandises vendues au détail (EMVD) sont étalonnées au niveau du groupe d'échantillonnage en fonction des estimations des ventes (avant désaisonnalisation) recueillies au moyen de l'EMCD. Les ventes totales de l'EMVD diffèrent légèrement des ventes de l'EMCD puisque les ventes des concessions des grands magasins sont comprises dans l'EMVD et ne le sont pas dans l'EMCD.
Les estimations de l'EMVD ne sont pas désaisonnalisées.
Exactitude des données
Les estimations des marchandises sont dérivées d'une enquête par échantillonnage et, à ce titre, peuvent faire l'objet d'erreurs d'échantillonnage et d'erreurs non dues à l'échantillonnage. Des erreurs d'échantillonnage sont présentes parce que les observations sont effectuées uniquement à partir d'un échantillon et non de l'ensemble de la population. L'erreur d'échantillonnage dépend de facteurs comme la taille de l'échantillon, la variabilité de la population, le plan d'échantillonnage et la méthode d'estimation. Le coefficient de variation (c.v.), qui est l'erreur-type estimée exprimée en pourcentage de l'estimation, est utilisé pour mesurer le degré d'erreur possible due à l'échantillonnage à l'intérieur même de l'échantillon. Les estimations qui s'accompagnent de plus petits c.v. sont plus fiables que celles avec des c.v. plus élevés.
Les erreurs non dues à l'échantillonnage peuvent survenir pour différentes raisons. Elles comprennent, entre autres, les erreurs de couverture de la population visée, les différences dans l'interprétation des questions, les renseignements erronés fournis par les répondants et les erreurs d'enregistrement, de codage et de traitement des données. La non-réponse est une source importante d'erreurs non dues à l'échantillonnage. Alors que l'incidence des erreurs non dues à l'échantillonnage est difficile à évaluer, la mesure des taux d'imputation est prise en compte. Le taux d'imputation est défini comme étant égal au total des ventes imputées divisé par le total des ventes pour une marchandise quelconque. Par exemple, si les ventes totales estimées d'une marchandise représentent un million de dollars dont 150 000 $ découlent de données imputées, le taux d'imputation sera de 15 %. Les estimations qui s'accompagnent de faibles taux d'imputation sont considérées comme étant plus fiables que celles avec des taux d'imputation plus élevés.
Un indicateur de qualité est dérivé pour chaque estimation, qui tient compte à la fois de l'ampleur du c.v. et du taux d'imputation. Il est exprimé en lettre, allant de A à F (A signifiant les estimations les plus fiables et E, celles à utiliser avec précaution). Les estimations codées F sont considérées comme étant de qualité insuffisante pour pouvoir être publiées.
- Date de modification :