Enquête sur les marchandises vendues au détail (EMVD)

Information détaillée pour août 2019

Statut :

Active

Fréquence :

Mensuelle

Numéro d'enregistrement :

2008

Cette enquête a pour but de recueillir des renseignements détaillés sur les ventes de marchandises au détail au Canada afin de produire des estimations des ventes de diverses marchandises au niveau national, pour différents types de points de vente au Canada.

Date de la parution - 12 novembre 2019

Aperçu

L'Enquête sur les marchandises vendues au détail (EMVD) recueille des renseignements détaillés sur les ventes de marchandises au détail au Canada. L'objectif visé est de produire des estimations des ventes de diverses marchandises au niveau national, pour différents types de points de vente au Canada. L'enquête est réalisée à titre de complément à l'Enquête mensuelle sur le commerce de détail (EMCD- No d'enquête 2406). L'EMCD permet de recueillir des données sur le total des ventes au détail mensuelles tandis que dans le cadre de l'EMVD, les données sur ces ventes sont ventilées selon le type de marchandise.

Les renseignements fournis par l'EMVD peuvent servir à suivre les ventes de marchandises au sein de et entre divers types de magasins de détail, à calculer également la part du marché des marchandises et à mieux comprendre l'industrie du commerce de détail qui évolue rapidement. Les données montrent les types de points de vente où les consommateurs préfèrent acheter certaines marchandises et les changements sur le plan des différents types de marchandises qu'offrent les détaillants. L'analyse de ces données aide à établir les tendances des ventes de marchandises au fil du temps.

Le Système de comptabilité nationale du Canada de Statistique Canada se sert des données de l'EMVD pour établir des estimations des dépenses des particuliers. Les autres utilisateurs de ces données comprennent les ministères fédéraux et provinciaux, les analystes du commerce de détail, les spécialistes des études de marché, les spécialistes sectoriels et les experts-conseils.

Période de référence : Mensuelle

Période de collecte : Le mois suivant la période de déclaration.

Sujets

  • Commerce de détail et de gros
  • Ventes au détail selon le type de produit

Sources de données et méthodologie

Population cible

L'Enquête sur les marchandises vendues au détail a presque la même population cible que l'Enquête mensuelle sur le commerce de détail (EMCD). L'exception est l'industrie des entreprises de télémagasinage et de vente par correspondance (SCIAN 454110) qui est incluse dans l'EMCD mais pas dans l'EMVD.

La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le Registre des entreprises (RE) de Statistique Canada qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN 2017). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 454110.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels la valeur du revenu brut d'entreprise (RBE) est nulle, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :

- 4542 (exploitants de distributeurs automatiques)
- 45431 (marchands de combustible)
- 45439 (autres établissements de vente directe)

Élaboration de l'instrument

Les questionnaires ont été élaborés à Statistique Canada, puis examinés et mis à l'essai sur le terrain dans les deux langues officielles. À l'étape de l'élaboration de l'enquête, Statistique Canada a consulté un certain nombre de grands détaillants ainsi que des associations industrielles. L'enquête a subi des modifications importantes en 2016, en se déplaçant vers un questionnaire électronique et le Système de classification des produits de l'Amérique du Nord (SCPAN).

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

L'échantillon de l'EMVD se compose d'un sous-ensemble des détaillants visés par l'Enquête mensuelle sur le commerce de détail (EMCD). L'échantillon de l'EMVD se compose de tous les détaillants visés par l'EMCD sauf ceux qui appartiennent au Système de classification des industries de l'Amérique du Nord (SCIAN) 454110 (ils sont exclus, car ils sont des détaillants hors magasin.)

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises (RE) de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'une même industrie et d'une même région géographique. L'EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels en utilisant des SCIAN à trois, quatre, ou cinq chiffres et selon le sous-secteur et la région géographique, c'est-à-dire selon la province ou le territoire et les neuf régions infraprovinciales (Vancouver, Edmonton, Calgary, Winnipeg, Toronto, Ottawa, Gatineau, Montréal et la ville de Québec). Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir les revenus d'entreprise bruts (REB), les ventes assujetties à la TPS et le revenu T2 (de la déclaration d'impôt des sociétés).

Les strates de taille comptent une strate à tirage complet (recensement), au plus deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l'industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un sur échantillonnage pour tenir compte des unités disparues, non répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d'un mois à l'autre et, chaque mois, on y ajoute de nouvelles unités (naissances) et on identifie des entités disparues. Pour découvrir les nouvelles unités visées par l'EMCD, c'est-à-dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont arrêté leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD.

Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

Il y a une industrie des SCIAN à cinq chiffres pour l'EMVD qui est soumise à un traitement d'échantillon différent - l'industrie des concessionnaires d'automobiles neuves (SCIAN 441110). Pour cette industrie, environ 20 fabricants et importateurs sont interrogés par l'Enquête sur les produits des concessionnaires de véhicules automobiles neufs (EPCVAN) afin de recueillir les renseignements de la part de ses concessionnaires.

Sources des données

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants.

Le répondant qui le trouve plus commode peut déclarer ses données sur les marchandises mensuellement à Statistique Canada. Les répondants peuvent faire leur déclaration annuellement si la répartition de leurs ventes ne varie pas en cours d'année. La période de déclaration est la période durant lequel les marchandises ont été vendues dans les magasins de détail. La période de collecte est la période où les intervieweurs ont recueilli les données sur les ventes.

Les données sont recueillies par le questionnaire électronique et les bureaux régionaux de Statistique Canada. Un certain nombre d'unités sont recueillies par le bureau central à Ottawa.

Les répondants peuvent choisir entre quelques méthodes de collecte, soit par le questionnaire électronique ou en papier, soit par téléphone. En outre, ils ont le choix de déclarer leurs données sur les marchandises en dollars ou en pourcentage du total des ventes et des recettes. Un suivi par téléphone est effectué pour résoudre les problèmes identifiés lors de la vérification des questionnaires renvoyés par la poste et pour recueillir les données des répondants qui n'ont pas retourné le questionnaire.

Le premier contact avec le répondant consiste à faire parvenir à celui-ci une trousse contenant une lettre d'introduction informant le répondant qu'un représentant de Statistique Canada l'appellera. Une ébauche du questionnaire est incluse. Cette trousse est suivie d'un appel téléphonique dans le but de présenter l'enquête au répondant, d'identifier la personne la plus compétente pour fournir les données et obtenir un profil détaillé des marchandises vendues par l'entreprise au cours d'une période d'un an. Ce profil est une liste de toutes les marchandises vendues par le détaillant. Le questionnaire électronique est par la suite adapté selon les marchandises vendues par le détaillant.

On a élaboré deux index des marchandises pour aider les intervieweurs et les répondants à choisir les codes de marchandise les plus appropriés aux fins de la classification du type d'articles vendus par les détaillants. Le premier est organisé selon le Système de classification des produits de l'Amérique du Nord (SCPAN) et l'autre comprend une liste alphabétique des marchandises en accord avec les classes des SCIAN à cinq chiffres.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

Durant la collecte des données dans les bureaux régionaux, on procède à des vérifications en ligne pour s'assurer de la cohérence des données de la période en cours et de celles de la dernière période. Si les marchandises déclarées pour la période en cours ne sont pas conformes à celles de la période précédente, on vérifie les données auprès du répondant. On procède aussi à des vérifications pour s'assurer de la validité sur le plan numérique de l'information saisie, que tous les champs de données sont remplis et que les dates des périodes de déclaration sont valides.

Une fois les données retournées au bureau central, on entreprend de nombreuses étapes de traitement pour vérifier minutieusement chaque enregistrement reçu. On procède à des vérifications au niveau microéconomique pour s'assurer que les marchandises vendues correspondent au type de magasin, que la somme des différentes marchandises est égale au total des ventes déclarées et qu'il n'y a pas de données manquantes, que les ventes totales déclarées dans le cadre de cette enquête concordent avec les ventes déclarées dans le cadre de l'EMCD et qu'il n'y a pas de fluctuations importantes des ventes de marchandises d'une période à l'autre. Les enregistrements rejetés à la vérification font l'objet d'un contrôle manuel et d'éventuelles mesures correctives.

Imputation

On se sert d'un système automatisé pour imputer les données manquantes ou erronées. On effectue des imputations pour les non-répondants ainsi que pour ceux ayant un ou plusieurs champs signalés à des fins d'imputation (le processus de vérification ayant fait ressortir les données incomplètes ou incohérentes). Comme l'échantillon de l'EMVD est sur une base mensuelle, le système d'imputation traite les données un mois de référence à la fois. Le système utilise l'information auxiliaire disponible découlant de l'EMCD. Comme les mêmes détaillants sont visés par l'EMVD et par l'EMCD, on obtient les ventes totales pour chaque enregistrement du fichier de l'EMCD une fois le processus de vérification et imputation des données de l'EMCD terminé. Les champs de marchandises sont ensuite imputés un à la fois.

Le système détermine tout d'abord au moyen des données historiques les marchandises vendues par le détaillant. Par la suite, le système impute des valeurs de vente par marchandise. Différentes méthodes sont utilisées selon l'information disponible. La première méthode utilisée par le système consiste à effectuer une imputation déductive, lorsque possible. Par la suite, pour les valeurs manquantes restantes, on procède à une imputation historique pour imputer les valeurs des marchandises. On utilise les données du détaillant pour le même mois de l'année précédente. Si ces données ne sont pas disponibles, on utilise celles du mois précédent. Pour lesquels dont les données historiques ne sont pas disponibles, on procède à l'imputation par le plus proche voisin. Quand cela n'est pas possible, on le fait par ratio des valeurs des marchandises en utilisant une variable auxiliaire actuelle. Des groupes d'imputation de détaillants similaires sont créés selon le type de magasin et la région géographique. Les répondants considérés comme comportant des valeurs aberrantes ne sont pas retenus dans le groupe. Lorsqu'il n'y a pas suffisamment de répondants dans un groupe d'imputation, on utilise des groupes à des niveaux plus agrégés selon le type de magasin et la région géographique. Finalement, en dernier recours, si une unité contient toujours des champs manquants, un pourcentage des ventes totales est attribué.

La dernière étape consiste à ajuster les valeurs imputées de sorte à s'assurer que la somme des parties correspond aux totaux indiqués pour chaque hiérarchie de SCPAN.

Les valeurs des marchandises de l'industrie des concessionnaires d'automobiles neuves (SCIAN 441110) sont dérivées dans une manière différente que les autres industries. Comme les répartitions des marchandises sont recueillies dans les réponses de l'Enquête sur les produits des concessionnaires de véhicules automobiles neufs, ces répartitions sont appliquées aux ventes au détail de l'EMVD de cette industrie afin de dériver les répartitions des marchandises pour chaque concessionnaire d'automobiles neuves individuel.

Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage, tel que le poids d'estimation. Cette étape fait usage du Système généralisé d'estimation (G-EST) de Statistique Canada.

Le poids de l'estimation appliqué aux unités faisant partie de l'échantillon de l'EMVD se compose de trois éléments qui sont multipliés l'un par l'autre. Le premier élément est le poids qui reflète le plan d'échantillonnage (en vue de gonfler les données de l'échantillon de l'EMCD pour représenter l'ensemble de la population), le deuxième poids est un ajustement pour améliorer la représentativité et la précision des estimations en utilisant l'estimation par quotient. Le troisième poids est un ajustement pour assurer la cohérence avec l'EMCD.

L'estimation par quotient consiste à remplacer les poids de sondage initiaux (définis comme étant l'inverse de la probabilité de sélection dans l'échantillon) par de nouveaux poids de façon à satisfaire les contraintes de calage. Le calage veille à ce que le total d'une variable auxiliaire estimé à partir de l'échantillon soit égal au total de cette même variable auxiliaire pour toute la population et que les nouveaux poids de sondage soient aussi proches que possible (selon une certaine mesure de distance) des poids de sondage initiaux.

Supposons, par exemple, que le total connu de la variable auxiliaire pour la population soit égal à 100 et que le total estimé soit égal à 90 si l'on se fonde sur un échantillon; nous obtenons donc une sous-estimation d'environ 10 %. Puisque nous connaissons le total de la variable auxiliaire pour la population, il serait raisonnable d'augmenter les poids des unités échantillonnées afin que l'estimation soit exactement égale à cette valeur. Puisque la variable d'intérêt est corrélée à la variable auxiliaire, il n'est pas déraisonnable de penser que l'estimation des ventes fondée sur le même échantillon et les mêmes poids que l'estimation de la variable auxiliaire puisse également être une sous-estimation d'environ 10 %. Si c'est en effet le cas, les poids ajustés permettent de produire une estimation des ventes totales plus justes.

L'estimateur par quotient essaie essentiellement de compenser les échantillons « malchanceux » et rapproche l'estimation du total réel. Il permet aussi de réduire la variance. Le gain de variance dépendra de la solidité du lien entre la variable d'intérêt et les données auxiliaires.

Finalement, le dernier élément est un facteur d'ajustement appliqué pour garantir que l'estimation des ventes totales de l'EMVD soit égale à l'estimation des ventes de l'EMCD au niveau des SCIAN à trois chiffres.

Rappelons que l'EMVD produit des estimations mensuelles par SCPAN et des estimations trimestrielles plus détaillées par SCPAN et SCIAN à trois chiffres des ventes au détail totales.

Comme les échantillons de l'EMCD et de l'EMVD sont tirés sur une base mensuelle, on calcule les estimations des marchandises et leurs variances pour chaque mois. Les variances sont dérivées directement d'un échantillonnage aléatoire simple stratifié sans remplacement. Pour les estimations trimestrielles, on procède à la somme des estimations mensuelles pour obtenir les estimations des marchandises pour le trimestre. On calcule ensuite une variance des estimations trimestrielles comme si les répondants avaient déclaré trimestriellement.

Évaluation de la qualité

Les résultats d'enquête combinés sont analysés avant la publication; en général, cela comprend un examen détaillé des réponses individuelles (particulièrement pour les compagnies les plus importantes) ainsi qu'un examen de la situation économique générale et des tendances historiques.

On examine les données au niveau macroéconomique pour s'assurer que les tendances à long terme sont logiques lorsqu'on les compare aux renseignements accessibles au public fournis dans les reportages des médias, les communiqués des compagnies, etc. On analyse les fluctuations importantes des ventes de marchandises d'une année à l'autre pour déterminer s'il s'agit d'erreurs ou si les ventes de ces marchandises reflètent fidèlement l'activité de commerce de détail. Des spécialistes du domaine assurent le suivi auprès de la compagnie pour confirmer l'exactitude des données et préciser les raisons des fluctuations importantes des ventes.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité porte sur la détection d'une divulgation directe possible, laquelle se produit lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou lorsque la cellule est dominée par quelques entreprises.

Révisions et désaisonnalisation

À chaque communiqué, les estimations préliminaires du mois actuel ainsi que les estimations révisées du mois précédent sont publiées. Une fois par année, des révisions annuelles sont effectuées. Les révisions découlent principalement de réponses reçues après la publication initiale des données du mois actuel. Les données sont également révisées suite aux révisions des ventes au détail totales, fournies par l'EMCD.

Les estimations des ventes totales selon l'EMVD sont étalonnées au niveau du groupe d'échantillonnage en fonction des estimations des ventes (avant désaisonnalisation) recueillies par l'Enquête mensuelle sur le commerce de détail (EMCD). Les ventes totales de l'EMVD diffèrent légèrement des ventes de l'EMCD puisque les ventes des concessions des grands magasins sont comprises dans l'EMVD et ne le sont pas dans l'EMCD.

Les estimations de l'EMVD ne sont pas désaisonnalisées.

Exactitude des données

Les estimations des marchandises sont dérivées d'une enquête par échantillonnage et, à ce titre, peuvent faire l'objet d'erreurs d'échantillonnage et d'erreurs non dues à l'échantillonnage. Des erreurs d'échantillonnage sont présentes parce que les observations sont effectuées uniquement à partir d'un échantillon et non de l'ensemble de la population. L'erreur d'échantillonnage dépend de facteurs comme la taille de l'échantillon, la variabilité de la population, le plan d'échantillonnage et la méthode d'estimation. Le coefficient de variation (c.v.), qui est l'erreur type estimée divisée par l'estimation, est utilisé pour mesurer le degré d'erreur possible due à l'échantillonnage à l'intérieur même de l'échantillon. Les estimations qui s'accompagnent de petits c.v. sont plus fiables que celles avec des c.v. plus élevés.

Les erreurs non dues à l'échantillonnage peuvent survenir pour différentes raisons. Elles comprennent, entre autres, les erreurs de couverture de la population visée, les différences dans l'interprétation des questions, les renseignements erronés fournis par les répondants et les erreurs d'enregistrement, de codage et de traitement des données. La non-réponse est une source importante d'erreurs non dues à l'échantillonnage. Alors que l'impact des erreurs non dues à l'échantillonnage est difficile à évaluer, certaines mesures telles que les taux d'imputation sont considérés. Le taux d'imputation est défini comme étant égal au total des ventes imputées divisé par le total des ventes pour une marchandise quelconque. Par exemple, si les ventes totales estimées d'une marchandise représentent un million de dollars dont 150 000 $ découlent de données imputées, le taux d'imputation sera de 15 %. Les estimations qui s'accompagnent de faibles taux d'imputation sont considérées plus fiables que celles avec des taux d'imputation plus élevés.

Un indicateur de qualité est dérivé pour chaque estimation, qui tient compte à la fois du c.v. et du taux d'imputation. Il est exprimé en lettre, allant de A à F (A signifiant les estimations les plus fiables et E, celles à utiliser avec précaution. Les estimations codées F sont considérées être de qualité insuffisante pour pouvoir être publiées).

Documentation

Date de modification :