Enquête sur les marchandises vendues au détail (EMVD)
Information détaillée pour premier trimestre de 2018
Statut :
Active
Fréquence :
Trimestrielle
Numéro d'enregistrement :
2008
Cette enquête à le but de recueillir des renseignements détaillés sur les ventes de marchandises au détail au Canada afin de produire des estimations de répartition des ventes de diverses marchandises au niveau national, pour différents types de points de vente au Canada.
Date de la parution - 20 juillet 2018
- Questionnaire(s) et guide(s) de déclaration
- Aperçu
- Sources de données et méthodologie
- Exactitude des données
Aperçu
L'Enquête sur les marchandises vendues au détail (EMVD) recueille des renseignements détaillés sur les ventes de marchandises au détail au Canada. L'objectif visé est de produire des estimations de répartition des ventes de diverses marchandises au niveau national, pour différents types de points de vente au Canada. L'enquête est réalisée à titre de complément à l'Enquête mensuelle sur le commerce de détail (EMCD- No d'enquête 2406). L'EMCD permet de recueillir des données sur le total des ventes au détail mensuelles tandis que dans le cadre de l'EMVD, les données sur ces ventes sont ventilées selon le type de marchandise.
Les détaillants visés par l'Enquête mensuelle sur les grands détaillants (No d'enquête - 5027) sont aussi inclus dans l'échantillon de l'Enquête sur les marchandises vendues au détail. On utilise un questionnaire identique pour les deux enquêtes. Les données recueillies dans le cadre de l'Enquête mensuelle sur les grands détaillants sont intégrées à celles de l'EMVD. Lorsqu'on exclut les concessionnaires de véhicules automobiles et récréatifs, ces grands détaillants représentent environ 33 % du commerce de détail. Les détaillants visés par l'Enquête mensuelle sur les grands détaillants ont été inclus selon le volume de leurs ventes et leur contribution aux secteurs de l'alimentation, du vêtement, des articles d'ameublement, des appareils électroniques, des articles de sport ainsi que des marchandises diverses du commerce de détail.
Les renseignements fournis par l'EMVD peuvent servir à suivre les ventes de marchandises au sein de et entre divers types de magasins de détail, à calculer également la part du marché des marchandises et à mieux comprendre l'industrie du commerce de détail qui évolue rapidement. Les données montrent les types de points de vente où les consommateurs préfèrent acheter certaines marchandises et les changements sur le plan des différents types de marchandises qu'offrent les détaillants. L'analyse de ces données aide à établir les tendances des ventes de marchandises au fil du temps.
Le Système de comptabilité nationale du Canada de Statistique Canada se sert des données de l'EMVD pour établir des estimations des dépenses des particuliers. Les autres utilisateurs de ces données comprennent les ministères fédéraux et provinciaux, les analystes du commerce de détail, les spécialistes des études de marché, les spécialistes sectoriels et les experts conseils.
Période de référence : Trimestre
Période de collecte : Le mois suivant la période de déclaration.
Sujets
- Commerce de détail et de gros
- Ventes au détail selon le type de produit
Sources de données et méthodologie
Population cible
L'Enquête sur les marchandises vendues au détail a presque la même population cible que l'Enquête mensuelle sur le commerce de détail (EMCD). L'exception est l'industrie des entreprises de télémagasinage et de vente par correspondance (SCIAN 454110) qui est incluse dans l'EMCD mais pas dans l'EMVD.
La population cible de l'EMCD comprend tous les établissements statistiques figurant dans le Registre des entreprises (RE) de Statistique Canada qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN 2017). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 454110.
Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels la valeur du revenu brut d'entreprise (RBE) est nulle, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :
- 4542 (exploitants de distributeurs automatiques)
- 45431 (marchands de combustible)
- 45439 (autres établissements de vente directe)
Élaboration de l'instrument
Les questionnaires ont été élaborés à Statistique Canada, puis examinés et mis à l'essai sur le terrain dans les deux langues officielles. À l'étape de l'élaboration de l'enquête, Statistique Canada a consulté un certain nombre de grands détaillants ainsi que des associations industrielles. Des modifications importantes ont été apportées au questionnaire en 2016 en vue de l'utilisation d'un questionnaire électronique et du Système de classification des produits de l'Amérique du Nord.
Échantillonnage
Il s'agit d'une enquête transversale par échantillon.
L'échantillon de l'EMVD se compose d'un sous ensemble des détaillants visés par l'Enquête mensuelle sur le commerce de détail (EMCD). L'échantillon de l'EMVD se compose de tous les détaillants visés par l'EMCD sauf ceux qui appartiennent au Système de classification des industries de l'Amérique du Nord (SCIAN) 454110 (ils sont exclus car ils sont des détaillants hors magasin.)
L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises (RE) de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'une même industrie et d'une même région géographique. L'EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon des groupes industriels en utilisant des SCIAN à trois, quatre, ou cinq chiffres et selon le sous-secteur et la région géographique, c'est-à-dire selon la province ou le territoire et trois régions infra-provinciales (Montréal, Toronto, et Vancouver). Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir les revenus d'entreprise brut (REB), les ventes assujetties à la TPS et le revenu T2 (de la déclaration d'impôt des sociétés).
Les strates de taille comptent une strate à tirage complet (recensement), au plus deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 10 % du total des ventes.
L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l'industrie et des groupes industriels selon la province ou le territoire. On procède aussi à un sur échantillonnage pour tenir compte des unités disparues, non-répondantes ou classées incorrectement.
L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d'un mois à l'autre et, chaque mois, on y ajoute de nouvelles unités (naissances) et on identifie des entités disparues. Pour découvrir les nouvelles unités visées par l'EMCD, c'est à dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont arrêté leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD.
Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.
Il y a une industrie des SCIAN à cinq chiffres pour l'EMVD qui est soumise à un traitement d'échantillon different - l'industrie des concessionnaires d'automobiles neuves (SCIAN 441110). Pour cette industrie, environ 20 fabricants et importateurs sont interrogés par l'Enquête sur les produits des concessionnaires de véhicules automobiles neufs (EPCVAN) afin de recueillir les renseignements de la part de ses concessionnaires.
Sources des données
Il s'agit d'une enquête à participation obligatoire.
Les données sont obtenues directement auprès des répondants.
Le répondant qui le trouve plus commode peut déclarer ses données sur les marchandises mensuellement à Statistique Canada. Les répondants peuvent faire leur déclaration annuellement si la répartition de leurs ventes ne varie pas en cours d'année. La période de déclaration est la période durant lequel les marchandises ont été vendues dans les magasins de détail. La période de collecte est la période où les intervieweurs ont recueilli les données sur les ventes.
Les données sont recueillies par le questionnaire électronique et les bureaux régionaux de Statistique Canada. Un certain nombre d'unités sont recueillis par le bureau central à Ottawa.
Les répondants peuvent choisir entre quelques méthodes de collecte, soit par le questionnaire électronique ou en papier, soit par téléphone. En outre, ils ont le choix de déclarer leurs données sur les marchandises en dollars ou en pourcentage du total des ventes et des recettes. Un suivi par téléphone est effectué pour résoudre les problèmes identifiés lors de la vérification des questionnaires renvoyés par la poste et pour recueillir les données des répondants qui n'ont pas retourné le questionnaire.
Le premier contact avec le répondant consiste à faire parvenir à celui-ci une trousse contenant une lettre d'introduction informant le répondant qu'un représentant de Statistique Canada l'appellera. Une ébauche du questionnaire est inclus. Cette trousse est suivie d'un appel téléphonique dans le but de présenter l'enquête au répondant, d'identifier la personne la plus compétente pour fournir les données et obtenir un profil détaillé des marchandises vendues par l'entreprise au cours d'une période d'un an. Ce profil est une liste de toutes les marchandises vendues par le détaillant. Le questionnaire électronique est par la suite adapté selon les marchandises vendues par le détaillant.
On a élaboré deux index des marchandises pour aider les intervieweurs et les répondants à choisir les codes de marchandise les plus appropriés aux fins de la classification du type d'articles vendus par les détaillants. Le premier est organisé selon le Système de classification des produits de l'Amérique du Nord (SCPAN) et l'autre comprend une liste alphabétique des marchandises en accord avec les classes des SCIAN à cinq chiffres.
Voir le(s) Questionnaire(s) et guide(s) de déclaration.
Détection des erreurs
Durant la collecte des données, on procède à des vérifications en ligne pour s'assurer de la cohérence des données de la période en cours et de celles de la dernière période. Si les marchandises déclarées pour la période en cours ne sont pas conformes à celles de la période précédente, on vérifie les données auprès du répondant. On effectue aussi des vérifications pour s'assurer de la validité sur le plan numérique de l'information saisie, que tous les champs de données sont remplis et que les dates des périodes de déclaration sont valides.
Une fois les données retournées au bureau central, on entreprend de nombreuses étapes de traitement pour vérifier minutieusement chaque enregistrement reçu. On effectue des vérifications au niveau microéconomique pour s'assurer que les marchandises vendues correspondent au type de magasin, que la somme des différentes marchandises est égale aux ventes totales déclarées et qu'il n'y a pas de données manquantes, que les ventes totales déclarées dans le cadre de cette enquête concordent avec les ventes déclarées dans le cadre de l'Enquête mensuelle sur le commerce de détail et qu'il n'y a pas de fluctuations importantes des ventes de marchandises d'une période à l'autre. Les enregistrements rejetés à la vérification font l'objet d'un contrôle manuel et d'éventuelles mesures correctives.
Imputation
On se sert d'un système automatisé pour imputer les données manquantes ou erronées. On effectue des imputations pour les non répondants ainsi que pour ceux ayant un ou plusieurs champs signalés à des fins d'imputation (le processus de vérification ayant fait ressortir les données incomplètes ou incohérentes). Comme l'échantillon de l'EMVD est sur une base mensuelle, le système d'imputation traite les données un mois de référence à la fois. Le système utilise l'information auxiliaire disponible découlant de l'EMCD. Comme les mêmes détaillants sont visés par l'EMVD et par l'EMCD, on obtient les ventes totales pour chaque enregistrement du fichier de l'EMCD une fois le processus de vérification et imputation des données de l'EMCD terminé. Les champs de marchandises sont ensuite imputés un à la fois, selon les méthodes suivantes.
Dans le cas des non répondants, le système détermine au moyen des données historiques les plus récentes quelles sont les marchandises vendues par le détaillant. Aux fins de l'EMVD, on procède à une imputation chronologique rajustée dans le cas d'une non réponse totale. On utilise les données du détaillant pour le même mois de l'année précédente. Si ces données ne sont pas disponibles, on utilise celles du mois précédent.
Dans le cas des répondants dont les champs nécessitent une imputation et des non répondants, le système utilise les données historiques rajustées et récentes pour imputer les valeurs des marchandises. Pour lesquels dont les données historiques ne sont pas disponibles, on procède à l'imputation par le donateur voisin le plus proche. Quand cela n'est pas possible, on le fait par ratio des valeurs des marchandises en utilisant une variable auxiliaire actuelle. Des groupes d'imputation de détaillants similaires sont créés selon le type de magasin et la région géographique. Les valeurs imputées à une unité sont dérivées des valeurs des répondants appartenant au même groupe. Les répondants considérés comme comportant des valeurs aberrantes (en raison soit de fluctuations extrêmement importantes de la distribution de leurs marchandises comparativement à leurs données précédentes, soit de ventes de marchandises inhabituelles pour le type de magasin) ne sont pas retenus dans le groupe. Pour chaque marchandise devant faire l'objet d'une imputation, le ratio des ventes de marchandises du groupe aux ventes totales du groupe est appliqué aux ventes totales de l'unité. Lorsqu'il n'y a pas suffisamment de répondants dans un groupe d'imputation, on utilise des groupes à des niveaux plus agrégés selon le type de magasin et la région géographique.
Comme les champs relatifs aux marchandises font l'objet d'imputation successive, le processus d'imputation est suivi d'une étape de répartition proportionnelle pour s'assurer que la somme des parties correspond aux totaux indiqués.
Les valeurs des marchandises de l'industrie des concessionnaires d'automobiles neuves (SCIAN 441110) sont dérivées dans une manière différente que les autres industries. Comme les répartitions des marchandises sont recueillies dans les réponses de l'Enquête sur les produits des concessionnaires de véhicules automobiles neufs, ces répartitions sont appliquées aux ventes au détail de l'EMVD de cette industrie afin de dériver les répartitions des marchandises pour chaque concessionnaire d'automobile neuve individuel.
Estimation
L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage. Cette étape fait usage du Système généralisé d'estimation (SGE) de Statistique Canada.
Le but de l'EMVD est de produire des estimations trimestrielles pour la répartition des ventes au détail totales selon les diverses marchandises. L'EMCD est la source pour le niveau des ventes au détail totales. Les ventes totales de l'EMVD sont étalonnées au niveau des SCIAN à trois chiffres d'après les estimations des ventes de l'EMCD. En étalonnant l'EMVD à l'EMCD, les ventes totales de l'EMVD correspondront à celles de l'EMCD.
Puisque toutes les données manquantes sur les marchandises sont imputées (tant dans le cas des non répondants que des répondants pour lesquels certaines données manquent), on ne procède pas à un rajustement à l'étape de l'estimation pour tenir compte de la non réponse. Le poids de l'estimation appliqué aux unités faisant partie de l'échantillon de l'EMVD se compose de deux éléments qui sont multipliés l'un par l'autre. Le premier élément est un poids qui reflète la première phase de l'échantillon (en vue de gonfler les données de l'échantillon de l'EMCD pour représenter l'ensemble de la population). Le deuxième élément est un facteur d'ajustement appliqué pour garantir que l'estimation des ventes totales de l'EMVD soit égale à l'estimation des ventes de l'EMCD au niveau des SCIAN à trois chiffres.
Comme les échantillons de l'EMCD et de l'EMVD sont tirés sur une base mensuelle, on calcule les estimations des marchandises et leurs variances pour chaque mois du trimestre. Les variances sont dérivées directement d'un échantillonnage aléatoire simple stratifié sans remplacement. On fait la somme des estimations mensuelles pour obtenir les estimations des marchandises pour le trimestre. On calcule ensuite une évaluation des variances des estimations trimestrielles. On fait la somme des valeurs des marchandises mensuelles pour produire les valeurs des marchandises trimestrielles et on estime les variances comme si les répondants avaient déclaré trimestriellement.
Évaluation de la qualité
Les résultats d'enquête combinés sont analysés avant la publication; en général, cela comprend un examen détaillé des réponses individuelles (particulièrement pour les compagnies les plus importantes) ainsi qu'un examen de la situation économique générale et des tendances historiques.
On examine les données au niveau macroéconomique pour s'assurer que les tendances à long terme sont logiques lorsqu'on les compare aux renseignements accessibles au public fournis dans les reportages des médias, les communiqués des compagnies, etc. On analyse les fluctuations importantes des ventes de marchandises d'une année à l'autre pour déterminer s'il s'agit d'erreurs ou si les ventes de ces marchandises reflètent fidèlement l'activité de commerce de détail. Des spécialistes du domaine assurent le suivi auprès de la compagnie pour confirmer l'exactitude des données et préciser les raisons des fluctuations importantes des ventes.
Contrôle de la divulgation
La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.
L'analyse de la confidentialité porte sur la détection d'une divulgation directe possible, laquelle se produit lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou lorsque la cellule est dominée par quelques entreprises.
Révisions et désaisonnalisation
À chaque communiqué, les estimations préliminaires du trimestre actuel ainsi que les estimations révisées du mois précédent sont publiées. Une fois par année, des révisions annuelles sont effectuées. Les révisions découlent principalement de réponses reçues après la publication initiale des données du trimestre actuel. Les données sont également révisées suite aux révisions des ventes au détail totales, fournies par l'EMCD.
Les estimations des ventes totales selon l'EMVD sont étalonnées au niveau du groupe d'échantillonnage en fonction des estimations des ventes (avant désaisonnalisation) recueillies par l'Enquête mensuelle sur le commerce de détail (EMCD). Les ventes totales de l'EMVD diffèrent légèrement des ventes de l'EMCD puisque les ventes des concessions des grands magasins sont comprises dans l'EMVD et ne le sont pas dans l'EMCD.
Les estimations de l'EMVD ne sont pas désaisonnalisées.
Exactitude des données
Les estimations des marchandises sont dérivées d'une enquête par échantillonnage et, à ce titre, peuvent faire l'objet d'erreurs d'échantillonnage et d'erreurs non dues à l'échantillonnage. Des erreurs d'échantillonnage sont présentes parce que les observations sont effectuées uniquement à partir d'un échantillon et non de l'ensemble de la population. L'erreur d'échantillonnage dépend de facteurs comme la taille de l'échantillon, la variabilité de la population, le plan d'échantillonnage et la méthode d'estimation. Le coefficient de variation (c.v.), qui est l'erreur type estimée divisée par l'estimation, est utilisé pour mesurer le degré d'erreur possible due à l'échantillonnage à l'intérieur même de l'échantillon. Les estimations qui s'accompagnent de petits c.v. sont plus fiables que celles avec des c.v. plus élevés.
Les erreurs non dues à l'échantillonnage peuvent survenir pour différentes raisons. Elles comprennent, entre autres, les erreurs de couverture de la population visée, les différences dans l'interprétation des questions, les renseignements erronés fournis par les répondants et les erreurs d'enregistrement, de codage et de traitement des données. La non réponse est une source importante d'erreurs non dues à l'échantillonnage. Alors que l'impact des erreurs non dues à l'échantillonnage est difficile à évaluer, certaines mesures telles que les taux de réponse et d'imputation peuvent être utilisées comme indicateurs du niveau potentiel d'erreur non dues à l'échantillonnage.
On attribue à chaque estimation des marchandises un code allant de A à F (A signifiant les données les plus fiables et F, celles à utiliser avec précaution) comme indicateur de la qualité des données. Cet indicateur de la qualité constitue une mesure jointe de la magnitude du c.v. et du taux d'imputation. Le taux d'imputation est une mesure de la proportion des ventes estimées qui résulte des données imputées. Par exemple, si les ventes totales estimées d'une marchandise représentent un million de dollars dont 150 000 $ découlent de données imputées, le taux d'imputation est de 15 %.
On détermine le code final servant d'indicateur de la qualité en attribuant d'abord un code fondé uniquement sur le c.v. Ce code est ensuite rajusté pour tenir compte du taux d'imputation de cette estimation. On attribue le code A aux estimations dont le c.v. se situe dans la fourchette de 0 % à 5 %, le code B à celles dans la fourchette de 5 % à 10 %, le code C à celles dans la fourchette de 10 % à 16,5 %, le code D à celles dans la fourchette de 16,5 % à 25 % et le code E à celles dans la fourchette de 25 % à 33 %. Si le taux d'imputation est inférieur à 10 %, le code c.v. devient l'indicateur de la qualité final. Si le taux d'imputation se situe entre 10 % et 33 %, le code c.v. baisse d'un rang (c. à d. un A devient un B, un C devient un D). Si le taux d'imputation se situe entre 33 % et 60 %, le code c.v. baisse de deux rangs (c. à d. un A devient un C, un C devient un E).
- Date de modification :