Enquête sur le commerce de détail (mensuelle) (EMCD)

Information détaillée pour janvier 2006

Statut :

Active

Fréquence :

Mensuelle

Numéro d'enregistrement :

2406

L'enquête mensuelle du commerce de détail recueille des informations sur les ventes et le nombre d'emplacements d'affaire selon les provinces et les territoires à partir d'un échantillon de détaillants.

Date de la parution - 21 mars 2006

Aperçu

L'Enquête mensuelle sur le commerce de détail est conçue pour recueillir des renseignements sur les ventes et le nombre d'emplacements d'affaires selon la province ou le territoire auprès d'un échantillon de détaillants. Les estimations des ventes obtenues auprès des détaillants représentent un indicateur mensuel important des habitudes d'achat des consommateurs au Canada. En outre, les ventes au détail sont une composante importante du produit intérieur brut, qui mesure la production du Canada, et qui font partie de nombreux modèles économiques utilisés par les organismes publics et privés. La Banque du Canada s'appuie, en partie, sur les estimations mensuelles des ventes au détail pour prendre des décisions qui influent sur les taux d'intérêt. Les entreprises utilisent les estimations des ventes au détail pour comparer leurs résultats à la moyenne de leur industrie et pour élaborer des stratégies d'investissement.

Les estimations concernant le commerce de détail n'incluent aucune forme de vente directe ne passant pas par un magasin de détail, c'est à dire la vente directe par démarchage, les ventes par distributeur automatique, les ventes de journaux ou de revues faites directement par les imprimeurs ou les éditeurs, et les ventes faites par les clubs de livres et de disques. Les activités de vente au détail par Internet sont incluses dans l'enquête uniquement si elles sont effectuées au moyen de la même structure juridique que l'établissement de vente au détail.

Pour plus d'information sur la méthodologie, voir les appendices II, III et IV de la publication "Commerce de détail" Statistique Canada, no. 63-005-XWF au catalogue, au lien « Publications » situé au menu latéral.

Période de référence : mois

Période de collecte : La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Sujets

  • Commerce de détail et de gros
  • Ventes au détail selon le type de magasin

Sources de données et méthodologie

Population cible

La population cible comprend tous les établissements statistiques figurant dans le Registre des entreprises (RE) de Statistique Canada qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN 2002). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 453999.

Sont exclus de la population cible les établissements auxiliaires (producteurs de services de soutien de l'activité de production de biens et services destinés au marché de plus d'un établissement au sein de l'entreprise, et qui sont considérés comme un centre de coûts ou un centre de dépenses discrétionnaires pour lequel les données sur tous les coûts, y compris la main-d'oeuvre et l'amortissement, peuvent être déclarées par l'entreprise), les futurs établissements, les établissements pour lesquels la valeur du revenu brut d'entreprise (RBE) est nulle, et les établissements appartenant aux catégories du SCIAN non couvertes qui suivent :
- 4541 (entreprises de télémagasinage et de vente par correspondance)
- 4542 (exploitants de distributeurs automatiques)
- 45431 (marchands de combustible)
- 45439 (autres établissements de vente directe)

Les données concernant le commerce de détail sont présentées sur la base de la variante des groupes de commerce du SCIAN.

Élaboration de l'instrument

Le questionnaire est conçu pour recueillir mensuellement auprès d'un échantillon de détaillants des données sur les ventes au détail, sur le nombre d'emplacements commerciaux par province ou territoire et sur les stocks de biens possédés et destinés à la revente. Lors du remaniement de 2004, la plupart des questionnaires n'ont subi que des changements de présentation. Le questionnaire sur les ventes et les stocks de boissons alcooliques a subi des modifications plus importantes. Les modifications ont été discutées avec les intervenants et les répondants ont eu l'occasion de faire des commentaires avant que le nouveau questionnaire ne soit finalisé. Si d'autres modifications devaient être apportées à l'un des questionnaires, les changements proposés seraient soumis à un comité d'examen et ferait l'objet d'un essai sur le terrain auprès de répondants et d'utilisateurs de données pour s'assurer de leur pertinence.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

L'échantillon de l'EMCD est formé de 10 000 groupes d'établissements (grappes) classés dans le secteur du commerce de détail et sélectionnés à partir du Registre des entreprises de Statistique Canada. Par définition, une grappe d'établissements comprend tous les établissements appartenant à une entreprise statistique qui font partie d'un même groupe industriel et d'une même région géographique. L'EMCD est fondée sur un plan d'échantillonnage stratifié avec sélection d'un échantillon aléatoire simple dans chaque strate. La stratification est faite selon le groupe de commerce en utilisant les catégories à quatre chiffres du SCIAN et selon la région géographique, c'est à dire selon la province ou le territoire. Ensuite, la population est stratifiée selon la taille de l'établissement. La mesure de taille est créée en combinant des données provenant d'enquêtes indépendantes et trois variables administratives, à savoir le RBE, les ventes assujetties à la TPS et le revenus T2 (provenant de la déclaration de revenus des sociétés).

Les strates de taille comptent une strate à tirage complet (recensement), au moins deux strates à tirage partiel (échantillonnées partiellement) et une strate à tirage nul (non échantillonnée). La strate à tirage nul est destinée à réduire le fardeau de réponse en excluant les entreprises les plus petites de la population observée. Ces entreprises représentent, en principe, au plus 5 % du total des ventes. Au lieu d'envoyer un questionnaire à ces entreprises, on produit les estimations d'après des données administratives.

L'échantillon est réparti de façon optimale afin d'atteindre les coefficients de variation cibles au niveau du Canada dans son ensemble, de la province ou du territoire, de l'industrie et du groupe de commerce selon la province ou le territoire. On procède aussi à un suréchantillonnage pour tenir compte des unités disparues, non-répondantes ou classées incorrectement.

L'EMCD est une enquête répétée avec maximisation du chevauchement des échantillons mensuels. On retient l'échantillon d'un mois à l'autre et, chaque mois, on y ajoute les nouvelles unités et on supprime les unités disparues. Pour découvrir les nouvelles unités visées par l'EMCD, c'est à dire les nouvelles grappes d'établissement(s), on examine chaque mois l'univers le plus récent du RE. On stratifie ces nouvelles unités conformément aux mêmes critères que ceux appliqués à la population initiale, puis on les échantillonne conformément à la fraction d'échantillonnage de la strate à laquelle elles appartiennent et on les ajoute à l'échantillon mensuel. Des disparitions d'entité surviennent également chaque mois. Une entité disparue peut être une grappe d'établissements qui ont arrêté leurs activités (fermeture) ou dont les activités principales ne se rattachent plus au commerce de détail (hors du champ). La situation de ces entreprises est mise à jour dans le RE d'après des renseignements de source administrative et les commentaires reçus lors des enquêtes, y compris ceux des entreprises prenant part à l'EMCD. Les méthodes suivies pour traiter les unités disparues et les unités classées incorrectement font partie des procédures d'échantillonnage et de mise à jour de la population.

Sources des données

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

La collecte des données est réalisée par les bureaux régionaux de statistique Canada. Ces derniers envoient un questionnaire aux répondants ou communiquent avec ceux ci par téléphone afin d'obtenir les valeurs de leurs ventes et de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entités qui participent à l'enquête pour la première fois reçoivent une lettre d'introduction en vue d'informer le répondant qu'un représentant de Statistique Canada l'appellera. Cet appel a pour but de présenter l'enquête, de confirmer l'activité de l'entreprise, d'établir et de commencer la collecte des données, et de répondre à toutes questions que le répondant pourrait avoir.

Beaucoup d'efforts sont déployés en vue de réduire au minimum la non réponse durant la collecte. Les méthodes utilisées incluent des techniques d'interview, comme l'utilisation de questions d'approfondissement et des techniques de persuasion, la replanification répétée des appels téléphoniques pour obtenir l'information et la mise en place de procédures indiquant aux intervieweurs comment s'y prendre avec les répondants qui refusent de participer à l'enquête.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non réponse totale pour toutes les variables, des réponses partielles sont acceptées. En outre, les questionnaires sont personnalisés pour la collecte de certaines variables, comme les stocks, de sorte que la collecte ait lieu durant les mois où les données sont disponibles.

Enfin, pour établir un climat de confiance entre les intervieweurs et les répondants, les cas sont généralement affectés au même intervieweur chaque mois. L'intervieweur peut ainsi établir une relation personnelle avec le répondant et renforcer la confiance de ce dernier.

Utilisation des données administratives

Réduire le fardeau de réponse est un défi à long terme pour Statistique Canada. Afin d'alléger le fardeau de réponse et de réduire les coûts reliés à l'enquête, notamment en ce qui a trait aux petites entreprises, Statistique Canada a examiné diverses options à la réalisation d'enquêtes. Les données administratives sont une source importante d'information sur les données commerciales et Statistique Canada s'efforce d'en faire une utilisation optimale. Ainsi, à partir du mois de référence d'octobre 2005, l'EMCD a réduit le nombre d'établissements simples de l'échantillon qui sont enquêtés directement et dérive plutôt les chiffres de vente pour ces établissements à partir des fichiers de la TPS en utilisant un modèle statistique. Le modèle explique les différences entre les ventes et les recettes déclarées aux fins de la TPS, ainsi que le décalage entre la période de référence de l'enquête et celle de la TPS.

Pour en savoir plus sur la méthode utilisée lors de la modélisation des ventes tirées de fichiers administratifs, veuillez consulter le document intitulé Enquête mensuelle sur le commerce de détail : Utilisation de données administratives.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

Premièrement, une vérification est faite durant la collecte des données. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validées, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Deuxièmement, après la collecte, les données sont soumises à une vérification statistique. Les valeurs très extrêmes risquant de perturber une tendance mensuelle ne pourront pas servir de base à l'étape de l'imputation.

Pour des informations, veuillez consulter la section 8 (Vérification) dans l'énoncé de qualité sous la rubrique 'Documentation' ci-dessous.

Imputation

Le processus d'imputation de l'EMCD a pour but de remplacer les données manquantes par des valeurs imputées. Des valeurs sont attribuées aux enregistrements pour lesquels la vérification a révélé des valeurs manquantes afin de s'assurer que les estimations soient de haute qualité et d'établir une cohérence interne plausible. Pour des raisons de fardeau de réponse, de coût et d'actualité des données, il est généralement impossible de réaliser auprès des répondants tous les suivis nécessaires pour résoudre les problèmes de réponses manquantes. Puisqu'il est souhaitable de produire un fichier de microdonnées complet et cohérent, on recourt à l'imputation pour traiter les cas persistants de données manquantes.

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois méthodes d'imputation d'après des données historiques. La première est l'application d'une tendance générale qui s'appuie sur une source unique de données historiques (données recueillies pour le mois précédent, pour le mois suivant ou pour le même mois l'année précédente). La deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois de l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques. Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

Les méthodes d'imputation fondées sur des données administratives sont sélectionnées automatiquement lorsqu'on ne dispose pas de données historiques pour un non répondant. La source de données administratives (ventes annuelles assujetties à la TPS) est le fondement de ces méthodes. Les ventes annuelles assujetties à la TPS sont utilisées pour deux types de méthode. L'une est une tendance générale que l'on utilise pour les structures simples, comme les entreprises ne comptant qu'un seul établissement et l'autre, appelée méthode de la médiane moyenne, est utilisée pour les unités dont la structure est plus complexe.

Estimation

L'estimation est un processus qui consiste à calculer une valeur approximative des paramètres de population inconnus en utilisant uniquement la partie de la population qui est incluse dans un échantillon. Des inférences sont ensuite faites au sujet des paramètres inconnus en utilisant les données d'échantillon et les renseignements connexes sur le plan de sondage.

Dans le cas de l'EMCD, de nouveaux processus d'estimation ont été mis en place au moyen du Système généralisé d'estimation (SGE) de Statistique Canada pour résoudre la question des unités influentes et appliquer des corrections spéciales durant le traitement des données. Diverses méthodes ont été établies pour estimer les ventes et les stocks des détaillants.

Pour les ventes des détaillants, la population est divisée en une partie observée (strates à tirage complet et à tirage partiel) et une partie non observée (strate à tirage nul). À partir de l'échantillon tiré à partir de la partie observée, on calcule une estimation pour la population au moyen d'un estimateur d'Horvitz Thompson où les réponses concernant les ventes sont pondérées par l'inverse des probabilités d'inclusion des unités échantillonnées. Ces poids (appelés poids d'échantillonnage) peuvent être interprétés comme étant le nombre de fois que chaque unité échantillonnée devrait être répétée pour représenter la population complète. Les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine pour produire une estimation du total des ventes pour chaque combinaison de groupe de commerce/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, de branche ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps. Pour la partie non observée de la population, on calcule un estimateur de type ratio au moyen de données auxiliaires. L'estimation du total des ventes des détaillants est égale à la somme des estimations produites pour les parties observée et non observé de la population.

Pour les stocks des détaillants, on se sert de l'échantillon sélectionné pour estimer les ventes pour calculer l'estimation au moyen d'un estimateur d'Horvitz Thompson pour la partie observée de la population. Puis, on utilise un ratio fondé sur l'échantillon pour produire l'estimation pour la partie non observée et on obtient l'estimation du total des stocks en additionnant les estimations obtenues pour les parties observée et non observée.

La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible de mesurer la variabilité de l'estimation de l'échantillon par rapport à sa valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à la valeur prévue.

Évaluation de la qualité

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité comprend la détection d'une divulgation directe possible, laquelle se produit lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou lorsque la cellule est dominée par quelques entreprises.

Révisions et désaisonnalisation

Des révisions des données brutes doivent être effectuées pour corriger les erreurs non dues à l'échantillonnage qui sont décelées. Ceci comporte généralement le remplacement de données imputées par des données déclarées, la correction de données déclarées précédemment, et de procéder à des estimations pour les nouvelles entreprises créées dont on ne connaissait pas l'existence au moment des estimations originales.

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont aussi effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle ne dépasse rarement trois ans.

L'EMCD utilise la méthode X11ARMMI/20001 de désaisonnalisation. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARMMI (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. À la fin de chaque année de calendrier, les données désaisonnalisées mensuelles sont révisées afin d'égaler la somme des estimations non ajustées.

Pour des informations supplémentaires, veuillez consulter les sections 11, 12 et 15 (Désaisonnalisation et estimation de la tendance-cycle; Ajustement des séries historiques et Comparabilité des données) dans l'énoncé de qualité sous la rubrique 'Documentation' ci-dessous.

Exactitude des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population.

Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements incorrects ou qu'il ne répond pas à certaines questions, quand une unité hors du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie. Bien que l'effet des erreurs non dues à l'échantillonnage soit difficile à évaluer, certaines mesures, comme les taux de réponse et d'imputation, peuvent donner une idée du niveau éventuel de ce type d'erreur.

Les coefficients de variation (CV) et les taux de réponse sont d'importantes mesures de la qualité des données qui permettent de valider les résultats de l'EMCD.

Le coefficient de variation, défini comme étant l'erreur type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

Pour des informations supplémentaires, veuillez consulter les sections 6.1 et 13 (Réponse et non-réponse et Évaluation de la qualité des données) dans l'énoncé de qualité sous la rubrique 'Documentation' ci-dessous.

Pour obtenir une liste détaillée des coefficients de variation pour tous les groupes de commerce pour le Canada et des coefficients de variation pour toutes les provinces et les territoires, veuillez consulter le tableau 4 de la publication électronique sur l'enquête mensuelle sur le commerce de détail, catalogue No. 63-005XWF, disponible au lien « Publications » situé au menu latéral ci-dessus.

Documentation

Signaler un problème sur cette page

Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?

S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.

Avis de confidentialité

Date de modification :