Enquête sur le commerce de détail (mensuelle) (EMCD)

Information détaillée pour septembre 2017

Statut :

Active

Fréquence :

Mensuelle

Numéro d'enregistrement :

2406

L'Enquête mensuelle sur le commerce de détail recueille des informations sur les ventes, le commerce électronique et le nombre de points de vente au détail selon la province, le territoire et certaines régions métropolitaines de recensement (RMR) auprès d'un échantillon de détaillants.

Date de la parution - 23 novembre 2017

Aperçu

L'Enquête mensuelle sur le commerce de détail recueille des renseignements sur les ventes, le commerce électronique et le nombre de points de vente au détail selon la province, le territoire et certaines régions métropolitaines de recensement (RMR) auprès d'un échantillon de détaillants. Les estimations des ventes des détaillants représentent un indicateur mensuel important des habitudes d'achat des consommateurs au Canada. En outre, les ventes au détail sont une composante importante du produit intérieur brut, qui mesure la production du Canada, et qui font partie de nombreux modèles économiques utilisés par les organismes publics et privés. La Banque du Canada s'appuie, en partie, sur les estimations mensuelles des ventes au détail pour prendre des décisions qui influent sur les taux d'intérêt. Les entreprises utilisent les estimations des ventes au détail pour comparer leurs résultats à la moyenne de leur industrie et pour élaborer des stratégies d'investissement.

Période de référence : mois

Période de collecte : La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois civil en question.

Sujets

  • Commerce de détail et de gros
  • Ventes au détail selon le type de magasin

Sources de données et méthodologie

Population cible

La population cible comprend tous les établissements statistiques figurant dans le Registre des entreprises (RE) de Statistique Canada qui sont classés dans le secteur du commerce de détail d'après le Système de classification des industries de l'Amérique du Nord (SCIAN 2012). La fourchette de codes du SCIAN pour le secteur du commerce de détail varie de 441100 à 454110.

Les exclusions de la population cible sont les établissements ayant une valeur de revenu brut d'entreprise (RBE) manquante ou de zéro dans le RE et les établissements figurant dans les industries suivantes du SCIAN, non couvertes :

- 4542 (exploitants de distributeurs automatiques)
- 45431 (marchands de combustible)
- 45439 (autres établissements de vente directe)
Documentation complémentaire (hyperlien au SCIAN 2012)

Élaboration de l'instrument

Un questionnaire électronique et un questionnaire papier sont utilisés pour recueillir les données de l'EMCD. Les questionnaires ont été élaborés à Statistique Canada, puis examinés et mis à l'essai sur le terrain dans les deux langues officielles. À l'étape de l'élaboration de l'enquête nouveau, Statistique Canada a consulté un certain nombre de grands détaillants ainsi que des associations industrielles. En 2016, on a ajouté le SCIAN 454110 au questionnaire de l'EMCD et le questionnaire est devenu disponible aux répondants en format électronique. Le questionnaire sur les ventes et les stocks de boissons alcooliques est inchangé.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

Le Registre des entreprises est une base de données sur la population des entreprises canadiennes. Statistique Canada l'a créé principalement pour établir les bases de sondage de ses enquêtes économiques. Il a été conçu de manière à faciliter la coordination de la couverture des enquêtes auprès des entreprises ainsi qu'à uniformiser la classification des unités déclarantes. Le registre permet également de rassembler des données sur les entreprises (caractéristiques, durée de vie, etc.).

Les nouvelles données recueillies dans le cadre du programme d'enquêtes de Statistique Canada ainsi que les fichiers du numéro d'entreprise de l'Agence de revenu du Canada (ARC) sont les principales sources d'information du Registre des entreprises. Grâce aux données administratives de l'ARC, on peut créer l'univers de toutes les entités commerciales.

Le Registre des entreprises couvre toutes les entreprises* canadiennes rencontrant au moins un des trois critères suivants :

(1) disposent d'une main-d'oeuvre pour laquelle des retenues sur la paie sont remises à l'ARC;

(2) réalisent un minimum de 30 000$ de chiffre d'affaires;

(3) sont constituées en société en vertu d'une loi fédérale ou provinciale et ont rempli un formulaire fédéral de déclaration de revenus des sociétés au cours des trois dernières années.

Les données fournies dans nos produits font état du nombre d'emplacements statistiques selon l'activité (Système de classification des industries de l'Amérique du Nord), les codes de classification géographique et les tranches d'effectif.

Sources des données

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

La collecte des données est réalisée par les bureaux régionaux de Statistique Canada. Ces derniers envoient un questionnaire électronique ou en papier aux répondants ou communiquent avec ceux-ci par téléphone afin d'obtenir les valeurs de leurs ventes, de leurs ventes électroniques, de leurs stocks, et de confirmer l'ouverture ou la fermeture des emplacements d'affaires. Ils effectuent aussi un suivi auprès des non-répondants. La collecte des données débute environ sept jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Les entreprises qui participent à l'enquête pour la première fois y sont introduites à l'aide de questions préliminaires qui confirment l'activité commerciale du répondant et ses coordonnées.

Si les données demandées ne sont pas disponibles au moment de la collecte, la meilleure estimation fournie par le répondant est acceptée et est révisée par la suite, quand les données réelles sont disponibles.

Pour réduire au minimum la non-réponse totale pour toutes les variables, des réponses partielles sont acceptées.

LES SOURCES DE DONNÉES ADMINISTRATIVES
La gestion du fardeau de réponse représente un problème constant pour Statistique Canada. Pour tenter de réduire le fardeau de réponse et les coûts d'enquête, particulièrement pour les petites entreprises, l'EMCD dérive les données sur les ventes des établissements à faibles revenus des fichiers de la taxe sur les produits et services (TPS) en utilisant un estimateur par quotient. L'estimateur par quotient augmente aussi la précision de la portion de l'estimation déterminée au moyen de l'enquête.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

La vérification est effectuée lors de la collecte des données. Après leur collecte par téléphone ou après réception des questionnaires remplis, les données sont saisies et/ou vérifiées au moyen d'applications personnalisées de saisie de données. Les contrôles réalisés durant la collecte des données, appelés contrôles sur le terrain, comprennent généralement des contrôles de validité et certains contrôles de cohérence simples. Ils servent aussi à déceler les erreurs commises durant l'interview par le répondant ou par l'intervieweur et de repérer l'information manquante à l'étape de la collecte en vue de réduire le besoin d'un suivi ultérieur. Les contrôles sur le terrain ont également pour but d'épurer les réponses. Dans le cas de l'EMCD, les réponses du mois courant sont comparées aux réponses fournies par le répondant le mois précédent et (ou) l'année précédente pour le mois courant. Les contrôles sur le terrain permettent de repérer les problèmes que posent les procédures de collecte des données et la conception des questionnaires, et de déterminer s'il faut offrir une formation supplémentaire aux intervieweurs.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validé, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Après la collecte, les données sont soumises à une vérification statistique dont la nature est plus empirique. On exécute la vérification statistique avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Il convient de souligner qu'aucun ajustement n'est fait à cette étape pour corriger les valeurs extrêmes déclarées.

La première étape de vérification statistique consiste à repérer les réponses qui seront soumises aux règles de vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.
Le premier ensemble de contrôles est fondé sur la méthode d'Hidiroglou-Berthelot qui consiste à examiner le rapport des données du mois courant fournies par un répondant à des données historiques (c.-à-d. dernier mois ou même mois l'année précédente) ou administratives. Si le rapport calculé pour le répondant diffère significativement de ceux obtenus pour des répondants dont les caractéristiques sont comparables en ce qui concerne le groupe industriel et/ou la région géographique, la réponse est considérée comme une valeur extrême.

Le second ensemble de contrôles consiste en des vérifications de la part de marché. Cette méthode, qui s'appuie sur les données du mois courant uniquement, permet de vérifier les données fournies par tous les répondants, mêmes ceux pour lesquels on ne dispose pas de données historiques ou de données auxiliaires. Par conséquent, parmi un groupe de répondants présentant des caractéristiques similaires en ce qui concerne le groupe industriel et (ou) la région géographique, toute valeur dont la contribution pondérée au total du groupe est trop importante sera considérée comme une valeur extrême.

Pour les contrôles fondés sur la méthode d'Hidiroglou-Berthelot, les données jugées extrêmes ne sont pas incluses dans les modèles d'imputation (ceux fondés sur les ratios). En outre, les données considérées comme des valeurs extrêmes lors de la vérification de la part de marché ne sont pas incluses dans les modèles d'imputation où les moyennes et les médianes sont calculées pour imputer des valeurs pour les réponses pour lesquelles il n'existe pas de données historiques.

Conjointement avec les vérifications statistiques effectuées après la collecte de données, on procède à la détection d'erreurs des données extraites des fichiers administratifs. Les données modélisées de la TPS sont également assujetties à une phase de vérification approfondie. Chaque fichier sur lequel les données modélisées sont fondées est vérifié de même que les valeurs modélisées. Les vérifications sont effectuées au niveau agrégé (industrie, géographie) afin de détecter les fichiers qui dévient de la norme (soit en exhibant des différences d'un mois à l'autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui faillissent ces étapes de contrôle sont sujettes à une vérification manuelle, et si nécessaire, à une action corrective.

Imputation

Dans le cas de l'EMCD, on peut fonder l'imputation des valeurs manquantes sur des données historiques ou sur des données administratives. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et (ou) du mois de référence en question.

Il existe trois types de méthode d'imputation d'après des données historiques. Le premier est l'application d'une tendance générale qui s'appuie sur une source unique de données historiques (mois précédent, données recueillies pour le mois suivant ou données recueillies pour le même mois l'année précédente). Le deuxième est un modèle de régression dans lequel sont utilisées simultanément les données provenant du mois précédent et celles provenant du même mois l'année précédente. La troisième méthode consiste à remplacer directement les valeurs manquantes par des données historiques.

Selon le mois de référence, il existe, pour le choix de la méthode, un ordre de préférence en vue d'assurer une imputation de haute qualité. Le troisième type de méthode d'imputation historique est toujours la dernière option considérée pour chaque mois de référence.

La méthode d'imputation fondée sur des données administratives est sélectionnée automatiquement lorsqu'on ne dispose pas de données historiques pour un non-répondant. Des tendances sont alors appliquées à la source de données administratives (mesure de taille mensuelle) selon que la structure est simple (entreprises ne comptant qu'un seul établissement) ou complexe.

Estimation

L'estimation est le processus que Statistique Canada applique pour obtenir des valeurs se rapportant à la population d'intérêt afin de pouvoir tirer des conclusions sur cette population à partir d'information provenant d'un échantillon seulement de la population. L'EMCD utilise plus précisément un estimateur par quotient.

L'estimation par quotient consiste à remplacer les poids de sondage initiaux (définis comme étant l'inverse de la probabilité de sélection dans l'échantillon) par de nouveaux poids de façon à satisfaire les contraintes de calage. Le calage veille à ce que le total d'une variable auxiliaire estimé à partir de l'échantillon soit égal au total de cette même variable auxiliaire pour toute la population et que les nouveaux poids de sondage soient aussi proches que possible (selon une certaine mesure de distance) des poids de sondage initiaux.

Supposons, par exemple, que le total connu de la variable auxiliaire pour la population soit égal à 100 et que le total estimé soit égal à 90 si l'on se fonde sur un échantillon; nous obtenons donc une sous-estimation d'environ 10 %. Puisque nous connaissons le total de la variable auxiliaire pour la population, il serait raisonnable d'augmenter les poids des unités échantillonnées afin que l'estimation soit exactement égale à cette valeur. Puisque la variable d'intérêt est liée à la variable auxiliaire, il n'est pas déraisonnable de penser que l'estimation des ventes fondée sur les mêmes échantillon et poids que l'estimation de la variable auxiliaire puisse également être une sous-estimation d'environ 10 %. Si c'est en effet le cas, les poids ajustés pourraient donc permettre de produire un autre estimateur des ventes totales. Cet autre estimateur s'appelle l'estimateur par quotient.

L'estimateur par quotient essaie essentiellement de compenser les échantillons « malchanceux » et rapproche l'estimation du total réel. Le gain de variance dépendra de la solidité du lien entre la variable d'intérêt et les données auxiliaires.

La portion à tirage nul est prise en compte par l'estimateur par quotient. Cette prise en compte se fait en incluant simplement la portion à tirage nul dans les totaux de contrôle pour la portion échantillonnée. Cela augmente les poids de la portion échantillonnée de telle sorte que les estimations seront ajustées afin de prendre en compte la portion à tirage nul.

Les valeurs calculées des ventes pondérées sont additionnées selon le domaine, pour produire les estimations des ventes totales pour chaque combinaison de groupe industriel/région géographique. Un domaine est défini comme les valeurs de classification les plus récentes disponibles dans le RE pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage initiales parce que les unités peuvent avoir changé de taille, d'industrie ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps.

Ventes en volume : La valeur du commerce de détail est mesurée de deux façons : par la prise en compte des effets de la variation des prix sur la valeur des ventes et par l'élimination des effets de la variation des prix. La première mesure est la valeur des ventes au détail en dollars courants et la seconde, la valeur des ventes au détail en dollars constants. Pour calculer l'estimation en dollars courants, on agrège la valeur des ventes pondérées de tous les points de vente au détail. Pour calculer l'estimation en dollars constants, il faut d'abord rajuster la valeur des ventes par rapport à une année de base en utilisant l'Indice des prix à la consommation, puis additionner les valeurs résultantes. Voir à ce sujet le document « Les ventes en volume pour le commerce de détail » (sous 'Documentation' ci-dessous).
La variance est la mesure de précision utilisée dans le cas de l'EMCD pour évaluer la qualité de l'estimation des paramètres de population et pour obtenir des inférences valides. Pour la partie observée de la population, la variance est calculée directement à partir d'un échantillon aléatoire simple stratifié sans remise.

Les estimations d'échantillon peuvent différer de la valeur prévue des estimations. Cependant, puisque l'estimation est fondée sur un échantillon probabiliste, il est possible de mesurer la variabilité de l'estimation de l'échantillon par rapport à sa valeur prévue. La variance d'une estimation est une mesure de la précision de l'estimation d'échantillon qui est définie comme étant la moyenne, sur tous les échantillons possibles, de l'écart quadratique de l'estimation par rapport à la valeur prévue.

Évaluation de la qualité

La comparabilité des résultats d'enquête combinés est analysée avant la diffusion cela comprend, en général, un examen détaillé des réponses individuelles, de la situation économique dans son ensemble et des tendances historiques.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

L'analyse de la confidentialité porte sur la détection d'une divulgation directe possible, laquelle se produit lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou lorsque la cellule est dominée par quelques entreprises.

Révisions et désaisonnalisation

Les révisions des données brutes sont requises afin de corriger les erreurs non dues à l'échantillonnage connus. Celles incluent normalement le remplacement des données imputées avec des données déclarées, des corrections des données déclarées auparavant, et des estimations des naissances nouvelles qui n'étaient pas connues au temps d'estimations originales.

Les données brutes sont révisées, sur une base mensuelle, pour le mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. C'est donc dire que lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, à l'égard des données brutes pour novembre. En outre, des révisions sont effectuées une fois par année, au moment de la première publication des données de février, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important que l'on ait décelé, qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème décelé, mais elle dépasse rarement trois ans. Toutefois, la période de révision peut être plus longue lors de révisions historiques ou de restratification.

Les données de l'Enquête mensuelle sur le commerce de detail sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste essentiellement, dans un premier temps, à extrapoler une année de données brutes avec des modèles ARIMA (modèles autorégressifs à moyennes mobiles intégrées); et dans un deuxième temps, à désaisonnaliser la série brute prolongée par la méthode X-11. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent aussi être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA, et la tendance est sensible aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l'effet des influences saisonnières et du calendrier. Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d'un mois à l'autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

Exactitude des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population.

Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements incorrects ou qu'il ne répond pas à certaines questions, quand une unité hors du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie. Bien que l'effet des erreurs non dues à l'échantillonnage soit difficile à évaluer, certaines mesures, comme les taux de réponse et d'imputation, peuvent donner une idée du niveau éventuel de ce type d'erreur.

Les coefficients de variation (CV) et les taux de réponse sont des importantes mesures de la qualité des données qui permettent de valider les résultats de l'EMCD.

Le coefficient de variation, défini comme étant l'erreur type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

TAUX DE RÉPONSE
Le taux de réponse moyen collecte pour 2016 est de 88.5 %.

ERREUR NON DUE À L'ÉCHANTILLONNAGE
La vérification des données est l'application de contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Durant le processus d'enquête de l'EMCD, les données sont vérifiées à deux moments distincts.

BIAIS DE NON-RÉPONSE
La non-réponse a deux effets sur les données : premièrement, elle introduit un biais dans les estimations si les non-répondants diffèrent des répondants en ce qui concerne les caractéristiques mesurées et, deuxièmement, elle fait augmenter la variance d'échantillonnage des estimations, parce que la taille effective de l'échantillon est réduite comparativement à celle considérée au départ.

L'ampleur des efforts déployés pour obtenir une réponse auprès d'un non-répondant dépend des contraintes budgétaires et de temps, de l'effet de la non-réponse sur la qualité globale et du risque de biais dû à la non-réponse.

La méthode principalement utilisée pour réduire l'effet de la non-réponse à l'étape de l'échantillonnage consiste à augmenter la taille de l'échantillon en appliquant un taux de suréchantillonnage déterminé d'après les résultats d'enquêtes similaires.

Les cas de non-réponse qui surviennent malgré les méthodes appliquées aux étapes de l'échantillonnage et de la collecte pour réduire l'effet de la non-réponse sont traités par imputation.

Afin de déterminer l'importance de la non-réponse qui a lieu chaque mois, on calcule divers taux de réponse. Pour un mois de référence donné, on produit les estimations au moins deux fois (estimations provisoires et estimations révisées). Entre les deux exécutions, certaines données fournies par les répondants peuvent être jugées inutilisables et des valeurs imputées peuvent être corrigées au moyen de données fournies par les répondants. Par conséquent, les taux de réponse sont calculés après chaque exécution du processus d'estimation.

Pour l'EMCD, deux types de taux sont calculés (non pondérés et pondérés). Afin d'évaluer l'efficacité du processus de collecte, on calcule les taux de réponse non pondérés. Les taux pondérés, fondés sur le poids d'estimation et la valeur de la variable d'intérêt, évaluent la qualité de l'estimation.

Afin d'obtenir une meilleure idée du succès du processus de collecte de données, on calcule deux taux non pondérés appelés « taux de résultat de la collecte » et « taux de résultat de l'extraction ». On calcule ces taux en divisant le nombre de répondants par le nombre d'unités avec lesquelles on a essayé de prendre contact ou pour lesquelles on a essayé de recevoir des données extraites. Les déclarants non mensuels (répondants bénéficiant de modalités de déclaration spéciales leur permettant de ne pas produire de déclaration chaque mois, mais pour lesquels des données réelles sont disponibles lors des révisions subséquentes) sont exclus du numérateur ainsi que du dénominateur pour les mois où aucun contact n'est pris avec eux. Brièvement, les divers taux de réponse se calculent comme suit :

Taux pondérés :
Taux de réponse des unités faisant partie de l'échantillon (estimation) =
Somme des ventes pondérées des unités avec situation de réponse i / Somme des ventes pondérées des unités faisant partie de l'échantillon

où i = unités pour lesquelles il existe des données déclarées qui seront utilisées dans l'estimation ou qui sont des refus convertis, ou pour lesquelles il existe des données déclarées qui n'ont pas encore été évaluées pour l'estimation.


Taux non pondérés :
Taux de réponse des unités faisant partie de l'échantillon (collecte) = Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse iv

où iii = unités pour lesquelles il existe des données déclarées (dont le cas n'est pas résolu, utilisées ou non utilisées pour l'estimation) ou qui sont des refus convertis;
où iv = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de répondre, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.

Taux de réponse des unités modélisées à partir de données administratives (extraction) = Nombre de questionnaires avec situation de réponse vi / Nombre de questionnaires avec situation de réponse vii
où vi = unités dans le champ d'observation pour lesquelles il existe des données (utilisables ou non utilisables) extraites des fichiers administratifs;
où vii = toutes les unités susmentionnées, ainsi que les unités qui ont refusé de déclarer la source de données administratives, les unités avec lesquelles on n'a pas pris contact et d'autres types d'unités non répondantes.
(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation)

Taux de résultat de la collecte = Nombre de questionnaires avec situation de réponse iii / Nombre de questionnaires avec situation de réponse viii
où iii = même que iii défini plus haut;
où viii = même que iv, à part l'exclusion des unités avec lesquelles on a pris contact, parce que leur réponse n'est pas disponible pour un mois particulier, puisqu'il s'agit de déclarants non mensuels.

Taux de résultat de l'extraction = Nombre de questionnaires avec situation de réponse ix / Nombre de questionnaires avec situation de réponse vii
où ix = même que vi, avec l'ajout des unités extraites qui ont été imputées ou qui étaient hors du champ de l'enquête;
où vii = même que vii défini plus haut.

(% de questionnaires recueillis par rapport à l'ensemble des questionnaires dans le champ d'observation que nous avons tenté de recueillir)

Tous les taux pondérés et non pondérés susmentionnés sont calculés au niveau du groupe industriel, de la région et du groupe de taille, ainsi que pour toute combinaison de ces niveaux.

ERREUR DE COUVERTURE
Les erreurs de couverture comprennent les omissions, les inclusions erronées, les doubles comptes et les erreurs de classification des unités dans la base de sondage.
Le Registre des entreprises (RE) est la base de sondage de l'enquête sur le commerce de détail. Le RE est un centre de service de données mis à jour à l'aide de plusieurs sources, notamment les fichiers de données administratives, les commentaires reçus dans le cadre des enquêtes-entreprises de Statistique Canada, et les activités d'établissement de profils, qui comprennent un contact direct avec les entreprises pour obtenir des renseignements sur leurs activités, ainsi que les résultats de recherche sur Internet. L'utilisation du RE assure la qualité de données, tout en évitant les chevauchements entre les enquêtes et en allégeant le fardeau de réponse le plus possible.

AUTRES ERREURS NON DUES À L'ÉCHANTILLONNAGE
L'erreur peut se produire lors des diverses étapes du traitement (codage, entrée, vérification, pondération, totalisation, etc.). Il est difficile de mesurer les erreurs non liées à l'échantillonnage. De plus, il faut les cerner à un niveau où elles ne nuisent pas à l'utilisation ou à l'interprétation des chiffres définitifs.

Des mesures ont été prises afin de minimiser les erreurs non liées à l'échantillonnage. Ainsi, les unités ont été définies avec beaucoup de précision au moyen des listes les plus à jour. Les questionnaires ont été conçus avec soin afin de réduire au minimum les différentes interprétations possibles. De plus, les diverses étapes de vérification et de traitement ont fait l'objet de contrôles d'acceptation détaillés et on n'a absolument rien négligé pour que le taux de non-réponse et le fardeau de réponse soient faibles.

Documentation

Date de modification :