Enquête mensuelle sur les services de restauration et débits de boissons (EMSRDB)

Information détaillée pour juillet 2017

Statut :

Active

Fréquence :

Mensuelle

Numéro d'enregistrement :

2419

L'enquête procure de l'information qui permet de mesurer les résultats économiques ainsi que la santé de l'industrie des services de restauration et débits de boissons dans l'économie canadienne. Le milieu des affaires utilise ces données pour analyser la performance et l'évolution du marché.

Date de la parution - 25 septembre 2017

Aperçu

L'enquête mensuelle sur les services de restauration et débits de boissons fournit des estimations des ventes pour les restaurants, traiteurs et débits de boissons par province et territoire et par industrie au niveau de quatre ou de six chiffres du Système de classification des industries de l'Amérique du Nord (SCIAN). Ces données sont utilisées à des fins de consultation, d'étude de marché et de planification par les ministères fédéraux et provinciaux, les associations et les établissements reliés à l'industrie. Les ministères fédéraux et provinciaux se servent de cette information pour calculer les portions taxables provinciales.

Période de référence : Mois

Période de collecte : La collecte des données débute environ 1-2 jours ouvrables après la fin du mois de référence et se poursuit pendant tout le mois en question.

Sujets

  • Hébergement et services de restauration
  • Services aux entreprises, aux consommateurs et liés à la propriété

Sources de données et méthodologie

Population cible

La population cible est constituée de tous les établissements statistiques classés parmi les services de restauration et débits de boissons (SCIAN 722) selon le Système de classification des industries de l'Amérique du Nord (SCIAN 2012).

Élaboration de l'instrument

Ce questionnaire porte sur les données des ventes mensuelles des établissements de services de restauration. Les questions que l'on trouve dans le questionnaire sont demeurées inchangées au cours des années. Dans le cadre du remaniement de l'enquête de 2007, des modifications mineures ont été apportées à la présentation pour en faciliter l'utilisation et clarifier certains éléments. Les associations représentatives de l'industrie ont été consultées à ce sujet.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

Sources des données

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

La collecte, la saisie, les vérifications et le suivi sont effectués par le personnel du bureau régional.

Les données sont recueillies selon diverses méthodes, notamment la collecte téléphonique, par envoi et retour postal et au moyen du questionnaire électronique.

Des procédures de suivi sont appliquées lorsqu'un questionnaire n'a pas été reçu à la fin d'une période donnée.

Les données administratives (provenant de la taxe sur les produits et services, TPS) sont la principale source d'estimations pour la strate à tirage nul et sont utilisées comme variable auxiliaire pour améliorer les estimations de la strate à tirage partiel.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

La vérification des données consiste à effectuer des contrôles pour déceler les entrées manquantes, invalides ou incohérentes, ou pour repérer les enregistrements de données susceptibles d'être erronés. Dans le cadre du processus d'Enquête mensuelle sur les services de restauration et débits de boissons, la vérification des données est effectuée à deux moments distincts.

Le premier processus de vérification a lieu au cours de la collecte de données. Après leur collecte par téléphone, par questionnaire électronique ou lors de la réception du questionnaire rempli envoyé par la poste, les données sont saisies à l'aide d'applications informatiques personnalisées. Toutes sont soumises à une vérification.

Tout enregistrement de données rejeté lors des contrôles préliminaires fait l'objet d'un suivi auprès du répondant afin de valider les données soupçonnées d'être incorrectes. Une fois validées, les données recueillies sont transmises de façon régulière au Bureau central à Ottawa.

Une vérification statistique a également lieu après la collecte des données et avant l'imputation, afin de repérer les données qui serviront de base pour l'imputation de valeurs pour les non-répondants. Les valeurs très extrêmes risquant de perturber une tendance mensuelle sont exclues des calculs de tendance lors de la vérification statistique. Les données déclarées pour le mois de référence courant sont soumises à divers contrôles.

Les vérifications sont effectuées à un niveau agrégé (industrie, géographie), afin de détecter les fichiers qui dévient de la norme, soit en présentant des différences d'un mois à l'autre trop importantes ou qui diffèrent considérablement des autres unités. Toutes les données qui échouent à ces étapes de contrôle sont sujettes à une vérification manuelle et, si nécessaire, à une action corrective.

Imputation

L'imputation est utilisée pour pallier la non-réponse et les données manquantes. Les méthodes d'imputation comprennent l'utilisation de tendances mensuelles provenant de données historiques et administratives (revenus de TPS). Les données historiques et administratives rejetées lors de la vérification statistique sont considérées comme des observations aberrantes et ne sont pas utilisées par le système d'imputation. Le choix de la méthode appropriée est fondé sur une stratégie qui dépend de l'existence de données historiques ou de données administratives et/ou du mois de référence en question.

Estimation

Il s'agit du processus que Statistique Canada applique pour obtenir des valeurs de la population d'intérêt et tirer des conclusions sur cette population à partir de l'information provenant d'un échantillon seulement de la population. Les ventes sont estimées à partir d'une estimation par le quotient. Cette estimation par le quotient consiste à remplacer les poids de sondage initiaux (définis comme étant l'inverse de la probabilité de sélection dans l'échantillon) par de nouveaux poids de façon à satisfaire des contraintes de calage. Le calage veille à ce que le total d'une variable auxiliaire estimé à partir de l'échantillon soit égal au total de cette même variable auxiliaire pour toute la population et que ces nouveaux poids d'estimation soient aussi proches que possible (selon une certaine mesure de distance) des poids de sondage initiaux.

Supposons, par exemple, que le total connu de la variable auxiliaire pour la population soit égal à 100 et qu'il soit égal à 90 en se fondant sur un échantillon du total estimé; nous obtenons donc une sous-estimation d'environ 10 %. Puisque nous connaissons le total de la variable auxiliaire pour la population, il serait raisonnable d'augmenter les poids des unités échantillonnées afin que l'estimation soit exactement égale à cette valeur. Puisque la variable d'intérêt est liée à la variable auxiliaire, il n'est pas déraisonnable de penser que l'estimation des ventes fondée sur les mêmes échantillon et poids que l'estimation de la variable auxiliaire puisse également être une sous-estimation d'environ 10 %. Si c'est en effet le cas, les poids ajustés pourraient donc permettre de produire un autre estimateur des ventes totales. Cet autre estimateur s'appelle l'estimateur par le quotient. L'estimateur par le quotient essaie essentiellement de compenser les échantillons « malchanceux » et rapproche l'estimation du total réel. Le gain de variance dépendra de la solidité du lien entre la variable d'intérêt et les données auxiliaires.

La portion à tirage nul est prise en compte en incluant ses données de variable auxiliaire dans le total de population connu. Cela augmente les poids de la portion échantillonnée de telle sorte que les estimations incluront la portion à tirage nul.

Comme pour d'autres enquêtes mensuelles de Statistique Canada, les valeurs pondérées des ventes ainsi calculées sont totalisées par domaine pour produire une estimation du total des ventes pour chaque combinaison des groupes industriels/région géographique. Un domaine est défini comme correspondant aux valeurs de classification les plus récentes disponibles dans le Registre des entreprises pour l'unité et la période de référence de l'enquête. Les domaines peuvent différer des strates d'échantillonnage originales, parce que les unités peuvent avoir changé de taille, de groupe de commerce ou d'emplacement. Les changements de classification sont reflétés immédiatement dans les estimations et ne sont pas cumulés au cours du temps.

L'erreur type et la variance des estimations sont obtenues directement à partir de l'échantillon aléatoire simple stratifié.

Évaluation de la qualité

Avant d'être diffusés, les résultats combinés de l'enquête sont analysés aux fins de comparabilité. En général, cette opération consiste à examiner en détail les réponses individuelles, à revoir la conjoncture économique générale et les tendances historiques, et enfin à comparer ces résultats avec ceux provenant d'autres sources de données.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Des révisions des données brutes doivent être effectuées pour corriger les erreurs décelées non dues à l'échantillonnage. Ceci consiste généralement à remplacer les données imputées par des données déclarées, à corriger des données déclarées précédemment et à procéder à des estimations pour les nouvelles entreprises créées inconnues au moment des estimations originales.
Les données brutes (non désaisonnalisées) sont révisées, sur une base mensuelle, pour les deux mois précédant immédiatement le mois de référence en cours qui fait l'objet de la publication. Ainsi, lorsque les données pour décembre sont publiées pour la première fois, on procédera aussi à des révisions, au besoin, sur les données brutes de novembre et octobre.

En outre, des révisions sont effectuées une fois par année, au moment de la première publication des données de mars, pour tous les mois de l'année précédente. On vise ainsi à corriger tout problème important ayant été décelé et qui s'applique pour une période prolongée. La période de révision proprement dite dépend de la nature du problème relevé, mais elle dépasse rarement trois ans. Toutefois, la période de révision peut être prolongée lors de révisions historiques ou de restratification.

Les données de l'Enquête mensuelle sur les services de restauration et débits de boissons sont désaisonnalisées en utilisant la méthode X12-ARIMA. Cette technique consiste à extrapoler une année de données brutes avec un modèle ARIMA (modèle autorégressif à moyennes mobiles intégrées) et à désaisonnaliser la série chronologique brute. Ensuite, les données désaisonnalisées sont ajustées aux totaux annuels des données brutes.

Les données désaisonnalisées doivent également être révisées. Elles doivent notamment rendre compte des révisions déterminées pour les données brutes. Par ailleurs, les estimations désaisonnalisées sont calculées à partir de X-12-ARIMA et sont sensibles aux valeurs les plus récentes déclarées dans les données brutes. C'est pourquoi, au moment de la diffusion de nouvelles données pour chaque mois, les valeurs désaisonnalisées pour les trois mois précédents sont révisées. Les séries de données désaisonnalisées sont des données chronologiques qui ont été modifiées pour éliminer l'effet des influences saisonnières et du calendrier. Pour cette raison, la désaisonnalisation des données permet des comparaisons plus significatives des conditions économiques d'un mois à l'autre.

Une fois par année, les options de désaisonnalisation sont révisées afin d'intégrer les données les plus récentes. Des estimations désaisonnalisées révisées pour chacun des mois des années civiles précédentes sont diffusées en même temps que la révision annuelle des données brutes. La période exacte de révision dépend de la période de révision des données brutes.

La pratique normale veut qu'au bout de quelques années l'échantillon soit renouvelé, afin de garantir que la base de sondage est à jour en ce qui concerne les créations, les disparitions et les autres changements relatifs à la population observée. À cette fin, un nouvel échantillon a été sélectionné en novembre 2015 et a été utilisé en parallèle avec l'ancien échantillon jusqu'à mai 2016. Ce nouvel échantillon tenait également compte des améliorations apportées au Registre des entreprises depuis le dernier renouvellement de l'échantillon (restratification) effectué en décembre 2008. En outre, la méthode d'enquête a été peaufinée afin d'améliorer l'imputation des non-répondants, la calendarisation des données déclarées par les répondants qui ne déclarent pas de données pour un mois complet, l'utilisation des données administratives (taxes sur les produits et services) et la modification des options de désaisonnalisation.

Exactitude des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs dont l'erreur d'échantillonnage n'est que l'une des composantes. L'erreur d'échantillonnage survient lorsque les observations sont faites uniquement sur un échantillon et non sur l'ensemble de la population.

Toutes les autres erreurs commises aux diverses phases de l'enquête sont appelées erreurs non dues à l'échantillonnage. Des erreurs de ce type peuvent survenir, par exemple, quand un répondant fournit des renseignements incorrects ou qu'il ne répond pas à certaines questions, quand une unité de la population cible est omise ou considérée plus d'une fois, quand une unité hors du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie. Alors que l'impact des erreurs non dues à l'échantillonnage est difficile à évaluer, certaines mesures telles que les taux de réponse et d'imputation peuvent être utilisées comme des indicateurs du niveau potentiel d'erreur non due à l'échantillonnage.

Les coefficients de variation (CV) et les taux de réponse sont d'importantes mesures de la qualité des données qui permettent de valider les résultats de l'EMCD.

Le coefficient de variation, défini comme étant l'erreur type divisée par l'estimation d'échantillon, est une mesure de la précision relative. Puisque le coefficient de variation est calculé d'après les réponses des unités individuelles, il mesure aussi certaines erreurs non dues à l'échantillonnage.

Signaler un problème sur cette page

Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?

S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.

Avis de confidentialité

Date de modification :