Enquête nationale sur les voyages (ENV)

Information détaillée pour premier trimestre de 2019

Statut :

Active

Fréquence :

Trimestrielle

Numéro d'enregistrement :

5232

L'Enquête nationale sur les voyages fournit des statistiques sur les activités des résidents du Canada en ce qui a trait au tourisme intérieur et international. Elle a été élaborée pour mesurer le volume des activités, les caractéristiques et les répercussions économiques du tourisme.

Date de la parution - 27 août 2019

Aperçu

L'Enquête nationale sur les voyages a été élaborée pour remplacer entièrement l'Enquête sur les voyages des résidents du Canada (numéro d'enregistrement 3810) et pour remplacer la composante des résidents canadiens de l'Enquête sur les voyages internationaux (numéro d'enregistrement 3152). L'Enquête nationale sur les voyages recueille des renseignements concernant les voyages intérieurs et internationaux des résidents du Canada.

L'Enquête nationale sur les voyages, qui est parrainée par Statistique Canada, vise à mesurer les caractéristiques et les répercussions économiques des activités touristiques des résidents du Canada. Les objectifs de l'enquête consistent à fournir des renseignements concernant le nombre de voyages et les dépenses des résidents du Canada, selon l'origine du voyage, la destination, la durée, le type d'hébergement utilisé, les raisons du voyage, le mode de déplacement, etc., afin de produire des données sur l'incidence des voyages et d'établir le profil sociodémographique des voyageurs et des non voyageurs. D'un point de vue macroéconomique, l'ENV mesure la demande touristique intérieure et internationale des résidents du Canada.

Période de référence : Sur une base trimestrielle (T1, T2, T3 et T4) et annuelle, de janvier à décembre.

Période de collecte : Le mois suivant le mois de référence.

Sujets

  • Voyages et tourisme
  • Voyages intérieurs
  • Voyages internationaux

Sources de données et méthodologie

Population cible

La population cible est constituée de la population civile non institutionnalisée âgée de 18 ans et plus des dix provinces canadiennes. Sont exclues de façon particulière de l'enquête : les personnes vivant dans des réserves indiennes et les personnes vivant dans les territoires. Les voyages hors champs tels que les voyages de routine, les voyages pour se rendre au travail et les voyages pour des raisons diplomatiques ou militaires sont également exclus.

Élaboration de l'instrument

Le contenu du questionnaire électronique de l'Enquête nationale sur les voyages a été tiré de l'Enquête sur les voyages des résidents du Canada et de l'Enquête sur les voyages internationaux, qui étaient fondées sur des consultations auprès de plusieurs organismes/ministères provinciaux du tourisme. Les responsables du Système de comptabilité nationale de Statistique Canada ont participé à la conception du questionnaire.

Le questionnaire a fait l'objet d'un essai cognitif sous forme d'interviews approfondies, dans les deux langues officielles du Canada, menées par le Centre de ressources en conception de questionnaires de Statistique Canada. L'objectif de l'étude qualitative était de vérifier une nouvelle introduction à l'enquête et différentes définitions de voyages. Il y a eu deux enquêtes pilotes. La première enquête pilote menée en février-mars 2016 visait à évaluer la sélection des répondants au moyen de lettres. La méthode habituelle de sélection aléatoire consistait à sélectionner un ménage, puis à sélectionner un répondant au moyen de l'application. L'essai pilote a fourni des renseignements sur la capacité du membre du ménage à interpréter une des méthodes de sélection aléatoire décrites dans la lettre et à s'y conformer.

La deuxième enquête menée en août 2017 visait à évaluer l'application de réponse en ligne et à estimer le taux de participation. L'enquête pilote a aussi servi à évaluer plusieurs méthodes de suivi auprès des non-répondants, incluant l'envoi de lettres, des appels de courtoisie et des appels pour offrir de remplir le questionnaire au téléphone.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

L'Enquête nationale sur les voyages utilise un plan d'échantillonnage stratifié à trois degrés.

Unité d'échantillonnage:
L'ENV a un plan d'échantillonnage à trois degrés et il y a donc trois unités d'échantillonnage. L'unité primaire d'échantillonnage (pour le premier degré) est le logement. L'unité d'échantillonnage pour le second degré est la personne dans un logement choisi au premier degré. Finalement, l'unité d'échantillonnage du troisième degré est le voyage étant donné un logement et une personne choisis.

Méthode de stratification:
La base de sondage est stratifiée selon la province et selon le niveau de revenu des ménages. L'Enquête nationale sur les voyages est une enquête flexible et permet aux différents partenaires d'ajouter de l'échantillon dans des régions spécifiques, par exemple dans certaines villes/régions canadiennes.

Échantillonnage et sous-échantillonnage:
Pour le premier degré, soit le logement, l'échantillon est d'abord réparti dans les provinces proportionnellement à la racine cubique du nombre de logements de chacune des provinces. Puis, l'échantillon est réparti selon le niveau de revenu de façon proportionnelle à la racine carrée de la somme des revenus. À l'intérieur de chaque strate, soit par province et niveau de revenu, les logements seront triés selon le code postal et un échantillon systématique sera tiré. De cette façon, les différentes régions de chaque province seront représentées dans l'échantillon. L'échantillon mensuel est d'environ 40 000 logements.

Pour le deuxième degré, un adulte par logement sélectionné sera choisi aléatoirement selon une méthode de sélection basée sur l'âge des membres du ménage. Cette méthode permet de choisir aléatoirement un adulte pour les logements contenant six adultes ou moins. Dépendamment du nombre d'adultes vivant dans le logement, l'adulte : le plus âgé; le deuxième plus âgé; le troisième plus âgé; le plus jeune; le deuxième plus jeune ou le troisième plus jeune sera choisi.

Pour le troisième degré, le questionnaire électronique demande au répondant une courte description de tous ses voyages se terminant dans le mois de référence. Si le répondant déclare trois voyages ou moins, alors tous les voyages sont choisis pour la suite du questionnaire. Dans le cas contraire, un algorithme dans le questionnaire électronique sélectionne trois voyages selon un plan d'échantillonnage séquentiel de Poisson. Les voyages avec nuitées à l'international et les voyages avec nuitées dans une autre province que la province de résidence auront une plus grande fraction de sondage.

Sources des données

Collecte des données pour cette période de référence : 2019-02-01 à 2019-05-10

Il s'agit d'une enquête à participation volontaire.

Les données sont obtenues directement auprès des répondants.

Les ménages sélectionnés reçoivent une lettre d'invitation par la poste. Cette lettre explique qui, du ménage, est sélectionné pour répondre à l'enquête en utilisant la méthode de sélection selon l'âge. Un ménage peut avoir jusqu'à deux rappels par la poste. Le code d'accès sur les lettres permet au répondant d'accéder au questionnaire électronique. Le questionnaire électronique est disponible dans les deux langues officielles, soit le français et l'anglais. Le répondant doit donner l'information de base sur tous ses voyages (domestiques et internationaux) se terminant dans le mois de référence. Ensuite il donne plus de détails sur les voyages sélectionnés. Le délai moyen requis pour répondre à l'enquête est de 15 minutes.

Les projections démographiques produites par la division de la démographie à Statistique Canada sont utilisées à l'étape de pondération de l'ENV. Les poids au niveau personne sont calés sur ces projections.

Les estimations provenant du programme de dénombrement à la frontière de Statistique Canada sont également utilisées à l'étape de pondération de l'ENV. Concrètement, les poids voyage-personne sont calés sur ces estimations de façon à ce que les deux sources de données soient cohérentes. De plus, ce calage a pour effet d'améliorer la qualité de des estimations de l'ENV en stabilisant l'estimateur du nombre de voyages internationaux faits par les Canadiens.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

L'utilisation du questionnaire électronique (QE) est l'unique mode de collecte. Les répondants saisissent directement les réponses aux questions de l'enquête. L'emploi d'un questionnaire électronique réduit les délais de traitement des données et les coûts associés à la saisie des données, aux erreurs de transcription et à la transmission des données. Les réponses sont envoyées d'une façon sécuritaire via des protocoles de cryptage standards de l'industrie, des pare-feu et des couches de clés d'encodages.

Un contrôle se fait au moment même que le questionnaire électronique est rempli par le répondant. Lorsque les renseignements introduits sont hors limites (trop faibles ou trop élevés) des valeurs attendues, ou qu'ils entrent en contradiction avec des renseignements introduits auparavant, le répondant est invité, via des messages apparaissant à l'écran de l'ordinateur, à vérifier les renseignements. Cependant, pour certaines questions, le répondant peut ignorer ces contrôles et sauter des questions si il ou elle ne connaît pas la réponse ou refuse de répondre. Pour cette raison, les données des réponses sont soumises à d'autres processus de vérification et d'imputation après réception au bureau central.

Les données sont transmises à Statistique Canada, où l'on procède à des étapes de traitement de l'information pour préparer les données en vue de la diffusion. On vérifie les données afin d'y déceler les incohérences. Les enregistrements de voyage sont validés pour s'assurer que les valeurs entrées dans les champs essentiels sont acceptables. Pour certaines variables, un intervalle de valeurs acceptables est utilisé. Par exemple, on s'assure que le nombre de nuits ne dépasse pas l'intervalle logique, que le type de voyage est valide, etc.

Pour la majorité des enregistrements de voyage, le codage de la région géographique se fait automatiquement. Pour un petit nombre d'enregistrements, le codage de la région géographique est fait manuellement, au bureau central de Statistique Canada.

Plusieurs contrôles de la cohérence sont effectués sur les données pour vérifier la relation entre deux variables ou plus. Par exemple, le nombre d'adultes d'un ménage qui ont pris part à un voyage ne peut dépasser le nombre total d'adultes dans le ménage. Si une ville ou autre lieu géographique précis ne correspond pas à la province ou autre lieu géographique plus global, alors un seul lieu sera gardé, selon la question. Pour les variables de dépenses, plusieurs règles de vérification sont appliquées afin que borner ces valeurs. Si la valeur n'est pas dans l'intervalle acceptable prédéterminée, alors cette dernière sera imputée ultérieurement.

Imputation

L'imputation du nombre d'adultes et d'enfants du même ménage qui ont participé au voyage est imputé si manquant.

Quelques autres variables, comme l'âge et le sexe du répondant, peuvent être imputées à des fins de traitement seulement. Les valeurs imputées seront supprimées après utilisation. Par exemple, un répondant qui ne déclare pas son âge se fera imputé une catégorie d'âge afin de se situer dans une classe de calage. Après le calage, l'âge sera remis à « non déclaré ».

L'imputation des dépenses est effectuée sur les enregistrements de voyage dans le but d'assurer que tous les voyages comportent des dépenses valides. L'imputation des dépenses se fait par catégorie : transport commercial, hébergement, restaurants, etc. Les dépenses de voyage ayant échoué au contrôle des données seront imputées en utilisant la méthode d'imputation par donneur. Des variables corrélées à la variable à imputer sont utilisées pour former des classes d'imputation. Avant de choisir un donneur, la méthode de détection de valeurs aberrantes sigma-gap est appliquée sur chaque variable à imputer afin d'exclure les valeurs atypiques du bassin de donneurs potentiels. Finalement, un donneur ayant un ratio entre le 5ème et 95ème percentile de la classe est aléatoirement choisi. Un ratio est imputé au lieu de la variable elle-même, car cette dernière peut être fortement corrélée à d'autres variables. Le ratio peut être, par exemple, les dépenses par jour ou les dépenses par personne ayant fait le voyage.

Une autre étape du processus d'imputation consiste à répartir les dépenses comprises dans un forfait entre des catégories de dépenses distinctes. Si le montant global est manquant, alors il sera imputé à l'aide d'un donneur. Par la suite, les voyages sont regroupés par classe et la distribution des dépenses observées sur les voyages n'ayant pas de forfait est appliquée sur les voyages ayant un forfait.

Ensuite, une autre étape consiste à répartir les dépenses comprises dans les composantes intérieures des voyages internationaux et les composantes extérieures des voyages domestiques entre des catégories de dépenses distinctes. Dans le questionnaire on demande, pour les voyages internationaux, le montant total dépensé au Canada, et pour les voyages domestiques, le montant total dépensé à l'extérieur du Canada. Si ce montant global est manquant, alors il sera imputé à l'aide d'un donneur. Par la suite, une distribution fixe selon le type de voyage sera utilisée afin de répartir les dépenses par catégorie. Cette distribution est estimée à partir des données historiques de l'EVRC.

Une dernière étape consiste à répartir les dépenses de chaque catégorie d'un voyage à chaque visite de ce voyage. Cette répartition dépend de la catégorie de dépense, du type et de la durée du voyage, de ce qui est inclus dans le voyage, du type de visite, etc.

Estimation

Les estimations de l'ENV sont produites à partir de données de l'enquête auxquelles on appose des poids permettant ainsi de gonfler ces données au niveau de la population canadienne non institutionnalisée de 18 ans et plus. Les poids calculés afin de produire les estimations sont le poids du ménage, le poids de la personne, du voyage et du voyage-personne.

Le poids de sondage du ménage est calculé comme étant l'inverse de la probabilité de sélection du ménage. Ensuite le poids des ménages hors champ, par exemple les logements vacants ou détruits, sera mis à 0. Les unités non résolues, c.-à-d. les ménages pour lesquelles nous ne savons pas s'ils sont dans le champ ou non de l'enquête, seront considérées comme non-répondants et donc dans le champ de l'enquête. Les poids sont ensuite ajustés à l'intérieur des classes de réponse homogène afin de corriger l'effet de la non-réponse. Un modèle de régression logistique est d'abord appliqué sur les données de façon à estimer la probabilité de réponse de chaque unité échantillonnée. Cette probabilité de réponse est utilisée pour créer les classes de réponses homogènes. Après l'ajustement pour la non-réponse, les poids sont calés en fonction du nombre de ménages par province et selon la taille du ménage (ménage d'une personne, deux, plus de deux) provenant de la base de sondage.

Les poids de la personne sont dérivés du poids ménage. Le poids des unités hors champ, comme les non-résidents canadiens et les résidents âgés de moins de 18 ans, est mis à 0. L'inverse de la probabilité de sélection de la personne est multiplié par le poids du ménage donnant une première version du poids au niveau de la personne. Une simple repondération au niveau de la strate est faite pour ajuster ces poids en présence de non-réponse. Il est à noter que la plupart de la non-réponse provient du premier degré, soit le ménage, et c'est pour cette raison qu'il a été décidé d'utiliser un ajustement simple pour corriger la non-réponse au niveau de la personne. Finalement, le poids-personne est calé à des totaux de contrôle connus (groupes âge-sexe, totaux des RMR).

Le poids voyage-personne initial est dérivé à partir du poids personne qui est multiplié par l'inverse de la probabilité de sélection du voyage et par le nombre de voyages identiques plus 1. Par la suite, le poids est ajusté pour contrer la présence de non-réponse. Cet ajustement est une post-stratification où les post-strates sont formées en fonction de la province d'origine, de la destination, du type et de la raison principale du voyage. Finalement les poids voyage-personnes pour les voyages domestiques sélectionnés seront calés sur les estimations pondérées des voyages domestiques déclarés. Les poids voyage-personne associés aux voyages internationaux seront calés sur les comptes du programme de dénombrement à la frontière de Statistique Canada. Ce calage est peu complexe et nécessite d'estimer la proportion de voyageurs canadiens adultes, des comptes provenant du dénombrement à la frontière.

Enfin, le poids voyage est dérivé en divisant le poids voyage-personne par le nombre d'adultes (18 ans et plus) du ménage qui ont fait le voyage. Ces poids voyages sont utilisés pour estimer les dépenses. La méthode de détection de valeurs aberrantes sigma-gap est appliquée sur les dépenses pondérées de façon réduire l'impact des unités trop influentes en bornant le poids. Suivant cette étape, les poids voyage-personne seront recréés et l'étape de calage sera refaite sur ces nouveaux poids. Les poids voyages finaux seront dérivés en divisant le nouveau poids voyage-personne divisé par le nombre d'adultes du ménage qui ont fait le voyage.

L'ENV utilise la méthode du bootstrap, une méthode basée sur les répliques, pour calculer la variance. La méthode du bootstrap implique de prendre des sous-échantillons avec remise de l'échantillon principal et d'en faire la pondération. Cette pondération est répétée plusieurs fois, soit 500 fois pour l'ENV.

Évaluation de la qualité

Tous les trimestres, Il y a une évaluation façon systématique de la qualité des données. Un ensemble de tableaux statistiques pour fins d'analyse sont produits, lesquels sont ensuite comparés à des sources de données connexes. Une liste avec des indicateurs servant à vérifier si les tendances générales du secteur touristique est également compilée pour en vérifier les tendances semblables à celles de l'ENV. De plus, nous travaillons en étroite liaison avec les ministères provinciaux du tourisme, lesquels nous apportent des points de vue et des sources d'information supplémentaires, ce qui naide à évaluer la qualité des données à un niveau géographique plus désagrégé.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Révisions et désaisonnalisation

Ce type de méthodologie ne s'applique pas à ce programme d'enquête.

Exactitude des données

La variabilité de l'échantillonnage est l'erreur qui, dans les estimations, est attribuable au fait que l'enquête porte sur un échantillon de répondants plutôt que sur l'ensemble de la population. Le concept d'erreur-type et les concepts connexes de coefficients de variation (CV) et d'intervalle de confiance donnent une indication de l'importance de la variabilité de l'échantillonnage. L'erreur-type et le coefficient de variation ne permettent pas de mesurer les biais systématiques des données de l'enquête qui pourraient influer sur les estimations. Ils sont plutôt fondés sur l'hypothèse selon laquelle les erreurs d'échantillonnage suivent une courbe normale.

Habituellement, celle des deux estimations qui est la plus grande présente un plus petit CV et sera donc plus fiable. Aussi, dans le cas de deux estimations de même grandeur, celle qui se rapporte à une caractéristique plus également distribuée dans la population aura un plus petit CV que l'autre.

Le CV sert à établir cinq niveaux de qualité de données :

- 0,00 % à 5,00 % : excellent
- 5,01 % à 15,00 % : très bon
- 15,01 % à 25,00 % : bon
- 25,01 % à 35,00 % : acceptable
- plus grand que 35,00 % : à utiliser avec prudence

Les estimations dont le niveau de qualité n'est pas acceptable sont marquées d'un indicateur signalant qu'elles doivent être utilisées avec prudence ou sont supprimées.

Taux de réponse:
Le taux de réponse global pondéré (niveau du Canada) pour l'ENV pour le premier trimestre de l'année de référence 2018 a été de 32 %. Les taux de réponse vont varier selon les provinces.

Erreur non due à l'échantillonnage:
Il existe d'autres sources d'erreur que l'erreur due à l'échantillonnage comme le biais de non-réponse, l'erreur de rappel, l'erreur de mesure, etc. Dans le cadre de l'ENV, des mesures correctives sont apportées seulement dans le contexte du biais de non-réponse.

Biais de non-réponse:
Comme le taux de réponse au niveau du ménage est de moins de 50 %, le risque d'avoir un biais dû à la non-réponse est présent. Un modèle de régressions logistique est utilisé pour modéliser la probabilité de réponse des unités échantillonnées. Les variables indépendantes utilisées dans le modèle de régression sont corrélées avec les dépenses associées aux voyages et avec la probabilité de répondre à l'enquête. Par la suite, les unités ayant des probabilités de réponse similaires sont regroupées ensemble et le poids des non-répondants est distribué aux répondants à l'intérieur de ces classes. Cette procédure aura pour effet de réduire le biais potentiel causé par la présence de non-réponse.

Erreur de couverture:
Certains logements sur la base de sondage, soit environ 10 %, n'ont pas une adresse valide. Ces derniers cas ne seront pas couverts par l'ENV, car l'invitation pour participer à l'enquête se fait par la poste. Ces logements peuvent toutefois être échantillonnés et seront considérés comme non-répondants. Ainsi, la procédure pour atténuer le biais de non-réponse est également utilisée pour corriger l'erreur de couverture.

Date de modification :