Enquête nationale sur les voyages (ENV)

Information détaillée pour le troisième trimestre de 2023

Statut :

Active

Fréquence :

Trimestrielle

Numéro d'enregistrement :

5232

L'Enquête nationale sur les voyages fournit des statistiques sur les activités des résidents du Canada en ce qui a trait au tourisme intérieur et international. Elle a été élaborée pour mesurer le volume des activités, les caractéristiques et les répercussions économiques du tourisme.

Date de la parution - 27 février 2024

Aperçu

L'Enquête nationale sur les voyages a été élaborée pour remplacer entièrement l'Enquête sur les voyages des résidents du Canada (numéro d'enregistrement 3810) et pour remplacer la composante des résidents canadiens de l'Enquête sur les voyages internationaux (numéro d'enregistrement 3152). L'Enquête nationale sur les voyages recueille des renseignements concernant les voyages intérieurs et internationaux des résidents du Canada.

L'Enquête nationale sur les voyages, qui est parrainée par Statistique Canada, vise à mesurer les caractéristiques et les répercussions économiques des activités touristiques des résidents du Canada. Les objectifs de l'enquête consistent à fournir des renseignements concernant le nombre de voyages et les dépenses des résidents du Canada, selon l'origine du voyage, la destination, la durée, le type d'hébergement utilisé, les raisons du voyage, le mode de déplacement, etc., afin de produire des données sur l'incidence des voyages et d'établir le profil sociodémographique des voyageurs et des non voyageurs. D'un point de vue macroéconomique, l'ENV mesure la demande touristique intérieure et internationale des résidents du Canada.

Période de référence : Sur une base trimestrielle (T1, T2, T3 et T4) et annuelle, de janvier à décembre.

Période de collecte : Le mois suivant le mois de référence.

Sujets

  • Voyages et tourisme
  • Voyages intérieurs
  • Voyages internationaux

Sources de données et méthodologie

Population cible

La population cible est constituée de la population civile non institutionnalisée âgée de 18 ans et plus des dix provinces canadiennes. Sont exclues de façon particulière de l'enquête : les personnes vivant dans des réserves indiennes et les personnes vivant dans les territoires. Les voyages hors champs tels que les voyages de routine, les voyages pour se rendre au travail et les voyages pour des raisons diplomatiques ou militaires sont également exclus.

Élaboration de l'instrument

Le contenu du questionnaire électronique de l'Enquête nationale sur les voyages a été tiré de l'Enquête sur les voyages des résidents du Canada et de l'Enquête sur les voyages internationaux, qui étaient fondées sur des consultations auprès de plusieurs organismes/ministères provinciaux du tourisme. Les responsables du Système de comptabilité nationale de Statistique Canada ont participé à la conception du questionnaire.

Le questionnaire a fait l'objet d'un essai cognitif sous forme d'interviews approfondies, dans les deux langues officielles du Canada, menées par le Centre de ressources en conception de questionnaires de Statistique Canada. L'objectif de l'étude qualitative était de vérifier une nouvelle introduction à l'enquête et différentes définitions de voyages. Il y a eu deux enquêtes pilotes. La première enquête pilote menée en février-mars 2016 visait à évaluer la sélection des répondants au moyen de lettres. La méthode habituelle de sélection aléatoire consistait à sélectionner un ménage, puis à sélectionner un répondant au moyen de l'application. L'essai pilote a fourni des renseignements sur la capacité du membre du ménage à interpréter une des méthodes de sélection aléatoire décrites dans la lettre et à s'y conformer.

La deuxième enquête menée en août 2017 visait à évaluer l'application de réponse en ligne et à estimer le taux de participation. L'enquête pilote a aussi servi à évaluer plusieurs méthodes de suivi auprès des non-répondants, incluant l'envoi de lettres, des appels de courtoisie et des appels pour offrir de remplir le questionnaire au téléphone.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

Unités d'échantillonnage:
L'ENV a un plan d'échantillonnage à trois degrés et il y a donc trois unités d'échantillonnage. L'unité primaire d'échantillonnage (pour le premier degré) est le logement. L'unité d'échantillonnage pour le second degré est la personne dans un logement choisi au premier degré. Finalement, l'unité d'échantillonnage du troisième degré est le voyage étant donné un logement et une personne choisis.

Méthode de stratification:
La base de sondage est stratifiée selon la province, le niveau de revenu des ménages et l'information provenant des bornes d'inspection primaire (BIP). L'Enquête nationale sur les voyages est une enquête flexible qui permet aux différents partenaires d'ajouter de l'échantillon dans des villes ou des régions spécifiques.

Échantillonnage et sous-échantillonnage:
Pour le premier degré, soit le logement, l'échantillon est d'abord réparti dans les provinces proportionnellement à la racine cubique du nombre de logements de chacune des provinces. Pour chaque province, une petite partie de l'échantillon (maximum de 400) est associé à une strate particulière selon l'information provenant des BIP. Cette strate permet de maximiser les chances d'échantillonner les canadiens ayant voyagé à l'extérieur du pays. Puis, le reste de l'échantillon est réparti selon le niveau de revenu de façon proportionnelle à la racine carrée de la somme des revenus. À l'intérieur de chaque strate, soit par province et niveau de revenu de la strate particulière, les logements sont triés selon le code postal. Dans la strate formée en utilisant les informations provenant des BIP, un simple échantillon aléatoire est tiré. Pour toutes les autres strates, un échantillon systématique est tiré. De cette façon, les différentes régions de chaque province sont représentées dans l'échantillon.

Pour le deuxième degré, un adulte par logement sélectionné est choisi aléatoirement selon une méthode de sélection basée sur l'âge des membres du ménage. Cette méthode permet de choisir aléatoirement un adulte pour les logements contenant six adultes ou moins. Dépendamment du nombre d'adultes vivant dans le logement, l'adulte : le plus âgé; le deuxième plus âgé; le troisième plus âgé; le plus jeune; le deuxième plus jeune ou le troisième plus jeune est choisi.

Pour le troisième degré, le questionnaire électronique demande au répondant une courte description de tous ses voyages se terminant dans le mois de référence. Si le répondant déclare trois voyages ou moins, alors tous les voyages sont choisis pour la suite du questionnaire. Dans le cas contraire, un algorithme dans le questionnaire électronique sélectionne trois voyages selon un plan d'échantillonnage séquentiel de Poisson. Les voyages avec nuitées à l'international et les voyages avec nuitées dans une autre province que la province de résidence ont une plus grande fraction de sondage.

Sources des données

Collecte des données pour cette période de référence : 2023-08-01 à 2023-11-10

Il s'agit d'une enquête à participation volontaire.

Les données sont obtenues directement auprès des répondants.

Les ménages sélectionnés reçoivent une lettre d'invitation par la poste. Cette lettre explique qui, du ménage, est sélectionné pour répondre à l'enquête en utilisant la méthode de sélection selon l'âge. Un ménage peut avoir jusqu'à deux rappels par la poste, trois rappels par courriel, ou un rappel par message texte. Le code d'accès sur les lettres permet au répondant d'accéder au questionnaire électronique. Le questionnaire électronique est disponible dans les deux langues officielles, soit le français et l'anglais. Le répondant doit donner l'information de base sur tous ses voyages (domestiques et internationaux) se terminant dans le mois de référence. Ensuite il donne plus de détails sur les voyages sélectionnés. Le délai moyen requis pour répondre à l'enquête est de 15 minutes.

En cas de catastrophe naturelle, tous les logements situés dans les zones touchées (telles qu'identifiées par Ressources naturelles Canada) sont retirés des stratégies de collecte pour cette période. L'élimination de ces unités est prise en compte durant la pondération des ménages (voir Estimation).

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

L'utilisation du questionnaire électronique est l'unique mode de collecte. Les répondants saisissent directement les réponses aux questions de l'enquête. L'emploi d'un questionnaire électronique réduit les délais de traitement des données et les coûts associés à la saisie des données, aux erreurs de transcription et à la transmission des données. Les réponses sont envoyées d'une façon sécuritaire via des protocoles de cryptage standards de l'industrie, des pare-feu et des couches de clés d'encodages.

Un contrôle se fait au moment même que le questionnaire électronique est rempli par le répondant. Lorsque les renseignements introduits sont hors limites (trop faibles ou trop élevés) des valeurs attendues, ou qu'ils entrent en contradiction avec des renseignements introduits auparavant, le répondant est invité, via des messages apparaissant à l'écran de l'ordinateur, à vérifier les renseignements. Cependant, pour certaines questions, le répondant peut ignorer ces contrôles et sauter des questions si il ou elle ne connaît pas la réponse ou refuse de répondre. Pour cette raison, les données des réponses sont soumises à d'autres processus de vérification et d'imputation après réception au bureau central.

Les données sont transmises à Statistique Canada, où l'on procède à des étapes de traitement de l'information pour préparer les données en vue de la diffusion. On vérifie les données afin d'y déceler les incohérences. Les enregistrements de voyage sont validés pour s'assurer que les valeurs entrées dans les champs essentiels sont acceptables. Pour certaines variables, un intervalle de valeurs acceptables est utilisé. Par exemple, on s'assure que le nombre de nuits ne dépasse pas l'intervalle logique, que le type de voyage est valide, etc.

Pour la majorité des enregistrements de voyage, le codage de la région géographique se fait automatiquement. Pour un petit nombre d'enregistrements, le codage de la région géographique est fait manuellement, au bureau central de Statistique Canada.

Plusieurs contrôles de la cohérence sont effectués sur les données pour vérifier la relation entre deux variables ou plus. Par exemple, le nombre d'adultes d'un ménage qui ont pris part à un voyage ne peut dépasser le nombre total d'adultes dans le ménage. Si une ville ou autre lieu géographique précis ne correspond pas à la province ou autre lieu géographique plus global, alors un seul lieu sera gardé, selon la question. Pour les variables de dépenses, plusieurs règles de vérification sont appliquées afin de borner ces valeurs. Si la valeur n'est pas dans l'intervalle acceptable prédéterminée, alors cette dernière est imputée ultérieurement.

Imputation

Le nombre d'adultes et d'enfants du même ménage qui ont participé au voyage est imputé si manquant.

L'imputation des dépenses est effectuée sur les enregistrements de voyage dans le but d'assurer que tous les voyages comportent des dépenses valides. L'imputation des dépenses se fait par catégorie : transport commercial, hébergement, restaurants, etc. Les dépenses de voyage ayant échoué au contrôle des données sont imputées en utilisant la méthode d'imputation par donneur. Des variables corrélées à la variable à imputer sont utilisées pour former des classes d'imputation. Avant de choisir un donneur, la méthode de détection de valeurs aberrantes sigma-gap est appliquée sur chaque variable à imputer afin d'exclure les valeurs atypiques du bassin de donneurs potentiels. Finalement, un donneur ayant un ratio entre le 5ème et 95ème percentile de la classe est aléatoirement choisi. Un ratio est imputé au lieu de la variable elle-même, car cette dernière peut être fortement corrélée à d'autres variables. Le ratio peut être, par exemple, les dépenses par jour ou les dépenses par personne ayant fait le voyage.

Une autre étape du processus d'imputation consiste à répartir les dépenses comprises dans un forfait entre des catégories de dépenses distinctes. Si le montant global est manquant, alors il est imputé à l'aide d'un donneur. Par la suite, les voyages sont regroupés par classe et la distribution des dépenses observées sur les voyages n'ayant pas de forfait est appliquée sur les voyages ayant un forfait.

Ensuite, une autre étape consiste à répartir les dépenses comprises dans les composantes intérieures des voyages internationaux et les composantes extérieures des voyages domestiques entre des catégories de dépenses distinctes. Dans le questionnaire on demande, pour les voyages internationaux, le montant total dépensé au Canada, et pour les voyages domestiques, le montant total dépensé à l'extérieur du Canada. Si ce montant global est manquant, alors il est imputé à l'aide d'un donneur. Par la suite, une distribution fixe selon le type de voyage est utilisée afin de répartir les dépenses par catégorie. Cette distribution est estimée à partir des données historiques de l'EVRC.

Une dernière étape consiste à répartir les dépenses de chaque catégorie d'un voyage à chaque visite de ce voyage. Cette répartition dépend de la catégorie de dépense, du type et de la durée du voyage, de ce qui est inclus dans le voyage, du type de visite, etc.

Estimation

Les estimations de l'ENV sont produites à partir de données de l'enquête auxquelles on appose des poids permettant ainsi de gonfler ces données au niveau de la population canadienne non institutionnalisée de 18 ans et plus. Les poids calculés afin de produire les estimations sont le poids du ménage, de la personne, du voyage et du voyage-personne.

Le poids de sondage du ménage est calculé comme étant l'inverse de la probabilité de sélection du ménage. Ensuite, quelques ajustements sont appliqués à l'intérieur de groupes homogènes afin de corriger pour les unités non résolues, c.-à-d. les ménages pour lesquels nous ne savons pas s'ils sont dans le champ ou non de l'enquête. Puis, le poids des ménages hors champ, par exemple les logements vacants ou détruits, est mis à 0. Les poids sont ensuite ajustés à l'intérieur des classes de réponse homogène afin de corriger l'effet de la non-réponse. Pour les ajustements corrigeant les unités non résolues et les unités non-répondantes, des modèles sont appliqués aux données afin d'estimer la probabilité correspondante pour chaque unité. Cette probabilité est utilisée afin de créer les groupes homogènes. Après l'ajustement pour la non-réponse, les poids sont calés en fonction du nombre de ménages par province et selon la taille du ménage (ménage d'une personne, deux, plus de deux) provenant de totaux de contrôle connus.

Les poids de la personne sont dérivés du poids ménage. L'inverse de la probabilité de sélection de la personne est multiplié par le poids du ménage donnant une première version du poids personne. Une simple repondération au niveau de la strate est faite afin de corriger pour le poids des personnes non résolues, par exemple les personnes dont la province de résidence ou l'âge est manquant. Le poids des unités hors champ, comme les non-résidents canadiens et les résidents âgés de moins de 18 ans, est mis à 0. Puis, une autre simple repondération au niveau de la strate est faite pour ajuster les poids en présence de non-réponse. Il est à noter que la plupart de la non-réponse provient du premier degré, soit le ménage, et c'est pour cette raison qu'il a été décidé d'utiliser un ajustement simple pour corriger la non-réponse au niveau de la personne. Finalement, le poids-personne est calé à des totaux de contrôle connus (par groupes province-age-sexe et par régions métropolitaines du recensement (RMR)).

Le poids voyage-personne initial est dérivé à partir du poids personne qui est multiplié par l'inverse de la probabilité de sélection du voyage et par le nombre de voyages identiques plus 1. Par la suite, le poids des voyages hors champ est mis à 0. Puis le poids est ajusté pour contrer la présence de non-réponse. Cet ajustement est une post-stratification où les post-strates sont formées en fonction de la province d'origine, de la destination, du type et de la raison principale du voyage. Finalement les poids voyage-personnes pour les voyages domestiques sélectionnés sont calés sur les estimations pondérées des voyages domestiques déclarés. Les poids voyage-personne associés aux voyages internationaux sont calés sur des comptes de voyageurs canadiens adultes, estimés à partir du programme de dénombrement à la frontière de Statistique Canada.

Enfin, le poids voyage est dérivé en divisant le poids voyage-personne par le nombre d'adultes (18 ans et plus) du ménage qui ont fait le voyage. Ces poids voyages sont utilisés pour estimer les dépenses. La méthode de détection de valeurs aberrantes sigma-gap est appliquée sur les dépenses pondérées de façon à réduire l'impact des unités trop influentes en bornant le poids voyage. Suivant cette étape, les poids voyage-personne sont recréés et les étapes de calage au niveau personne-voyage sont réappliquées sur ces nouveaux poids. Les poids voyages finaux sont dérivés en divisant le nouveau poids voyage-personne par le nombre d'adultes du ménage qui ont fait le voyage.

L'ENV utilise la méthode du bootstrap, une méthode basée sur les répliques, pour calculer la variance. La méthode du bootstrap implique de prendre des sous-échantillons avec remise de l'échantillon principal et d'en faire la pondération. Cette pondération est répétée plusieurs fois, soit 500 fois pour l'ENV.

Évaluation de la qualité

Tous les trimestres, il y a une évaluation de façon systématique de la qualité des données. Un ensemble de tableaux statistiques pour fins d'analyse sont produits, lesquels sont ensuite comparés à des sources de données connexes. Une liste avec des indicateurs est également compilée pour vérifier si les tendances générales du secteur touristique sont semblables à celles de l'ENV. De plus, nous travaillons en étroite liaison avec les ministères provinciaux du tourisme, lesquels nous apportent des points de vue et des sources d'information supplémentaires, ce qui aide à évaluer la qualité des données à un niveau géographique plus désagrégé.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Ce type de méthodologie ne s'applique pas à ce programme d'enquête.

Exactitude des données

La variabilité de l'échantillonnage est l'erreur qui, dans les estimations, est attribuable au fait que l'enquête porte sur un échantillon de répondants plutôt que sur l'ensemble de la population. Le concept d'erreur-type et les concepts connexes de coefficients de variation (CV) et d'intervalle de confiance donnent une indication de l'importance de la variabilité de l'échantillonnage. L'erreur-type et le coefficient de variation ne permettent pas de mesurer les biais systématiques des données de l'enquête qui pourraient influer sur les estimations. Ils sont plutôt fondés sur l'hypothèse selon laquelle les erreurs d'échantillonnage suivent une courbe normale.

Une estimation basée sur un plus grand échantillon a habituellement un CV plus petit et est donc plus fiable. Aussi, dans le cas de deux estimations de même grandeur, celle qui se rapporte à une caractéristique plus également distribuée dans la population a un plus petit CV que l'autre.

Le CV sert à établir cinq niveaux de qualité de données :

- 0,00 % à 5,00 % : excellent
- 5,01 % à 15,00 % : très bon
- 15,01 % à 25,00 % : bon
- 25,01 % à 35,00 % : acceptable
- plus grand que 35,00 % : à utiliser avec prudence

Les estimations dont le niveau de qualité n'est pas acceptable sont marquées d'un indicateur signalant qu'elles doivent être utilisées avec prudence ou sont supprimées.

Taux de réponse:
Les taux de réponse sont calculés, pour chaque domaine (province ou Canada), à l'aide de la formule suivante :
Taux de réponse = nombre d'unités répondantes / (nombre d'unités contactées - nombre d'unités hors champs)
Le taux de réponse global pondéré (niveau du Canada) pour le troisième trimestre de l'année de référence 2023 a été de 25,9 %. Les taux de réponse varient selon les provinces.

Erreur non due à l'échantillonnage:
Il existe d'autres sources d'erreur que l'erreur due à l'échantillonnage comme le biais de non-réponse, l'erreur de rappel, l'erreur de mesure, etc. Dans le cadre de l'ENV, des mesures correctives sont apportées seulement dans le contexte du biais de non-réponse.

Biais de non-réponse:
Comme le taux de réponse au niveau du ménage est de moins de 50 %, le risque d'avoir un biais dû à la non-réponse est présent. Une régression logistique est utilisé pour modéliser la probabilité de réponse des unités échantillonnées. Les variables indépendantes utilisées dans le modèle de régression sont corrélées avec les dépenses associées aux voyages et avec la probabilité de répondre à l'enquête. Par la suite, les unités ayant des probabilités de réponse similaires sont regroupées ensemble et le poids des non-répondants est distribué aux répondants à l'intérieur de ces classes. Cette procédure a pour effet de réduire le biais potentiel causé par la présence de non-réponse.

Erreur de couverture:
Certains logements sur la base de sondage, soit environ 10 %, n'ont pas une adresse valide. Ces derniers cas ne sont pas couverts par l'ENV, car l'invitation pour participer à l'enquête se fait par la poste. Ces logements peuvent toutefois être échantillonnés et sont considérés comme non-résolus. Ainsi, les ajustements de poids servant à redistribuer le poids de ce type d'unités non-résolues est utilisé pour corriger l'erreur de couverture.

Date de modification :