Industries canadiennes du transport de passagers par autobus et du transport urbain

Information détaillée pour 2009

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

2798

L'enquête recueille sur une base annuelle des données sur l'emploi, les finances et les opérations des compagnies opérant un service de transport par autobus au Canada.

Date de la parution - 18 mars 2011

Aperçu

L'enquête recueille sur une base annuelle des données sur l'emploi, les finances et les opérations des compagnies opérant un service de transport par autobus au Canada. L'enquête se déroule également auprès des municipalités et des agences gouvernementales qui opèrent un service de transport en commun ou de transport interurbain. Les estimations produites sont utilisées par le système canadien des comptes nationaux, Transport Canada, d'autres ministères fédéraux et provinciaux, ainsi que par les compagnies de transports, par des firmes de consultants, des universités et des gouvernements étrangers. Les données sont utilisées à des fins d'analyses des activités de transport, à des fins d'études économiques et de marketing ainsi que pour mesurer la performance de l'industrie.

Activité statistique

Cette activité statistique fait partie d'un ensemble d'enquêtes qui permettent de mesurer divers aspects des activités liées au mouvement des gens et des marchandises. Cet ensemble d'enquêtes se compose des groupes suivants :

Transport aérien, y compris les enregistrements portant sur le mouvement des aéronefs, des passagers et des marchandises par voie aérienne des transporteurs aériens canadiens et étrangers, ainsi que les caractéristiques opérationnelles et financières des transporteurs aériens canadiens. Ces données proviennent du Centre des statistiques de l'aviation.

Transport ferroviaire, y compris les enregistrements portant sur le transport ferroviaire au Canada, et entre les États-Unis et le Canada.

Transport routier, y compris les enregistrements portant sur tout le transport routier au Canada. Outre les programmes d'enquête auprès des transporteurs et des propriétaires de véhicules immatriculés, certains programmes ont besoin de données administratives provinciales et territoriales regroupées.

Période de référence : année civile

Période de collecte : mars à octobre

Sujets

  • Transport
  • Transport routier

Sources de données et méthodologie

Population cible

L'industrie se caractérise par six secteurs d'activités tel que défini par le Système de Classification Internationale de l'Amérique du Nord (SCIAN). Les six catégories sont : Services urbains de transport en commun, transport interurbain et rural par autocar, transport scolaire, services d'autobus nolisés, autres services de transports en commun et de transport terrestre de voyageurs, transport terrestre de tourisme et d'agrément (Codes SCIAN 485110, 485210, 485410, 485510, 485990 et 487110). Les compagnies n'offrant pas de transport par autobus sont exclues de la catégorie « Transport terrestre de tourisme et d'agrément », par exemple ceux qui conduisent des trains.

Les sociétés de transport urbain faisant partie intégrante de la structure financière d'un gouvernement municipal pourraient ne pas se retrouver énumérées dans les six groupes cibles de SCIAN. Celles-ci sont donc inclues dans une septième catégorie afin d'offrir une ventilation complète de l'industrie par type d'activité. Elles sont néanmoins exclues du système canadien des comptes nationaux afin d'éviter un double comptage.

Élaboration de l'instrument

En se basant sur les critères d'essai de Statistique Canada, le questionnaire a été mis à l'essai en visitant plusieurs compagnies de transport, et en créant des données-test afin de vérifier l'intégrité de l'instrument. Le questionnaire a ensuite été revu et corrigé en fonction des résultats obtenus.

Étant donné le nouveau format de l'enquête annuelle, il n'est plus possible de comparer les données de 2001 et des années suivantes avec les données de 2000 et des années antérieures. Cependant, le nouveau questionnaire est un meilleur outil, parce qu'il permet d'améliorer la qualité des données recueillies tout en réduisant considérablement le fardeau de réponse. Les données sont recoupées en fonction des six groupes SCIAN et en fonction du type d'activité.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

La base de sondage consiste en une liste de compagnies présentes sur le registre des entreprises de Statistique Canada dans l'un des 6 codes SCIAN d'intérêt. Les compagnies sont classées par codes SCIAN(6) et province. Seules les compagnies faisant partie de la portion couvrant 95% des revenus (par ordre décroissant) font partie de la population cible. En utilisant la méthodologie Lavallée-Hidiroglou, chaque strate est divisée en une strate à tirage complet, et une ou deux strates à tirage partiel, selon le revenu (ou le revenu de stratification) par compagnie. La méthodologie Lavallée-Hidiroglou utilise la répartition de Neyman afin d'optimiser la taille de l'échantillon pour un coefficient de variation ciblé (13 % au niveau SCIAN6 x province), minimisant le fardeau de réponse des petites et moyennes compagnies. Dans les strates à tirage partiel, les unités sont sélectionnées selon un tirage aléatoire simple par strate. L'échantillon final pour 2009 consiste de 794 compagnies sélectionnées à partir d'une base de sondage de 1 633 compagnies.

Sources des données

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants.

La division des opérations et intégrations des données de Statistique Canada agit comme division contact auprès des répondants visés par cette enquête. La collecte des données se fait annuellement par l'entremise d'un questionnaire papier. La division des opérations et intégrations s'occupe de l'envoi postal, de la réception du questionnaire et de la saisie de données. Un suivi téléphonique, par courriel ou par télécopieur, est effectué auprès des répondants lorsque ceux-ci ne retournent pas le questionnaire ou si celui-ci n'a pas été complété correctement.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

De nombreux tests de validité et d'intégrité des données ont été effectués durant la saisie ainsi que pendant l'analyse des données recueillies. Diverses méthodes telles que l'analyse des ratios, l'analyse comparative et la détection des valeurs aberrantes sont utilisées.

Plusieurs vérifications sont effectuées en ce qui a trait aux microdonnées, en vue de vérifier leur uniformité et de déterminer les valeurs extrêmes. Au niveau macro, les données font l'objet d'un processus détaillé d'examen de la qualité, y compris une analyse comparative en fonction de l'année précédente. Les erreurs importantes sont par conséquent décelées et corrigées.

Imputation

Différentes méthodes d'imputation manuelle sont utilisées, comme l'imputation par donneur, l'analyse des ratios et l'analyse de tendances. Les données fiscales sont également utilisées lorsque cela est pertinent.

Estimation

Le Système généralisé d'estimation développé à Statistique Canada est utilisé pour le calcul des estimations par domaine et des indicateurs de qualité. Ce système est une application développée à partir du logiciel SAS afin de produire des estimations de populations à partir d'un échantillon et de données auxiliaires. Les estimations sont calculées à plusieurs niveaux d'intérêt, tels que le Système de classification des industries de l'Amérique du Nord et la province, en se fondant sur les renseignements de classification les plus récents pour l'entité statistique et la période de référence de l'enquête.

Évaluation de la qualité

Les résultats de l'enquête sont analysés aux niveaux micro et macro. Au niveau micro, des vérifications sont faites afin de vérifier la cohérence des données et déterminer les valeurs extrêmes. Au niveau macro, les données sont soumises à un processus de vérification de la qualité approfondi, y compris l'analyse comparative des données de l'année précédente. Les erreurs importantes sont ainsi relevées et corrigées.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Les estimations annuelles sont fournies pour l'année de référence. Les données de l'année de référence précédente sont révisées, au besoin. Comme il s'agit d'un programme annuel, la désaisonnalisation des données n'est pas pertinente.

Exactitude des données

Malgré les efforts déployés pour que les opérations de collecte et de dépouillement des données se déroulent en fonction de normes rigoureuses, les estimations qui en résultent comportent inévitablement des erreurs. Celles-ci sont classées en deux grandes catégories : les erreurs d'échantillonnage et les erreurs non dues à l'échantillonnage.

Les erreurs non dues à l'échantillonnage ne sont pas liées à l'échantillonnage et peuvent survenir pour de nombreuses raisons. Par exemple, la non-réponse est une source importante d'erreurs non due à l'échantillonnage. La couverture de la population, les écarts dans l'interprétation des questions, les réponses erronées des répondants et les erreurs de consignation, de codage et de traitement des données représentent d'autres exemples d'erreurs non liées à l'échantillonnage.

Les erreurs non dues à l'échantillonnage sont contrôlées par la conception minutieuse du questionnaire, par l'utilisation d'un nombre minime de concepts simples et par des vérifications de la cohérence. Les erreurs de couverture ont été réduites au minimum par la mise à jour de la base de sondage à partir de sources multiples. Des mesures telles que les taux de réponse sont utilisées comme indicateurs de l'étendue potentielle des erreurs non dues à l'échantillonnage.

Le taux de réponse pondéré est la proportion du revenu total représenté par les unités ayant répondu à l'enquête. Le taux de réponse pondéré est calculé à partir des unités échantillonnées contribuant à l'estimation, après avoir tenu compte des entreprises qui ont fait faillite, qui ont changé la nature de leurs activités, qui sont inactives ou encore qui ont été dénombrées deux fois dans la base de sondage.

Les erreurs d'échantillonnage se produisent parce que les estimations de la population proviennent d'un échantillon de la population plutôt que de la population entière. Elles dépendent de divers facteurs, notamment la taille de l'échantillon, le plan d'échantillonnage et la méthode d'estimation. Une des propriétés importantes de l'échantillonnage probabiliste tient au fait que les erreurs d'échantillonnage peuvent être calculées à partir de l'échantillon à l'aide d'une mesure statistique appelée coefficient de variation (c.v.). Pour des enquêtes menées à plusieurs reprises, l'écart relatif entre l'estimation d'un échantillon et l'estimation qui aurait été obtenue au moyen d'un dénombrement de toutes les unités serait inférieur à deux fois le c.v., 95 fois sur 100. L'éventail des données acceptables d'un échantillon s'appelle l'intervalle de confiance. Les intervalles de confiance peuvent être calculés autour des estimations en utilisant les c.v. Le calcul de l'erreur-type est effectué en multipliant l'estimation d'un échantillon par le c.v. L'estimation d'un échantillon représentant plus ou moins deux fois l'erreur-type représente l'intervalle de confiance de 95 %.

Les c.v. ont été calculés pour chaque estimation produite. Les estimations du total des revenus pour l'ensemble de l'industrie ont été jugées excellentes au niveau national (moins de 5 %) et de bonnes à excellentes au niveau provincial et territorial (moins de 15 %). Il est possible d'obtenir ces c.v. sur demande.

La qualité des c.v. est classée ainsi :
Excellente : 0,01 % à 4,99 %
Très bonne : 5,00 % à 9,99 %
Bonne : 10,00 % à 14,99 %
Acceptable : 15,00 % à 24,99 %
À utiliser avec prudence : 25,00 % à 34,99 %
Trop peu fiable pour être publié : 35,00 % et plus

En plus de faire augmenter la variance, la non-réponse peut donner lieu à des estimations biaisées si les non-répondants comportent des caractéristiques différentes des répondants. La non-réponse est traitée par un suivi auprès des répondants, et au moyen de l'imputation et de la validation des microdonnées.

Les erreurs de couverture ont été réduites au minimum au moyen de la mise à jour de la base de sondage à l'aide de sources d'enquête et administratives. Les taux de couverture sont examinés pendant le processus d'échantillonnage.

Date de modification :