Enquête annuelle sur le commerce de gros (EACG)

Information détaillée pour 2020

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

2445

Cette enquête sert à recueillir les données financières et les données d'exploitation nécessaires à l'élaboration des politiques et des programmes économiques nationaux et régionaux.

Date de la parution - 18 janvier 2022

Aperçu

Cette enquête sert à recueillir les données requises pour produire des statistiques économiques sur le secteur du commerce de gros au Canada.

Les données recueillies auprès des entreprises sont regroupées avec l'information provenant d'autres sources pour produire des estimations officielles de la production économique nationale et provinciale pour ce secteur.

Les estimations de l'enquête sont disponibles pour les entreprises, les gouvernements, les investisseurs, les associations et le public. Les données sont utilisées pour surveiller la croissance du secteur, mesurer le rendement et faire des comparaisons avec d'autres sources de données, afin de mieux comprendre ce secteur.

Activité statistique

L'enquête est menée dans le cadre du Programme intégré de la statistique des entreprises (PISE). Le PISE a été conçu pour intégrer les quelque 200 enquêtes auprès des entreprises dans un même programme d'enquête principal. Le PISE vise à recueillir des données sur les industries et les produits à l'échelle provinciale, tout en évitant les chevauchements entre les différents questionnaires d'enquête. Les questionnaires d'enquête auprès des entreprises ainsi remaniés ont une présentation, une structure et un contenu harmonisé.

L'approche intégrée rend la déclaration plus facile pour les entreprises ayant des activités dans différentes industries, puisqu'elles peuvent ainsi fournir des renseignements similaires pour chaque succursale. Elles n'ont ainsi pas à remplir des questionnaires dont la présentation, le libellé et même les concepts changent d'une industrie à l'autre. Les résultats combinés donnent des statistiques économiques plus cohérentes et précises.

Période de référence : L'année civile ou l'exercice financier de 12 mois dont le dernier jour se situe entre le 1er avril de l'année de référence et le 31 mars de l'année suivante.

Période de collecte : Février à août de l'année suivant la période de référence.

Sujets

  • Commerce de détail et de gros
  • Ventes et stocks de grossistes

Sources de données et méthodologie

Population cible

Ce secteur comprend deux principaux types de grossistes : les grossistes-marchands et les agents et courtiers en gros.

La population de l'enquête est l'ensemble des établissements de commerce de gros dont il est réaliste de chercher à obtenir des renseignements. La population de l'enquête diffère de la population cible, car il est difficile de cerner toutes les unités relevant de la population cible en raison d'un manque de renseignements détaillés (p. ex. erreur de classification des industries) pour certaines unités, surtout les petites entreprises dont les chiffres de ventes sont peu élevés.

La population de l'enquête comprend tous les établissements statistiques (entreprises constituées en société ou non constituées en société) qui font partie du Registre des entreprises de Statistique Canada et classés selon le code 41 - Commerce de gros du Système de classification des industries de l'Amérique du Nord (SCIAN) 2017, ainsi que les petites entreprises non constituées en société ne se trouvant pas dans le Registre des entreprises, et qui sont classées dans le secteur du commerce de gros.

La population observée est constituée de tous les établissements classés selon le code 41 - Commerce de gros du SCIAN de 2017 trouvés dans le Registre des entreprises de Statistique Canada en date du dernier jour de l'année de référence (y compris les établissements actifs durant une partie de l'année de référence).

Élaboration de l'instrument

Le questionnaire d'enquête contient des modules génériques, qui ont été conçus afin de couvrir plusieurs industries de services par exemple les modules portant sur les revenus et les dépenses.

Afin de réduire le fardeau de réponse, les petites entreprises reçoivent un questionnaire (version abrégée) portant sur les caractéristiques propres à leur industrie et qui ne comprend pas les modules portant sur les revenus et les dépenses. Cette version abrégée est conçue pour recueillir des données sur les caractéristiques financières et non financières alors que les données sur les revenus et les dépenses sont tirées des fichiers administratifs.

Échantillonnage

Le Registre des entreprises est une base de données sur la population des entreprises canadiennes. Statistique Canada l'a créé principalement pour établir les bases de sondage de ses enquêtes économiques. Il a été conçu de manière à faciliter la coordination de la couverture des enquêtes auprès des entreprises ainsi qu'à uniformiser la classification des unités statistiques déclarantes. Il est également utilisé comme source de données pour recueillir des renseignements démographiques sur les entreprises.

Les nouvelles données recueillies dans le cadre du programme d'enquêtes de Statistique Canada ainsi que les fichiers des numéros d'entreprise de l'Agence de revenu du Canada (ARC) sont les principales sources d'information du Registre des entreprises. Cette source de données administratives de l'ARC permet de créer l'univers de toutes les entités commerciales.

Il s'agit d'une enquête de type pseudo-recensement avec plan de sondage transversal. Toutes les unités d'échantillonnage de la population visée, selon le Registre des entreprises, sont sélectionnées, mais un questionnaire ne sera envoyé qu'à un sous-ensemble de celles-ci (environ 4 700 entreprises). Les valeurs pour les variables financières proviennent principalement de données d'enquête et fiscales (fichiers T1, T2, T3010 et T5013 de l'ARC).Pour toutes les autres variables de l'enquête, des données d'enquête sont utilisées pour le sous-ensemble d'unités sélectionnées pour recevoir un questionnaire, alors que l'imputation est utilisée pour les autres unités. La partie pour laquelle les données sont recueillies est définie par un processus précis qui garantit que la population d'enquête est bien représentée par les données d'enquête.

UNITÉ D'ÉCHANTILLONNAGE
L'unité d'échantillonnage est l'entreprise, telle qu'elle est définie dans le Registre des entreprises.

ÉCHANTILLONNAGE ET SOUS-ÉCHANTILLONNAGE
Dans un recensement, toutes les unités d'échantillonnage sont sélectionnées et sont autoreprésentées dans les étapes de traitement subséquentes.

Sources des données

Collecte des données pour cette période de référence : 2021-02-16 à 2021-08-30

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

Les données sont recueillies principalement au moyen d'un questionnaire électronique auquel il est possible de répondre dans l'une ou l'autre des deux langues officielles. Les répondants ont également la possibilité de recevoir un questionnaire papier, de répondre par interview téléphonique ou par d'autres méthodes de production électronique. En l'absence de réponse, un suivi est effectué au moyen de courriels, d'appels téléphoniques ou par télécopieur. Ce suivi des non-répondants est dynamique et les priorités sont déterminées en fonction de maximiser les taux de réponse pondérés. Lorsque le suivi est fait pour valider les données recueillies, la priorisation est effectuée en fonction des écarts avec les valeurs attendues.

Les données administratives

Une stratégie de remplacement des données d'enquête par des données fiscales a été instaurée afin de réduire le fardeau de réponse et les coûts d'enquête. Cette stratégie consiste à utiliser des données fiscales plutôt que des données d'enquête pour certaines unités simples (par exemple un seul emplacement et une seule activité).

Dans le cadre du Programme intégré de la statistique des entreprises (PISE), les données fiscales des formulaires T1 sont utilisées pour les entreprises non constituées en société, celles des formulaires T2 sont utilisées pour les entreprises constituées en société, celles des formulaires T3010 sont utilisées pour les organismes de bienfaisance, et celles des formulaires T5013 sont utilisées pour les sociétés de personnes. Le remplacement de données peut être effectué pour corriger des valeurs aberrantes ou remplacer des données manquantes, soit partielles ou complètes. Les données fiscales peuvent également être utilisées pour faire le rapprochement de données d'enquête.

L'intégration des données permet de combiner les données de multiples sources de données, y compris les données d'enquête recueillies auprès des répondants, les données administratives de l'Agence du revenu du Canada et d'autres formes de données auxiliaires, le cas échéant. Au cours du processus d'intégration, les données sont importées, transformées, validées, agrégées et couplées à partir des différents fournisseurs de données selon les formats, les structures et les niveaux requis pour être traitées par le PISE. Les données administratives sont utilisées dans le cadre d'une stratégie de remplacement des données pour un grand nombre de variables financières pour la plupart des petites et moyennes entreprises, ainsi qu'un groupe restreint de grandes entreprises, afin d'éviter la collecte des données de ces variables. Les données administratives sont également utilisées comme source de données auxiliaire pour la vérification et l'imputation lorsqu'il manque des données sur les répondants.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

La détection des erreurs fait partie intégrante des activités de collecte et de traitement des données. Des règles de validation automatisées sont appliquées aux enregistrements de données durant la collecte afin de repérer les erreurs de déclaration et de saisie. Ces règles permettent de repérer les erreurs potentielles d'après les variations d'une année à l'autre des variables clés, des totaux et des ratios qui dépassent les seuils de tolérance, ainsi que les problèmes de cohérence des données recueillies (p. ex. le total d'une variable n'est pas égal à la somme de ses parties). D'autres règles de validation sont utilisées durant le traitement des données afin de détecter automatiquement les erreurs ou les incohérences qui subsistent après la collecte. Ces règles comprennent les contrôles de valeurs (p. ex. Valeur > 0, Valeur > -500, Valeur = 0), les contrôles d'égalité linéaire (p. ex. Valeur1 + Valeur2 = Valeur Totale), les contrôles d'inégalité linéaire (p. ex. Valeur1 >= Valeur2) et les contrôles d'équivalence (p. ex. Valeur1 = Valeur2). Les erreurs repérées peuvent être corrigées en suivant le processus de suivi des questionnaires rejetés au contrôle durant la collecte ou par imputation. Les valeurs extrêmes sont aussi signalées comme étant des valeurs aberrantes, au moyen de méthodes automatisées fondées sur la répartition des renseignements recueillis. Les valeurs détectées font ensuite l'objet d'un examen visant à en évaluer la fiabilité. L'examen manuel d'autres unités peut entraîner la détection d'autres valeurs aberrantes. Ces valeurs sont exclues du calcul des ratios et des tendances utilisés pour l'imputation et durant l'imputation par donneur. En général, tous les efforts ont été déployés pour réduire les erreurs non dues à l'échantillonnage, à savoir les erreurs d'omission, de dédoublement, de classification erronée, de déclaration et de traitement.

Imputation

Dans le cadre d'une enquête de type pseudo-recensement où des unités ne sont pas sélectionnées pour la collecte, en cas de non-réponse ou de réponses incomplètes, ou si les renseignements fournis sont considérées comme incorrects aux étapes de la détection des erreurs, l'imputation est utilisée pour produire les données manquantes ou corriger celles qui sont erronées. De nombreuses méthodes d'imputation peuvent être utilisées pour compléter un questionnaire, y compris les modifications manuelles apportées par un analyste. Les techniques statistiques automatisées employées pour imputer les données manquantes comprennent l'imputation déterministe, le remplacement par des données historiques (avec calcul de tendance, s'il y a lieu), le remplacement par des renseignements auxiliaires obtenus auprès d'autres sources, le remplacement fondé sur les relations connues entre les données pour l'unité échantillonnée et le remplacement par des données tirées d'une unité semblable de l'échantillon (appelé imputation par donneur). En général, les variables clés sont imputées en premier; elles sont ensuite utilisées aux étapes subséquentes pour imputer d'autres variables connexes.

L'imputation permet de produire un fichier de microdonnées complet et cohérent qui couvre toutes les variables d'enquête.

Estimation

Dans le cadre d'une enquête de type pseudo-recensement, toutes les unités de la population visée sont incluses dans les estimations de l'enquête. Pour toutes les unités de la population visée qui n'ont pas reçu un questionnaire de l'enquête, les données fiscales et les valeurs provenant de l'imputation de données sont utilisées pour remplacer les données d'enquête. Pour tous les renseignements financiers, cette stratégie signifie que des données fiscales seront utilisées au lieu de données d'enquête. Les données fiscales des formulaires T1 sont utilisées pour les entreprises non constituées en société, celles des formulaires T2 sont utilisées pour les entreprises constituées en société, celles des formulaires T3010 sont utilisées pour les organismes de bienfaisance, et celles des formulaires T5013 sont utilisées pour les sociétés de personnes. Les autres variables d'enquête sont imputées au moyen de techniques statistiques automatisées (présentées à la section Imputation), ce qui permet de créer un fichier de microdonnées complet et cohérent.

L'estimation des totaux se fait à l'aide d'une simple agrégation des valeurs pondérées de toutes les unités d'estimation qui se trouvent dans le domaine d'estimation. Les estimations sont calculées pour plusieurs domaines d'estimation tels que les groupes industriels et les provinces ou les territoires, en se fondant sur les données de classification les plus récentes disponibles pour l'unité d'estimation et la période de référence de l'enquête. Il est à noter que ces données de classification peuvent différer de la classification initiale utilisée à l'échantillonnage parce que la taille, l'industrie ou l'emplacement pourraient avoir changé dans les enregistrements. Les changements de classification sont immédiatement pris en compte dans les estimations.

La répartition des données est nécessaire lorsque certaines entreprises déclarent leurs données en regroupant un grand nombre d'unités situées dans plus d'une province ou territoire ou appartenant à plus d'une catégorie industrielle dans la classification. Les facteurs fondés sur l'information provenant de sources telles que les fichiers de données fiscales et les profils du Registre des entreprises sont utilisés afin de répartir les données déclarées dans le rapport combiné entre les différentes unités d'estimation où l'entreprise exerce ses activités. Les caractéristiques des unités d'estimation sont utilisées pour dériver les domaines d'estimation, y compris la classification des industries et la région géographique.

Évaluation de la qualité

Avant la publication, les résultats combinés de l'enquête sont analysés afin d'en évaluer la comparabilité. Il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement pour les grandes entreprises), de la conjoncture économique générale, de la cohérence avec les résultats des indicateurs économiques connexes, des tendances historiques et des renseignements provenant d'autres sources externes (p. ex. associations, publications spécialisées ou articles de journaux).

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans y être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupements de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Il n'y a pas de désaisonnalisation. Les données historiques pourraient être révisées en fonction de renseignements plus à jour.

Exactitude des données

La méthodologie de l'enquête a pour objectif de contrôler les erreurs et de réduire leurs effets éventuels sur les estimations. Les résultats de l'enquête peuvent néanmoins contenir des erreurs, lesquelles peuvent survenir à différentes étapes du processus d'enquête. Par exemple, des erreurs peuvent survenir quand un répondant fournit des renseignements erronés ou qu'il ne répond pas à certaines questions, lorsqu'une unité dans la population cible est oubliée ou dénombrée plus d'une fois, lorsque les données sur la TPS pour les enregistrements qui ont été modélisés pour un mois particulier ne sont pas représentatives de l'enregistrement actuel pour diverses raisons, lorsqu'une unité hors du champ de l'enquête y est incluse erronément ou que des erreurs sont commises lors du traitement des données, comme des erreurs de codage ou de saisie.

Avant la publication, les résultats combinés de l'enquête sont analysées afin d'en évaluer la comparabilité; il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement celles des grandes entreprises), de la conjoncture économique générale et des tendances historiques.

Une mesure habituelle de la qualité des données des enquêtes est le coefficient de variation (c.v.). Le c.v., soit l'erreur type divisée par l'estimation de l'enquête, est une mesure de précision en termes relatifs. Dans le contexte d'un pseudo-recensement, le c.v. mesure la variance provenant de l'imputation, et tient compte de l'imputation pour des unités avec lesquelles on n'a pas pris contact ou pour lesquelles il y a eu non-réponse.

La formule utilisée pour calculer le c.v. en pourcentage est :

c.v. (X) = S(X) * 100 % / X
où X représente l'estimation et S(X) représente l'erreur-type de X.

Il est possible de construire les intervalles de confiance autour des estimations en utilisant l'estimation et le c.v. Donc, pour l'échantillon, il est possible de déclarer avec un niveau donné de confiance que la valeur prévue sera comprise dans l'intervalle de confiance construit autour de l'estimation. Par exemple, si une estimation de 12 000 000 $ a un CV de 2 %, l'erreur-type sera de 240 000 $ (l'estimation multipliée par le c.v.). Il est possible de déclarer avec 68 % de confiance que les valeurs prévues seront comprises dans l'intervalle dont la longueur est égale à un écart-type de part et d'autre de l'estimation, c'est-à-dire entre 11 760 000 $ et 12 240 000 $.

Ou bien, Il est possible de déclarer avec 95 % de confiance que la valeur prévue sera comprise dans l'intervalle dont la longueur est égale à deux écarts-types de part et d'autre de l'estimation, c'est-à-dire entre 11 520 000 $ et 12 480 000 $.

Enfin, étant donné la faible contribution de la partie non observée de la population aux estimations totales, le biais dans la partie non observée a un effet négligeable sur les c.v. Par conséquent, le c.v. provenant de la partie observée est utilisé pour l'estimation totale qui est égale à la somme des estimations pour les parties observée et non observée de la population.

TAUX DE RÉPONSE
Le taux de réponse pondéré à la collecte est de 88,54 %.

ERREUR NON DUE À L'ÉCHANTILLONNAGE
Les erreurs non dues à l'échantillonnage ne sont pas liées à l'échantillonnage et peuvent survenir pour différentes raisons au cours de la collecte et du traitement des données. La non-réponse, par exemple, est une source importante d'erreurs non dues à l'échantillonnage. Le sous-dénombrement ou le surdénombrement de la population, les écarts dans l'interprétation des questions ainsi que les erreurs d'enregistrement, de codage et de traitement des données sont d'autres exemples d'erreurs non dues à l'échantillonnage.

BIAIS DE NON-RÉPONSE
Dans la mesure du possible, ces erreurs sont réduites au minimum par la conception minutieuse du questionnaire d'enquête, la vérification des données de l'enquête et le suivi auprès des non-répondants afin de maximiser les taux de réponse.

Lorsque l'imputation est effectuée pour des unités avec lesquelles on n'a pas pris contact, ou pour corriger la non-réponse, la variance causée par l'imputation est prise en compte lors du calcul du c.v. et des indicateurs de qualité. D'autres indicateurs de la qualité sont également fournis, comme le taux de réponse. Le taux de réponse est également utilisé pour ajuster les indicateurs de qualité pour des variables pour lesquelles la variance provenant de l'imputation ne peut être calculée.

ERREUR DE COUVERTURE
Les erreurs de couverture comprennent les omissions, les inclusions erronées, les doubles comptes et les erreurs de classification des unités dans la base de sondage.

Le Registre des entreprises (RE) est la base de sondage commune de toutes les enquêtes du Programme intégré de la statistique des entreprises. Le RE est un centre de service de données mis à jour au moyen de plusieurs sources, notamment les fichiers de données administratives, les commentaires reçus dans le cadre des enquêtes-entreprises de Statistique Canada, et les activités d'établissement de profils, qui comprennent un contact direct avec les entreprises pour obtenir des renseignements sur leurs activités, ainsi que les résultats de recherche sur Internet. L'utilisation du RE permet d'assurer la qualité, tout en évitant les chevauchements entre les enquêtes et en allégeant le fardeau de réponse le plus possible.

Date de modification :