Enquête annuelle sur le commerce de gros

Information détaillée pour 2015

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

2445

Cette enquête recueille les données financières et de produits qui servent à établir les statistiques du secteur du commerce de gros au Canada.

Date de la parution - Prévue pour le 19 décembre 2016

Aperçu

L'objectif de l'enquête annuelle sur le commerce de gros est de présenter des données courantes sur les recettes, les dépenses d'exploitation et les stocks des grossistes au Canada par groupe industriel et au niveau national et provincial ou territorial pour l'année civile précédente.

Ces données sont étudiées par tous les paliers de gouvernement, les organismes gouvernementaux, le secteur du commerce de gros et les particuliers afin d'évaluer les tendances dans le secteur, d'en mesurer le rendement, d'établir des données repères et d'étudier la structure évolutive du secteur du commerce de gros. Ces renseignements sont également des données d'entrée essentielles qui permettent de mesurer les marges brutes dans le Système canadien de comptabilité nationale (SCCN).

Activité statistique

L'enquête est menée dans le cadre du Programme intégré de la statistique des entreprises (PISE). Le PISE a été conçu pour intégrer les quelque 200 enquêtes auprès des entreprises dans un même programme d'enquête principal. Le PISE vise à recueillir des données plus précises sur les industries et les produits à l'échelle provinciale, tout en évitant les chevauchements entre les différents questionnaires d'enquête. La restructuration des questionnaires d'enquête sur les entreprises permet une plus grande harmonisation de la présentation, de la structure et du contenu. L'approche intégrée rend la déclaration plus facile pour les entreprises ayant des activités dans différentes industries, puisqu'elles peuvent ainsi fournir des renseignements similaires pour chaque succursale. Elles n'ont ainsi pas à remplir des questionnaires, dont la présentation, la formulation et même les concepts changent d'une industrie à l'autre. Les résultats combinés donnent des statistiques économiques plus cohérentes et précises.

Période de référence : L'année civile, ou le plus récent exercice financier de 12 mois dont le dernier jour se situe le ou avant le 31 mars de la prochaine année civile.

Période de collecte : avril à octobre

Sujets

  • Commerce de détail et de gros
  • Ventes et stocks de grossistes

Sources de données et méthodologie

Population cible

La population cible est l'ensemble des établissements de commerce de gros qui ont été actifs au Canada pendant l'année de référence. Ce secteur comprend deux grands types de grossistes, soit, d'une part, les marchands en gros et, d'autre part, les agents et les courtiers en gros.

La population enquêtée est l'ensemble des établissements de commerce de gros dont il est réaliste de chercher à obtenir des renseignements. La population enquêtée diffère de la population cible car il est difficile de cerner toutes les unités relevant de la population cible à cause d'un manque de renseignements détaillés (p.ex. : erreur de classification des industries), sur certaines unités, surtout les petites entreprises dont les chiffres de ventes sont peu élevés.

La population enquêtée comprend tous les établissements statistiques (entreprises incorporées ou non) qui font partie du Registre des entreprises de Statistique Canada et dont le code SCIAN est 41 (c'est-à-dire le secteur du commerce de gros), ainsi que les petites entreprises non constituées en société ne se trouvant pas dans le Registre des entreprises et classées dans le secteur du commerce de gros.

Élaboration de l'instrument

Les questionnaires d'enquêtes contiennent des modules génériques qui ont été conçus pour couvrir le secteur du commerce de gros. Ces modules incluent des renseignements reliés aux revenus, aux dépenses, et aux commoditées. Les questionnaires incluent également des modules propres à l'industrie faisant l'objet de l'enquête dont le but est d'obtenir des caractéristiques financières et autres qui se rapportent particulièrement à cette industrie.

Afin de réduire le fardeau de réponse, les petites entreprises reçoivent un questionnaire concernant les caractéristiques (version abrégée) qui ne comprend seulement que les modules propres à l'industrie faisant l'objet de l'enquête. Pour ces petites entreprises, les données reliées aux revenus et aux dépenses sont tirées de fichiers administratifs.

Le questionnaire a été élaboré en consultation avec d'éventuels répondants, des utilisateurs de donnée, et des spécialistes de l'élaboration de questionnaires.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

La base de sondage est la liste des entreprises et établissements qui ont été sélectionnés pour l'Enquête sur l'activité économique, les dépenses et les produits de Statistique Canada. La base fournit des renseignements fondamentaux sur chaque entreprise, incluant l'adresse, la classification industrielle et des renseignements provenant des sources de données administratives. Cette information provient du Registre des entreprises de Statistique Canada est mise à jour et complétée à l'aide de l'Enquête sur l'activité économique, les dépenses et les produits de Statistique Canada.

Avant la sélection d'un échantillon aléatoire, les entreprises sont classées dans des groupes homogènes (c.-à-d. des groupes ayant le même code SCIAN, la même zone géographique [province/territoire]) formés selon les caractéristiques de leurs établissements. Ensuite, chaque groupe est divisé en sous-groupes (petit, moyen, grand) qu'on appelle les strates, en fonction de leur revenu d'entreprise annuel.

Par la suite, un échantillon d'une taille prédéterminée est réparti dans chaque strate. L'objectif est d'optimiser la qualité générale de l'enquête tout en respectant les ressources disponibles. La répartition de l'échantillon peut donner lieu à deux types de strates : des strates à tirage complet, où l'échantillonnage de toutes les unités est certain, et des strates à tirage partiel, où la sélection des unités échantillonnées se fait de manière aléatoire.

La taille totale de l'échantillon pour l'enquête est d'environ 4 270 entreprises.

Sources des données

Collecte des données pour cette période de référence : 2016-04-28 à 2016-10-24

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

Les données sont recueillies chaque année principalement à l'aide d'un questionnaire électronique, tout en offrant la possibilité de recevoir un questionnaire papier, répondre par entrevue téléphonique ou par d'autre méthodes de production électronique. Un suivi sur les non-réponses et pour la validation des données est effectué par téléphone ou télécopieur.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

La détection des erreurs fait partie intégrante des activités de collecte et de traitement des données. Des règles de validation automatisées sont appliquées aux enregistrements de données durant la collecte afin de repérer les erreurs de déclaration et de saisie. Ces règles permettent de repérer les erreurs potentielles d'après les variations d'une année à l'autre des variables clés, des totaux et des ratios qui dépassent les seuils de tolérance, ainsi que les problèmes de cohérence des données recueillies (p. ex., le total d'une variable n'est pas égal à la somme de ses parties). D'autres règles de validation sont utilisées durant le traitement des données afin de détecter automatiquement les erreurs ou les incohérences qui subsistent après la collecte. Ces règles comprennent les contrôles de valeurs (p. ex. Valeur > 0, Valeur > -500, Valeur = 0), les contrôles d'égalité linéaire (p. ex. Valeur1 + Valeur2 = Valeur Totale), les contrôles d'inégalité linéaire (p. ex. Valeur1 >= Valeur2) et les contrôles d'équivalence (p. ex. Valeur1 = Valeur2). Les erreurs repérées peuvent être corrigées en suivant le processus de suivi des questionnaires rejetés au contrôle durant la collecte ou par imputation. Les valeurs extrêmes sont aussi signalées comme étant des valeurs aberrantes, à l'aide de méthodes automatisées fondées sur la distribution des renseignements recueillis. Les valeurs détectées font ensuite l'objet d'un examen visant à en évaluer la fiabilité. L'examen manuel d'autres unités peut entraîner la détection d'autres valeurs aberrantes. Ces valeurs sont exclues du calcul des ratios et des tendances utilisés pour l'imputation et durant l'imputation par donneur. En général, tous les efforts ont été déployés pour réduire les erreurs non dues à l'échantillonnage, à savoir les erreurs d'omission, de dédoublement, de classification erronée, de déclaration et de traitement.

Imputation

En cas de non-réponse ou de réponses incomplètes au questionnaire ou lorsque les données déclarées sont considérées comme incorrectes aux étapes de la détection des erreurs, on utilise l'imputation pour compléter ou corriger les renseignements. De nombreuses méthodes d'imputation peuvent être utilisées pour compléter un questionnaire, y compris les modifications manuelles apportées par un analyste. Les techniques statistiques automatisées employées pour imputer les données manquantes comprennent : l'imputation déterministe, le remplacement par des données historiques (avec calcul de tendance, s'il y a lieu), le remplacement par des renseignements auxiliaires obtenues auprès d'autres sources, le remplacement fondé sur les relations connues entre les données pour l'unité échantillonnée et le remplacement par des données tirées d'une unité semblable de l'échantillon (appelé imputation par donneur). En général, on commence par imputer les variables clés, qu'on utilise ensuite aux étapes subséquentes pour imputer d'autres variables connexes.

L'imputation permet de produire un fichier de micro données complet et cohérent qui couvre toutes les variables d'enquête.

Estimation

La répartition des données est nécessaire lorsque certaines entreprises déclarent leurs données en regroupant un grand nombre d'unités d'échantillonnage situées dans plus d'une province ou territoire ou appartenant à plus d'une branche d'activité. Les facteurs fondés sur l'information provenant de sources telles que les fichiers de données fiscales et les profils du Registre des entreprises sont utilisés afin de répartir les données déclarées dans le rapport combiné entre les différentes unités d'estimation où l'entreprise exerce ses activités.

L'échantillon utilisé pour l'estimation résulte d'un processus d'échantillonnage en deux phases. Un poids d'échantillonnage initial (le poids déterminé par le plan d'échantillonnage) est calculé pour chaque unité de l'enquête et correspond simplement à la multiplication de l'inverse de la probabilité de sélection à chaque phase. Il est ensuite ajusté pour tenir compte des unités qui auraient pu être mal classées (grandes unités trouvées dans une strate de petites unités, par exemple). En outre, les poids d'échantillonnage dérivés sont modifiés et ajustés à l'aide de renseignements à jour provenant des données fiscales. On utilise une technique statistique appelée calibration pour ajuster l'ensemble final de poids de manière à ce que l'échantillon représente le plus fidèlement possible les données fiscales de la population de l'industrie.

Le poids calculé pour chaque unité d'échantillonnage indique combien d'autres unités elle représente. Les poids finaux sont habituellement égaux ou supérieurs à un. Les unités d'échantillonnage à tirage complet ont un poids d'échantillonnage de 1 et ne représentent qu'elles-mêmes. Les unités de valeurs plus grandes que prévu sont considérées comme mal classées et leur poids est généralement ajusté de sorte qu'elles ne représentent qu'elles-mêmes.

L'unité d'échantillonnage étant l'entreprise, elle peut représenter de nombreux emplacements qui pourraient contribuer à différentes parties de la population (sous-industries, province ou territoire, etc.). Chaque emplacement est considéré comme une unité d'estimation. On utilise les caractéristiques des unités d'estimation pour dériver les domaines d'estimation, y compris la classification des industries et la géographie. L'estimation pour la partie enquêtée de la population se fait par simple agrégation des valeurs pondérées de tous les emplacements échantillonnés qui se trouvent dans le domaine d'estimation. On calcule les estimations pour plusieurs domaines d'estimation tels que les groupes industriels et les provinces ou territoires, en se fondant sur les données de classification les plus récentes disponibles pour l'emplacement et la période de référence de l'enquête. Il est à noter que ces données de classification peuvent différer de la classification d'échantillonnage originale parce que la taille des enregistrements, l'industrie ou l'emplacement pourraient avoir changé. Les changements de classification se reflètent immédiatement dans les estimations.

Dans le cas de la partie inéligible à l'échantillonnage (aussi appelée partie à tirage nul) de la population cible définie dans l'Enquête sur l'activité économique, les dépenses et les produits de Statistique Canada, on se contente d'agréger les données fiscales pour arriver à une estimation. Si une estimation est nécessaire et qu'il n'y a pas de données fiscales disponibles, on procède à une modélisation à l'aide des données fiscales auxiliaires afin de créer des données pour toutes les variables demandées pour chaque unité de la partie à tirage nul. Là encore, l'estimation est produite par simple agrégation des données. L'estimation globale englobe les estimations de la partie enquêtée et de la partie à tirage nul.

Évaluation de la qualité

Avant la publication, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité. Il s'agit généralement d'un examen détaillé des réponses individuelles (particulièrement pour les grandes entreprises), de la conjoncture économique générale, de la cohérence avec les résultats de l'indicateur économique connexe, des tendances historiques et des renseignements d'autres sources externes (p. ex. associations, publications spécialisées, articles de journaux).

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans y être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupements de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite à l'aide du système de confidentialité généralisé (G-CONFID) de Statistique Canada. G-CONFID est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Il n'y a pas de désaisonnalisation pour les enquêtes annuelles. Les données historiques pourraient être révisées sur la base d'information plus à jour.

Exactitude des données

Toutes les enquêtes sont sujettes aux erreurs d'échantillonnage et aux erreurs non dues à l'échantillonnage. Les erreurs d'échantillonnage se produisent parce que les estimations proviennent d'un échantillon de la population plutôt que de la population entière. Les erreurs non dues à l'échantillonnage ne sont pas liées à l'échantillonnage et peuvent survenir pour différentes raisons au cours de la collecte et du traitement des données. La non-réponse, par exemple, est une source importante d'erreurs non dues à l'échantillonnage. Le sous dénombrement ou le surdénombrement de la population, les écarts dans l'interprétation des questions ainsi que les erreurs d'enregistrement, de codage et de traitement des données sont d'autres exemples d'erreurs non dues à l'échantillonnage. Dans la mesure du possible, ces erreurs sont réduites au minimum par la conception minutieuse du questionnaire d'enquête, la vérification des données de l'enquête et le suivi auprès des non-répondants afin de maximiser les taux de réponse.

Des mesures de l'erreur d'échantillonnage sont calculées pour chaque estimation. De plus, lorsqu'il y a de la non-réponse, celle-ci est prise en compte et la qualité est réduite en fonction de son importance dans l'estimation. Sont aussi fournis d'autres indicateurs de la qualité tels que le taux de réponse.

L'erreur d'échantillonnage et le taux de non-réponse sont combinés en un seul code d'évaluation de la qualité. Ce code utilise les lettres de A à F où A signifie que les données sont d'excellente qualité et F signifie qu'elles ne sont pas fiables. Ces codes d'évaluation de la qualité peuvent être demandés et doivent toujours être pris en considération.

Documentation

Date de modification :