Enquête biennale sur l'eau dans les industries (EEI)

Information détaillée pour 2017

Statut :

Active

Fréquence :

Aux 2 ans

Numéro d'enregistrement :

5120

La présente enquête est menée pour fournir aux Canadiens des indicateurs nationaux et régionaux portant sur l'utilisation de l'eau dans les industries.

Date de la parution - 23 octobre 2019 (Les centrales thermoélectriques)

Aperçu

La présente enquête fournit des renseignements sur la quantité d'eau prélevée ainsi que sur les coûts, les sources, les traitements et l'évacuation de l'eau utilisée par les industries manufacturières et minières et par les centrales thermoélectriques au Canada. Ces données sont utilisées lors de l'élaboration des comptes de l'environnement et pour répondre aux exigences de production d'indicateurs portant sur l'utilisation de l'eau dans le cadre des Indicateurs canadiens de durabilité de l'environnement publiés par Environnement et Changement climatique Canada.

Activité statistique

L'enquête est menée dans le cadre du Programme intégré de la statistique des entreprises (PISE). Le PISE a été conçu pour intégrer les quelque 200 enquêtes auprès des entreprises dans un même programme d'enquête principal. Le PISE vise à recueillir des données sur les industries et les produits à l'échelle provinciale, tout en évitant les chevauchements entre les différents questionnaires d'enquête. Les questionnaires d'enquêtes auprès des entreprises ainsi restructurés ont une présentation, une structure et un contenu harmonisé.

L'approche intégrée rend la déclaration plus facile pour les entreprises ayant des activités dans différentes industries, puisqu'elles peuvent ainsi fournir des renseignements similaires pour chaque succursale. Elles n'ont ainsi pas à remplir des questionnaires dont la présentation, le libellé et même les concepts changent d'une industrie à l'autre. Les résultats combinés donnent des statistiques économiques plus cohérentes et précises.

Période de référence : Année civile

Sujets

  • Environnement
  • Qualité de l'environnement

Sources de données et méthodologie

Population cible

La population cible est composée des emplacements prenant principalement part à la fabrication, à l'extraction du charbon, à l'extraction de minerais métalliques, à l'extraction de minerais non métalliques (à l'exclusion de l'extraction du sable et du gravier) et à la production thermique d'énergie électrique. Cette dernière englobe la production d'électricité à partir de combustibles fossiles et la production d'électricité d'origine nucléaire.

Élaboration de l'instrument

L'Enquête sur l'eau dans les industries utilise trois questionnaires pour recueillir les données auprès des répondants. Un questionnaire distinct a été conçu pour chacun des trois secteurs visés par l'enquête, à savoir un questionnaire pour les industries manufacturières, un pour les industries de l'extraction minière et un autre pour les centrales produisant de l'électricité à partir de combustibles fossiles ou de l'électricité d'origine nucléaire. Le questionnaire électronique (QE) est utilisé commencent en 2017. Avant l'implémentation, le questionnaire a été vérifié par des répondants afin de s'assurer que les concepts soient clairement compris et que les répondants soient en mesure de répondre correctement aux questions.

Les questionnaires permettent de recueillir des données sur le volume d'eau que font entrer dans leurs installations les utilisateurs industriels, y compris des renseignements sur la source, l'usage, le traitement et la recirculation possible de cette eau. De plus, on recueille des données sur les volumes d'eau évacuée et le traitement de cette eau par les utilisateurs industriels. Des données sur les coûts du prélèvement et de l'évacuation de l'eau sont également recueillies.

Les questionnaires ont été conçus en collaboration avec les utilisateurs de données afin de répondre à leurs besoins statistiques. Les répondants ont également été consultés dans le cadre de rencontres individuelles afin de s'assurer que les renseignements demandés soient accessibles et qu'il soit possible de remplir le questionnaire dans un délai raisonnable.

Tous les questionnaires ont été révisés en 2017 après qu'ils aient été testés sur des groupes de discussion composés de répondants de l'enquête.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

La détermination de la base de sondage se fait à partir du Registre des entreprises de Statistique Canada et vise la population représentée par tous les emplacements manufacturiers, certains emplacements miniers et toutes les centrales thermoélectriques. L'unité statistique est l'emplacement. L'emplacement renvoie à une unité de production située en un point géographique précis à partir de laquelle, sont menées des activités commerciales et dont on a accès, au minimum, aux données en matière d'emploi.

La taille de la population était de 126 608 emplacements manufacturiers (SCIAN 31-33), 736 emplacements miniers (SCIAN 2121, 2122, 2123, excluant 21232) et 100 centrales thermoélectriques (SCIAN 221112 et 221113).

Une stratégie d'échantillonnage indépendante est utilisée pour chacun des trois secteurs :
- Un recensement est utilisé pour obtenir l'information pour chacune des 100 centrales thermoélectriques au Canada. Un plan d'échantillonnage aléatoire de Bernoulli stratifié utilisé pour la sélection de l'échantillon pour le secteur de l'extraction minière et du secteur manufacturier.
- Pour le secteur de l'extraction minière, les emplacements sont stratifiés par la région et par le code à quatre chiffres du SCIAN. Les quelques 383 unités de l'échantillon reçoivent un questionnaire.
- Pour le secteur manufacturier, les emplacements sont stratifiés par région de drainage (25 au total), par industrie (3 ou 5 chiffres du SCIAN) et par groupe de tailles (4 groupes) basé sur l'utilisation de l'eau. Afin de réduire le fardeau de réponse des petites unités, les plus petites des industries ciblées ont été exclues de l'échantillonnage. Dans chaque ensemble d'industrie, les emplacements qui composent la tranche inférieure de la revenue du Registre des entreprises de 5 % de la mesure de la taille par région de drainage ont été exclus. Certaines industries qui sont de grosses consommatrices d'eau sont sélectionnées avec certitude; le reste de la population est échantillonné avec des taux d'échantillonnage variables, selon l'industrie. Les quelque 5073 unités de l'échantillon reçoivent un questionnaire.

Sources des données

Collecte des données pour cette période de référence : 2018-05-02 à 2018-09-26

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants.

Les données seront recueillies en utilisant un questionnaire électronique (QE) et à l'aide d'interview téléphonique assistée par ordinateur (ITAO). La collecte débute avec l'envoi par courrier électronique d'une lettre d'invitation et d'un code d'accès sécurisé aux répondants. Des suivis par téléphone et par courriel seront faits par téléphones pour les entreprises qui n'ont pas répondu.

Les questionnaires sont envoyés par la poste au cours de l'année suivant l'année de référence. Ils sont adressés à un « coordonnateur ou gestionnaire de l'environnement ». On demande aux répondants de retourner le questionnaire rempli dans les 28 jours suivant sa réception. L'envoi postal du document papier sera uniquement fait sur demande.

Un suivi par téléphone ou par télécopieur est effectué auprès des répondants qui ont retourné un questionnaire incomplet ou dont les questionnaires n'ont pas été reçus 28 jours après l'envoi.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

De nombreux facteurs peuvent influer sur l'exactitude des données produites dans le cadre d'une enquête. Par exemple, il peut arriver que les répondants interprètent mal certaines questions, qu'ils inscrivent incorrectement les réponses sur le questionnaire ou que des erreurs se produisent à l'étape de la saisie des données ou de la mise en tableaux. Toutes les mesures sont prises pour réduire la fréquence de telles erreurs dans l'enquête.

Le questionnaire électronique renferme des contrôles qui aident les répondants à corriger les incohérences (p. ex., la somme des pourcentages d'une variable n'est pas égale à 100 %).

Pour les données transmises, le système vérifie si toutes les cellules obligatoires ont été remplies, si certaines valeurs se situent dans des intervalles acceptables, si l'enchaînement des questions a été respecté, si les pourcentages sont convertis en dollars, si des valeurs sont attribuées à certaines variables transformées et dérivées, et si les vides sont mis à zéro, le cas échéant. Les données sont soumises à des règles de vérification de la cohérence pour chaque enregistrement utilisable. Ces règles assurent que toutes les variables ont des réponses valides et sont complètes et cohérentes dans le questionnaire et d'un questionnaire à l'autre.

La vérification ultérieure des données est effectuée par les agents spécialisés qui évaluent les échecs de modification et concentrent les efforts de suivi en conséquence. Des suivis téléphoniques sont effectués pour vérifier l'information dans les cas où les vérifications de modification échouent.

Une vérification additionnelle des données a été effectuée par les agents spécialisés, qui ont comparé les données historiques avec les données transmises afin de déterminer si les différences entre les cycles d'enquête étaient raisonnables. Dans les cas où elles ne l'étaient pas, on a demandé aux agents de collecte de confirmer les réponses avec les répondants. La vérification ultérieure des données est effectuée par les agents spécialisés qui font des recherches sur les entreprises (dans les rapports annuels, sur les sites Web, etc.) afin de vérifier l'information transmise par les répondants.

Les valeurs aberrantes sont relevées après la collecte, en dehors du Programme intégré de la statistique des entreprises, et sont éliminées du processus d'imputation.

Imputation

L'imputation statistique est utilisée pour les enregistrements de non-réponse totale et de non-réponse partielle. Six méthodes d'imputation sont utilisées :
- imputation déterministe (une seule valeur possible pour le champ à imputer);
- imputation historique (lorsqu'il est possible de le faire);
- imputation par le ratio;
- imputation par la moyenne;
- imputation par enregistrement donneur (utilisation de la méthode du plus proche voisin pour trouver, pour chaque enregistrement nécessitant une imputation, l'enregistrement valide le plus semblable);
- imputation manuelle.

Les critères utilisés pour l'imputation par le ratio, par la moyenne et par enregistrement donneur sont constitués de diverses combinaisons de groupes d'industries, de taille d'établissement et d'emplacements géographiques (province, région ou Canada). Le processus comprend l'utilisation du système généralisé de vérification et d'imputation (Banff) de Statistique Canada. En général, les variables clés sont d'abord imputées, puis elles sont utilisées comme points d'ancrage aux étapes subséquentes pour imputer d'autres variables connexes.

L'imputation permet de produire un fichier de microdonnées complet et cohérent qui couvre toutes les variables d'enquête.

Estimation

Le Système généralisé d'estimation (G-Est) conçu à Statistique Canada est utilisé pour produire des estimations par domaine et des indicateurs de qualité. Il s'agit d'une application développée à l'aide de SAS pour produire des estimations (totaux, ratios et pourcentages) pour des domaines d'une population à partir d'un échantillon.

Un poids d'échantillonnage initial (le poids déterminé par le plan d'échantillonnage) est calculé pour chaque unité de l'enquête et correspond à l'inverse de la probabilité de sélection. Le poids calculé pour chaque unité d'échantillonnage indique combien d'autres unités elle représente. Les unités d'échantillonnage qui sont choisies avec certitude (unités à tirage obligatoire) ont un poids d'échantillonnage de un et ne représentent qu'elles-mêmes; les unités à valeur aberrante dont la taille est plus grande que prévu sont considérées comme étant mal classées et leur poids est généralement ajusté de sorte qu'elles ne représentent qu'elles-mêmes, et les poids des autres unités sont ajustés en conséquence pour tenir compte de l'existence de valeurs aberrantes. Les poids définitifs sont habituellement égaux ou supérieurs à un.

Les estimations sont calculées à plusieurs niveaux d'intérêt, tels que le code du Système de classification des industries de l'Amérique du Nord et la région ou la province, et sont fondées sur les renseignements de classification les plus récents pour l'entité statistique et la période de référence de l'enquête.

L'erreur d'échantillonnage est mesurée par le coefficient de variation (c.v.), qui représente la proportion de l'estimation qui provient de la variabilité connexe. Les c.v. calculés sont indiqués dans les tableaux de données au moyen d'indicateurs de qualité.

Évaluation de la qualité

L'évaluation des microdonnées et la détection des erreurs sont des processus importants utilisés pour assurer la bonne qualité des données. Toutefois, les estimations définitives obtenues au moyen de ces microdonnées doivent également être évaluées afin d'en assurer l'exactitude. La qualité des estimations produites à partir d'une enquête peut être évaluée en comparant les données aux tendances tirées d'autres sources de données ou en effectuant une comparaison historique avec les données obtenues par le passé au moyen de la même enquête. Les estimations de l'Enquête sur l'eau dans les industries sont comparé avec celles de périodes de référence antérieures. Cette comparaison historique est réalisé afin d'assurer la cohérence des estimations.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent aux données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Le système généralisé G-Confid de Statistique Canada est utilisé pour empêcher l'identification de tous les points de données confidentiels, ainsi que les points de données qui devaient être supprimés pour empêcher la divulgation par recoupements de ces points de données confidentiels.

Un décret de révélation discrétionnaire a été obtenu, conformément au paragraphe 17(2)(g) de la Loi sur la statistique, pour autoriser la divulgation accrue de données agrégées provenant de l'Enquête sur l'eau dans les industries relativement aux centrales produisant de l'électricité à partir de combustibles fossiles ou de l'électricité d'origine nucléaire. Le décret de révélation discrétionnaire autorise la diffusion des données sur l'utilisation de l'eau dans les industries selon la région et la province, ce qui rend possible la diffusion d'un profil national intégral de l'utilisation de l'eau dans ce secteur.

Révisions et désaisonnalisation

Au besoin, les données de la précédente période de référence de l'enquête sont révisées au moment de la première diffusion des données actuelles. L'objectif de cette révision consiste à régler tous les problèmes importants liés aux données qui ont été décelés entre les cycles d'enquête. La durée de la période de révision dépend de la nature du problème. Pour les données les plus actuelles, veuillez-vous reporter aux tableaux 38-10-0037-01 à 38-10-0041-01, et 38-10-0055-01 à 38-10-0085-01. Les données ne sont pas désaisonnalisées.

Exactitude des données

Tant les erreurs d'échantillonnage que les erreurs non dues à l'échantillonnage ont une incidence sur l'exactitude des données recueillies dans le cadre d'une enquête sur échantillon.

Des erreurs d'échantillonnage surviennent lorsque l'information recueillie auprès d'un échantillon de la population est appliquée à l'ensemble de la population. Les méthodes d'échantillonnage et d'estimation, la taille de l'échantillon et la variabilité associée à chaque variable mesurée permettent de déterminer l'erreur d'échantillonnage.

A possible measure of sampling error is the coefficient of variation (CV). It represents the proportion of the estimate that comes from the variability associated to it. To take into account that imputation has occurred, both the sampling error and the non-response rate are combined into one quality rating code for each estimate. This code uses letters that range from A to F where A means the estimate is of excellent quality and F means too unreliable to be published.
A. Excellente
B. Très bonne
C. Bonne
D. Acceptable
E. À utiliser avec prudence
F. Trop peu fiable pour être publié
X. Confidentiel en vertu des dispositions de la Loi sur la statistique

En ce qui a trait aux erreurs non dues à l'échantillonnage, elles sont le résultat d'erreurs de couverture, d'erreurs de données fournies dans les réponses, d'erreurs dues à la non-réponse et d'erreurs de traitement. Tous les efforts sont déployés pour réduire ce type d'erreurs, y compris la vérification des données entrées, les contrôles de l'uniformité et de la validité, le suivi pour la non-réponse et les consultations auprès des ministères et des associations industrielles.

Les erreurs de données fournies dans les réponses peuvent être attribuables à la conception du questionnaire, aux caractéristiques d'une question, à l'incapacité ou à la réticence du répondant de fournir l'information exacte, à la mauvaise interprétation des questions ou aux problèmes de définition. Ces erreurs sont contrôlées grâce à une conception judicieuse du questionnaire, à la mise à l'essai de ce dernier et à l'utilisation de concepts simples et de processus de vérification de la cohérence.

Des erreurs de traitement peuvent survenir à diverses étapes du traitement, comme la saisie, la vérification et la mise en tableaux des données. Des mesures ont été prises pour réduire ces erreurs au minimum.

L'erreur de non-réponse se produit lorsque les répondants refusent de répondre, sont incapables de répondre ou répondent trop tard. Les données manquantes sont imputées dans les cas de non-réponse partielle (c.-à-d. lorsque seulement certaines questions sont sans réponse) et dans les cas de non-réponse totale (c.-à-d. lorsque toutes les questions de l'enquête sont sans réponse).

Pour l'année de référence 2017, le taux de réponse pour la composante de l'enquête relative aux centrales thermiques était de 98,8 %.
Pour l'année de référence 2017, le taux de réponse pour la composante de l'enquête relative aux industries manufacturières et la composante des industries minières seront disponible en hiver 2020.

Date de modification :