Enquête sur le milieu de travail et les employés (EMTE)

Information détaillée pour 2002

Statut :

Inactive

Fréquence :

Annuelle

Numéro d'enregistrement :

2615

Le but général de cette enquête est d'examiner de quelle manière les employeurs et leurs employés réagissent et s'adaptent au changement dans un environnement concurrentiel axé sur la technologie.

Date de la parution - 15 octobre 2004

Aperçu

L'Enquête sur le milieu de travail et les employés (EMTE) est conçue pour explorer un large éventail de questions reliées aux employeurs et à leurs employés. Du côté de l'employeur, l'enquête vise à mettre en lumière les relations entre la compétitivité, les innovations, l'utilisation de la technologie et la gestion des ressources humaines et, du côté de l'employé, l'utilisation de la technologie, la formation, la stabilité d'emploi et les revenus.

L'enquête est unique en ce sens que les employeurs et les employés sont liés au niveau des micro-données; les employés sont sélectionnés dans les milieux de travail échantillonnés. On dispose donc d'information provenant tant du côté de l'offre que de celui de la demande du marché du travail pour enrichir des études sur l'un ou l'autre côté du marché. Il y a plus de 100 projets de recherche en cours ou complétés qui utilisent l'EMTE.

Afin de mettre en place les conditions optimales à la croissance de l'économie axée sur la connaissance, les gouvernements doivent remanier les politiques en matière d'éducation, de formation, d'innovation, de réaménagement des effectifs, de pratiques en milieu de travail, de relations industrielles et de développement industriel. Les résultats de l'EMTE aideront à clarifier bon nombre de ces questions, ce qui facilitera l'établissement de politiques.

L'EMTE permet aux utilisateurs potentiels plusieurs innovations uniques dont la plus importante est le lien entre les évènements qui ont lieux dans un milieu de travail et les résultats pour les employés. Aussi, l'aspect longitudinal de l'enquête permettra une meilleure compréhension des changements dans le temps.

On utilise deux périodes de base pour l'EMTE. Les questions sur la répartition de l'emploi font appel à la dernière période de paie du mois de mars de l'année de référence, tandis que les autres questions renvoient à la période des 12 derniers mois ayant pris fin au mois de mars de l'année de référence.

Sujets

  • Avantages sociaux
  • Éducation et formation des adultes
  • Éducation, formation et apprentissage
  • Formation professionnelle et niveau de scolarité
  • Heures de travail et conditions de travail
  • Organisation du milieu de travail, innovation, rendement
  • Salaires, traitements et autres gains
  • Travail

Sources de données et méthodologie

Population cible

La population cible pour la composante "milieu de travail" de l'enquête est définie comme étant tous les emplacements opérant au Canada et qui ont des employés rémunérés au mois de mars, à l'exception des emplacements suivants :

a) emplacements au Yukon, au Nunavut et aux Territoires du Nord-Ouest ; et

b) emplacements opérant en cultures agricoles et élevage; pêche, chasse et piégeage; ménages privés, organismes religieux et administration publique.

La population cible pour la composante « employé » est constituée de tous les employés travaillant ou en congé payé en mars dans les milieux de travail sélectionnés et qui reçoivent un état supplémentaire T-4 de l'Agence du revenu du Canada. On comptera dans la base de sondage de l'EMTE une personne qui aura reçu un feuillet T4 de deux milieux de travail différents comme deux employés.

La population observée est le regroupement de toutes les unités pour lesquelles l'enquête peut réalistement fournir de l'information. Des difficultés d'opération nuisant à l'identification de toutes les unités qui appartiennent à la population cible peuvent entraîner des différences entre la population observée et la population cible.

L'échantillon pour l'EMTE est tiré du Registre des entreprises (RE), dont l'entretien est effectué par la Division du registre des entreprises de Statistique Canada, et de listes d'employés fournies par les employeurs enquêtés.

Le Registre des entreprises est une liste de toutes les entreprises au Canada. Une mise à jour du Registre est effectuée chaque mois, à l'aide de diverses enquêtes, de suivis auprès des grandes entreprises et de données administratives.

Élaboration de l'instrument

En 1994, des recherches sur la possibilité d'une approche intégrée pour la collecte et l'analyse des données sur les établissements et leurs employés ont été effectuées par la Division de l'analyse des entreprises et du marché du travail. Les résultats ont été présentés, un prétest a été financé et un groupe de travail de l'EMTE a été créé. Le groupe a consulté des experts tels que le groupe EKOS afin de déterminer les questions importantes en ce qui a trait à la recherche, puis un questionnaire a été élaboré.

Un prétest a été effectué auprès de 50 entreprises. Des consultations ont eu lieu avec un groupe consultatif du domaine spécialisé et, selon les résultats du prétest et les recommandations, des modifications ont été apportées au questionnaire.

Une enquête pilote a été menée. D'autres consultations ont eu lieu avec des experts, notamment le groupe consultatif du domaine spécialisé, Développement des ressources humaines Canada et le groupe EKOS, et selon leurs commentaires et leurs suggestions, d'autres changements ont été apportés au questionnaire. En outre, grâce à l'amélioration du profil Registre des entreprises, l'enquête a été simplifiée, passant d'un processus à trois volets à un processus à deux volets.

L'examen détaillé continu du questionnaire par les analystes du domaine spécialisé, les chercheurs et les intervieweurs permet d'aviser l'équipe de l'EMTE de toute autre modification nécessaire dans la formulation ou l'ordre des questions.

Échantillonnage

Il s'agit d'une enquête longitudinale par échantillon.

Description de la base de sondage
La base de sondage est une liste de toutes les unités et elle contient l'information pour contacter ces unités et également l'information sur la classification (par ex. , la classification industrielle) de ces unités. La liste est utilisée pour l'élaboration du plan d'échantillonnage et pour la sélection de l'échantillon; au bout du compte, la liste fournit l'information sur les contacts pour les unités sélectionnées.

Enquête sur le milieu de travail
La base de sondage pour la partie "milieu de travail" de l'EMTE est créée à partir de l'information disponible sur le Registre des entreprises de Statistique Canada.

Avant la sélection de l'échantillon, les emplacements de la base de sondage de l'EMTE sont stratifiés en groupes relativement homogènes. Ces groupes sont appelés strates et sont utilisés pour la répartition et la sélection de l'échantillon. La base de sondage de l'EMTE est stratifiée par secteur d'activité (14), région (6) et taille (3), qu'on a définie à l'aide d'une estimation du nombre d'emplois. Les limites des strates d'effectif (de taille) sont d'habitude différentes pour chaque combinaison secteur d'activité-région. Les limites d'inclusion d'une strate d'effectif particulière sont calculées à l'aide d'une méthode fondée sur un modèle. L'échantillon est sélectionné au moyen d'une répartition de Neyman. Ce processus donne 252 strates et 10 595 emplacements échantillonnés en 2001.

Un poids de sondage est assigné à chaque unité échantillonnée. Il s'agit d'un facteur d'expansion relié à chaque unité échantillonnée pour obtenir des estimés pour la population à partir d'un échantillon. Par exemple, si deux unités sont sélectionnées aléatoirement et avec une même probabilité à partir d'une population de dix unités, alors chaque unité sélectionnée représente cinq unités de la population et a un poids de cinq.

L'EMTE 2002 a donné lieu à la collecte de données auprès de 5 818 des 10 595 employeurs échantillonnés. Les autres employeurs avaient cessé leurs activités, étaient inactifs durant certaines saisons, étaient des sociétés de portefeuille ou étaient hors du champ de l'enquête. La plupart des non-répondants étaient des propriétaires-exploitants qui n'avaient pas de personnel rémunéré et qui possédaient un compte de retenues sur la paye.

On assure au fil du temps le suivi de l'échantillon initial choisi en 1999, qu'on enrichit à intervalles de deux ans d'un échantillon de nouveaux enquêtés choisi à partir des unités ajoutées au Registre des entreprises depuis le dernier cycle d'enquête. La stratification des unités demeure constante au cours de la durée de vie de l'échantillon initial (huit ans). Dans la mesure du possible, les mêmes fractions d'échantillonnage sont appliquées à tous les échantillons. Les fractions de l'échantillonnage sont parfois ajustées afin de contrebalancer l'érosion des strates ou de compenser les mouvements à la hausse ou à la baisse de l'économie. En 2001, elles ont été ajustées légèrement à la hausse, ce qui s'est traduit par un échantillon de nouveaux enquêtés de 1 792 emplacements.

Enquête sur les employés
La base de sondage pour la composante "employé" de l'EMTE est créée à partir des listes d'employés mises à la disposition des interviewers par les employeurs sélectionnés. Un maximum de vingt-quatre employés sont échantillonnés en utilisant un mécanisme probabiliste. Pour les milieux de travail de moins de quatre employés, tous les employés sont sélectionnés.

Taille de l'échantillon - Employeur
1999 - 6 322
2000 - 6 068
2001 - 6 223
2002 -- 5 818

Taille de l'échantillon - Employé
1999 - 23 540
2000 - 20 167
2001 - 20 377
2002 -- 16 813

On ne suivra les employés que durant deux ans parce qu'il est difficile d'intégrer de nouveaux employeurs à l'échantillon tandis que les travailleurs changent de compagnie. On prélèvera donc de nouveaux échantillons d'employés à chaque deuxième cycle de l'enquête (premier, troisième, cinquième, etc.).

Sources des données

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants.

La collecte des données, la saisie des données, les vérifications préliminaires et le suivi des non-répondants sont tous effectués dans les bureaux régionaux de Statistique Canada. En 1999, on a collecté des données sur les milieux de travail au moyen d'interviews sur place. À partir de l'an 2000, on mène des interviews téléphoniques assistées par ordinateur. Il faut plus d'une personne-ressource pour environ 20 % des unités sondées (surtout de gros milieux de travail).

Pour la composante auprès des employés, on mène des interviews téléphoniques auprès de gens qui avaient accepté de participer à l'enquête en remplissant et en postant un formulaire sur la participation des employés.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

Une collecte de données ITAO réduit largement le nombre d'erreurs de réponse et d'erreurs typographiques. Le système prévoit une validation des données de base et une vérification des relations connues (il faut, par exemple, que l'addition de l'emploi à plein temps et de l'emploi à temps partiel ne dépasse pas l'emploi global). Pour détecter les erreurs qui auraient échappé à l'application ITAO, on soumet les réponses douteuses à une microanalyse et à une macroanalyse afin de sauvegarder la cohérence des données.

Imputation

On applique des méthodes transversales d'imputation aux non-réponses à des questions dans le cas des unités qui apparaissent pour la première fois à l'intérieur de chaque cycle. On applique des méthodes longitudinales d'imputation aux non-réponses aux questions d'un cycle si l'on dispose de données chronologiques ou aux non-réponses des unités qui se trouvent dans l'échantillon depuis plus d'un an. En l'absence d'information préalable, on traite toutes les non-réponses en modifiant les pondérations des répondants. Cette méthode suppose que les non-réponses sont entièrement le fait du hasard.

Quatre méthodes d'imputation sont présentement utilisées pour le premier cycle de la portion employeurs de l'EMTE : l'imputation déterministe, l'imputation par répartition, l'imputation par ratio et l'imputation hot deck pondérée. On utilise l'imputation déterministe quand on peut déduire uniquement un seul champ manquant à partir de l'information fournie. Si une composante d'une somme est manquante et si l'on dispose des autres composantes incluant la somme, par exemple, on peut alors déterminer la composante manquante.

On applique l'imputation par répartition lorsqu'on demande aux répondants de fournir un total et sa décomposition en plusieurs catégories dans les cas où il manque deux catégories ou plus. On calcule la répartition des catégories au macro-niveau et on l'applique au micro-niveau. Pour illustrer cette méthode, supposons qu'un répondant nous a donné l'emploi total, mais n'a pas été en mesure d'en fournir une ventilation par groupe professionnel. Nous appliquerions la répartition des groupes professionnels calculée au niveau industrie/taille au chiffre sur l'emploi total afin d'imputer les champs manquants.

L'imputation par ratio est principalement utilisée pour des variables continues. La valeur manquante est remplacée par la valeur ajustée d'une variable auxiliaire d'un donneur choisi de façon aléatoire d'une classe d'imputation. Habituellement, l'ajustement est la somme de tous les donneurs de la variable manquante divisée par la somme de la variable auxiliaire.
Dans le cas de la méthode hot deck pondérée, on impute un champ manquant à l'aide de la réponse d'un donneur approprié. On sélectionne au hasard le donneur, la probabilité de sélection étant égale au ratio de son poids divisé par la somme des poids de toutes les unités contenues dans la classe d'imputation transversale correspondante. On a adopté la méthode hot deck pondérée pour les quatre raisons suivantes. La méthode est facile à appliquer. Elle donne approximativement p estimations ponctuelles non biaisées ou sans biais par rapport au plan (Rao, 1996). On peut construire un estimateur cohérent de la variance quand on dispose de données imputées (Rao, 1996, également). Finalement, le nombre d'ajustements postérieurs à l'imputation destinés à maintenir la cohérence interne des données reste à un niveau minimal puisque la plupart des questions sont indépendantes.

On impute les données manquantes sur le questionnaire destiné aux employés à l'aide des méthodes déterministe et hot deck pondérée. Pour éviter de produire des incohérences à l'intérieur des données, la plupart des champs interdépendants sont imputés sous forme de bloc. Puisque plusieurs questions font partie de cette catégorie, un système post imputation a été élaboré pour conserver les relations entre les champs.

Estimation

Les valeurs déclarées (ou imputées) pour chaque milieu de travail et chaque employé dans l'échantillon sont multipliées par la pondération qui leur est assigné et ces valeurs pondérées sont additionnées pour produire des estimés. Une pondération initiale égale à l'inverse de la probabilité de sélection originale est assignée à chaque entité. Pour calculer des estimés de la variance, les pondérations de sondage initiales sont ajustées pour forcer les totaux estimés pour chaque groupe ''secteur d'activité / région'' à correspondre avec les totaux connus de la population. Ces pondérations ajustées sont ensuite utilisées pour calculer des estimés de moyennes ou de totaux pour différentes variables recueillies lors de l'enquête.

Les variables pour lesquelles les totaux de la population sont connus sont appelées variables auxiliaires. Elles servent à calibrer les estimés de l'enquête pour améliorer leur précision. Chaque emplacement était calibré aux totaux connus dans chaque groupe secteur d'activité / région. La variable auxiliaire utilisée pour l'EMTE est le nombre total d'employés, obtenue à partir de l'Enquête sur l'emploi, la rémunération et les heures.

Les estimés sont calculés pour plusieurs domaines d'intérêt tels que le secteur d'activité et la région.

Une description détaillée de la méthode estimation se trouve dans le documents ci-joint.

Évaluation de la qualité

Pour valider les estimations de grandes variables financières comme celles des revenus et des dépenses, on a fait des comparaisons avec l'Enquête unifiée auprès des entreprises, l'Enquête annuelle sur le commerce de gros et de détail et le Recensement des manufactures. On a puisé d'autres sources de données comme PALE pour évaluer le degré de couverture et les taux de mortalité. Pour le volet « employés », la comparaison s'est faite avec les données salariales recueillies dans le cadre de l'Enquête sur la dynamique du travail et du revenu et de l'Enquête sur la population active. D'autres variables ont été examinées. Le gros de cette activité de vérification de données a eu lieu pendant la révision du cycle de 1999. Depuis lors, on effectue une validation et un contrôle rigoureux de chaque année de l'enquête pour être sûr d'avoir des données de qualité suffisante.

Contrôle de la divulgation

La Loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler de l'information obtenue en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable sans que cette personne, entreprise ou organisation le sache ou y consente par écrit. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

La diffusion des données du volet « milieux de travail » de l'EMTE au profit des Centres de données de recherches a été la première occasion de mettre les données des entreprises à la disposition des gens à l'extérieur de Statistique Canada. Bien que tous les utilisateurs extérieurs des données EMTE se soient engagés en prêtant serment à sauvegarder la confidentialité des dossiers, nous prenons d'autres mesures pour prévenir la divulgation. Tous les éléments évidents d'identification des milieux de travail sont retranchés des dossiers. On enlève aussi un certain nombre de répondants importants ou uniques. Cette procédure s'applique en deux étapes.

En première étape, on attribue un rang moyen à un enregistrement en fonction de son apport aux estimations de totaux pour un certain nombre de variables clés. On analyse les cinq premiers enregistrements de chaque industrie pour jauger les probabilités d'identification. En seconde étape, on applique une technique multidimensionnelle d'analyse en composantes principales qui permet de ramener les données à trois dimensions au plus -- ce sont les composantes principales -- de manière à préserver les caractéristiques des données d'origine. On regarde tout enregistrement qui, en composantes principales, se distingue nettement du reste des observations. On peut aussi procéder à vue en mettant en rotation une représentation tridimensionnelle des composantes afin d'identifier les unités qui se situent en dehors du principal nuage de données. Les enregistrements jugés uniques à cette étape sont combinés à ceux de la première étape et supprimés. On revoit les suppressions tous les deux ans au moment de compléter l'échantillon.

La confidentialité du volet « employés » pose moins un problème, car la pondération d'échantillonnage tend à masquer l'identité des répondants. À noter que les employés des milieux de travail supprimés sont compris dans cette suppression.

Les données présentées dans nos publications sont vérifiées afin de s'assurer qu'elles respectent le caractère confidentiel des réponses fournies par les entreprises. Toute estimations agrégées de l'emploi susceptible de révéler une information propre à un répondant particulier est déclarée confidentielle et n'est donc pas publiée.

Exactitude des données

Bien que des efforts considérables soient faits pour assurer un haut standard de qualité à travers toutes les étapes de l'enquête, les estimations sont inévitablement entachées d'une certaine marge d'erreur. Cela vaut pour toutes les enquêtes. L'erreur totale dans l'enquête se divise en deux grandes composantes : l'erreur d'échantillonnage et les erreurs non dues à l'échantillonnage. L'erreur d'échantillonnage vient de ce que les estimations sont établies uniquement à partir d'un échantillon de l'ensemble de la population plutôt que d'un recensement intégral, tandis que les erreurs non dues à l'échantillonnage viennent de toutes les autres causes, comme l'imperfection de la base de sondage, les erreurs de mesure ou la non-réponse. Par exemple, les erreurs de mesure peuvent venir d'erreurs commises par les répondants ou les intervieweurs à l'étape de la collecte des données, d'erreurs commises pendant la saisie au clavier, ou d'autres sources. Ce type d'erreur peut être à l'origine de l'imputation de valeurs cohérentes mais pas nécessairement correctes.

On a conçu l'échantillon EMTE pour pouvoir estimer les totaux avec efficacité au niveau industrie-région-taille compte tenu du budget disponible. Les coefficients de variation projetés -- qui sont une mesure de la qualité (des valeurs plus basses conviennent mieux) -- étaient d'environ 5 % pour l'industrie et de 10 % pour l'industrie par région dans le cas des variables en étroite corrélation avec l'emploi. Lorsqu'on produit des estimations, on les met en comparaison selon ce qu'on prévoit comme précision. Dans une proportion approximative de 60 %, les estimations de totaux excédaient ce qui était prévu et, dans une autre proportion de 25 %, se situaient en deçà de la valeur limite de 33 % pour le critère de « publiabilité » à Statistique Canada. La proportion restante (15 %) n'était pas publiable suivant les normes. Il s'agissait en majeure partie d'estimations qui n'étaient pas en étroite corrélation avec l'emploi. Toutes les estimations appartenant à la catégorie « non publiable » ont fait l'objet d'une validation. Toute estimation possédant un cv entre 25 à 33 % est annotée d'un avertissement indiquant une estimation dont le taux de variabilité est relativement élevé.

La mesure de l'erreur due à la non-réponse et le coefficient de variation doivent être considérés simultanément pour avoir un aperçu de la qualité des estimés. Plus le coefficient de variation est petit et plus la fraction de réponse est élevée, meilleur est l'estimé publié.

Taux de réponse pour 2002 :

Employeurs - 84,0
Employés -- 90.9

Documentation

Date de modification :