Enquête sur la santé dans les collectivités canadiennes (ESCC)

Statut :
Active
Fréquence :
Biennale
Numéro d'enregistrement :
3226

L'objectif principal de l'Enquête sur la santé dans les collectivités canadiennes (ESCC) est la collecte de données dans le domaine de la santé, à des niveaux géographiques infraprovinciaux (régions sociosanitaires ou régions sociosanitaires regroupées).

Information détaillée pour 2000-2001 (cycle 1.1)

Date de la parution - 8 mai 2002

Aperçu

En 1991, le Groupe de travail national sur l'information en matière de santé a relevé plusieurs questions et problèmes posés par le système d'information sur la santé. Pour résoudre ces problèmes, l'Institut canadien d'information sur la santé (ICIS), Statistique Canada et Santé Canada ont conjugué leurs efforts en vue de créer un Carnet de route de l'information sur la santé. L'Enquête sur la santé dans les collectivités canadiennes (ESCC) a été conçue à partir de ce mandat.

L'ESCC est une enquête transversale qui vise à recueillir des renseignements sur l'état de santé, l'utilisation des services de santé et les déterminants de la santé de la population canadienne. Elle est réalisée auprès d'un grand échantillon de répondants et conçue pour fournir des estimations fiables à l'échelle de la région sociosanitaire. L'enquête poursuit les objectifs suivants :

- Soutenir les programmes de surveillance en santé en produisant des données sur la santé à l'échelle nationale, provinciale et infraprovinciale;
- Offrir une source unique de renseignements pour la recherche sur la santé de petites populations et sur des caractéristiques rares;
- Diffuser de l'information facilement accessible à une communauté diversifiée d'utilisateurs dans un temps opportun;
- Proposer un instrument d'enquête flexible qui inclut une option de réponse rapide pour répondre à des questions émergentes liées à la santé de la population.

Avant 2007, la collecte de données était effectuée à chaque 2 ans sur une période annuelle. Des données sont disponibles pour les périodes de 2001, 2003 et 2005. En 2007, des changements importants ont été apportés à la conception de l'enquête. Ces changements ont été proposés de manière à augmenter l'efficacité et la flexibilité de l'enquête par une collecte des données sur une base continue. Les données sont maintenant recueillies à chaque année, plutôt que chaque deux ans comme c'était le cas avant 2007.

L'enquête comporte quatre composantes de contenu : le contenu de base, le contenu thématique, le contenu optionnel et le contenu de réponse rapide. Le contenu de base est recueilli auprès de tous les répondants de l'enquête et demeurera relativement inchangé pendant plusieurs années. Le contenu thématique, également recueilli auprès de l'ensemble de l'échantillon, varie d'une année à l'autre. Le contenu optionnel vise à remplir les besoins en données à l'échelle de la région sociosanitaire. Ce contenu, souvent harmonisé à l'échelle provinciale, est unique à chaque région ou province et peut varier d'une année à l'autre. Finalement, la composante de réponse rapide est offerte aux organisations désirant obtenir des estimations nationales sur un sujet émergent ou particulier lié à la santé de la population. Le contenu de réponse rapide peut être introduit dans l'enquête à chaque période de collecte, soit à chaque période de deux mois.

L'ESCC produit un fichier annuel de microdonnées ainsi qu'un fichier combinant deux années de données.à la fois. Le prochain fichier de deux ans englobera les données de 2007 et 2008 et sera diffusé à l'été 2009. Les années de collecte de l'ESCC peuvent aussi être combinées par les utilisateurs pour procéder à l'étude de populations ou caractéristiques rares.

L'utilisation principale des données de l'ESCC comprend la surveillance et la recherche sur la santé de la population. Les ministères fédéraux et provinciaux de la santé et des ressources humaines, les organismes de services sociaux et autres agences gouvernementales utilisent l'information recueillie auprès des répondants afin de surveiller, planifier, implémenter et évaluer des programmes pour améliorer la santé des Canadiens et l'efficacité des services de santé. Les organisations à but non lucratif et les chercheurs du milieu académique utilisent l'information afin de faire avancer la recherche et améliorer la santé.

Période de référence :
Varie selon la question (par exemple: <"durant les 12 derniers mois", "durant les 6 derniers mois", durant la dernière semaine", etc.)
Période de collecte :
Janvier à décembre

Sujets

  • Maladies et état de santé
  • Mode de vie et conditions sociales
  • Prévention et détection de la maladie
  • Santé

Sources de données et méthodologie

Population cible

L'ESCC vise la population âgée de 12 ans et plus vivant dans les dix provinces et les trois territoires. Sont exclus du champ de l'enquête les personnes vivant dans les réserves et autres peuplements autochtones des provinces, les membres à temps plein des Forces canadiennes, la population vivant en établissement et les personnes vivant dans les régions sociosanitaires : Région du Nunavik et Région des Terres-Cries-de-la-Baie-James au Québec. Au Nunavut, la couverture se limite aux 10 plus grandes communautés*, représentant environ 70 % de la population du Nunavut. En tout, ces exclusions représentent moins de 3 % de la population cible.

*Les 10 plus grandes communautés au Nunavut sont : Iqaluit, Rankin Inlet, Cambridge Bay, Kugluktuk, Cape Dorset, Pangnirtung, Igloolik, Pond Inlet, Baker Lake et Arviat.

L'ESCC vise la population âgée de 12 ans et plus vivant dans les dix provinces et les trois territoires. Sont exclus du champ de l'enquête les personnes vivant dans les réserves et autres peuplements autochtones des provinces, les membres à temps plein des Forces canadiennes, la population vivant en établissement et les personnes vivant dans les régions sociosanitaires : Région du Nunavik et Région des Terres-Cries-de-la-Baie-James au Québec. En tout, ces exclusions représentent moins de 3 % de la population cible.

La base de sondage de l'ESCC couvrait 92 % de la population ciblée au Yukon, 96 % de celle des Territoires du Nord-Ouest et 92 % de celle du Nunavut. Au Nunavut, à compter de 2013, la couverture a été élargie pour représenter 92 % de la population ciblée. Avant 2013, la couverture était seulement de 71 %, l'enquête ne couvrant que les 10 plus grandes communautés.

Élaboration de l'instrument

Les questionnaires de chacun des cycles de l'ESCC ont tous été conçus en collaboration avec des spécialistes provenant de Statistique Canada, d'autres ministères et/ou du milieu académique. Les questions de l'ESCC ont été conçues pour être posées selon la méthode d'interview assistée par ordinateur (IAO), ce qui veut dire que l'ordre logique des questions a été programmé à mesure que celles-ci ont été élaborées. On a notamment spécifié le genre de réponse voulue, les valeurs minimales et maximales, les vérifications en ligne liées aux questions et la suite à donner en cas de non-réponse.

L'IAO permet de contrôler l'interview d'après les déclarations du répondant. Lorsqu'une réponse invalide est saisie un message s'affiche à l'écran, ce qui permet au répondant et/ou à l'intervieweur d'obtenir un retour d'information immédiat pour corriger les incohérences. L'ajout automatique de la période de référence d'après la date du jour est un autre exemple d'amélioration. Il est possible de pré-insérer du texte ou des données selon les renseignements recueillis durant l'interview, ce qui permet à l'intervieweur de continuer son travail sans devoir revenir en arrière pour trouver des réponses antérieures. Cette possibilité permet notamment d'insérer le nom du répondant ou de faire les accords en genre à l'intérieur même des questions. Il est également possible de programmer des intervalles ou des réponses acceptables d'après les données recueillies durant l'interview. En d'autres termes, le questionnaire peut être adapté au répondant selon les données recueillies au moment de l'interview ou durant une interview précédente.

Deux essais sur le terrain sont effectués. Les bureaux régionaux de Statistique Canada ont participé à ces essais. Les interviews ont été menées par des intervieweurs expérimentés de l'Enquête sur la population active. Ces deux essais visaient principalement à observer les réactions des répondants, à estimer la durée des diverses sections du questionnaire, à déterminer les taux de réponse et à évaluer les questions avec rétroaction. Les opérations et les procédures sur le terrain, la formation des intervieweurs et l'application informatique de collecte de donnée ont aussi été soumis à des essais. En plus des essais sur le terrain, l'application informatique de collecte des données a été soumise à des essais à grande échelle à l'interne pour repérer toute erreur dans le cheminement du programme ou dans le texte. La mise à l'essai de l'application s'est poursuivie de façon continue jusqu'au début de l'enquête principale.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

Afin de produire des estimations fiables pour les 136 régions sociosanitaires (RSS) il a été établi que l'enquête devrait être réalisée auprès d'un échantillon de 133 300 personnes. La stratégie de répartition de l'échantillon, qui comporte trois étapes, accorde une importance plus ou moins égale aux RSS et aux provinces. Lors des deux premières étapes, l'échantillon a été réparti entre les provinces en fonction de leur compte de population et du nombre de RSS qu'elles contiennent. À la troisième étape, chaque échantillon provincial a été réparti entre les RSS proportionnellement à la racine carrée de la population estimée de la RSS.

Cette stratégie en trois étapes permet d'obtenir un échantillon suffisant pour chaque RSS, sans perturber considérablement la répartition interprovinciale de l'échantillon. L'effectif des échantillons a été augmenté avant la collecte des données afin de tenir compte des logements hors du champ de l'enquête ou vacants, et du taux prévu de non réponse.

L'échantillon de ménages du a été sélectionné à partir de trois bases de sondage. La majorité de l'échantillon (83 %) provient d'une base de sondage aréolaire. Pour certaines RSS, on a utilisé une base de sondage à composition aléatoire (CA) et/ou une base liste de numéros de téléphone. Environ 7 % de l'échantillon de ménages provenait de la base de sondage à CA et presque 10 %, de la base liste de numéros de téléphone.

La base aréolaire conçue pour l'Enquête sur la population active (EPA) du Canada a servi de base de sondage principale pour l'ESCC. Le plan d'échantillonnage de l'EPA est un plan d'échantillonnage en grappes stratifié à plusieurs degrés où le logement représente l'unité finale d'échantillonnage. À la première étape, on a formé des strates homogènes et sélectionné un échantillon indépendant de grappes, dans chaque strate. À la deuxième étape, on a dressé la liste des logements pour chaque grappe, puis on a sélectionné les logements, ou les ménages, d'après les listes.

Pour les besoins du plan d'échantillonnage, chaque province est répartie en trois catégories de région, à savoir les grands centres urbains, les villes et les régions rurales. Des strates géographiques ou socioéconomiques sont formées à l'intérieur de chaque grand centre urbain. Dans les strates, des grappes sont formées par regroupement de 150 à 250 logements. Dans certains centres urbains, des strates distinctes sont créées pour les immeubles à appartements ou les secteurs de dénombrement (SD) pour lesquels le revenu moyen du ménage est élevé. Dans chaque strate, on sélectionne six grappes ou immeubles résidentiels (pouvant compter de 12 à 18 appartements) par une méthode d'échantillonnage aléatoire avec probabilité proportionnelle à la taille (PPT), cette dernière correspondant au nombre de ménages. Le nombre 6 est utilisé pour l'ensemble du plan d'échantillonnage afin de permettre le renouvellement mensuel d'un sixième de l'échantillon de l'EPA.

Les autres villes et régions rurales de chaque province sont stratifiées, en premier lieu, en fonction de données géographiques, puis selon les caractéristiques socioéconomiques. Dans la plupart des strates, on sélectionne six grappes (habituellement des SD) par la méthode PPT. Pour les strates où la densité de population est faible, on suit un plan en trois étapes en vertu duquel on sélectionne deux ou trois unités primaires d'échantillonnage (UPE), qui correspondent normalement à des groupes de SD, puis on les répartit en grappes dont six sont sélectionnées pour faire partie de l'échantillon. La sélection est réalisée à chaque étape selon la méthode PPT.

Sources des données

Collecte des données pour cette période de référence : 1er septembre 2000 à 3 novembre 2001

Il s'agit d'une enquête à participation volontaire.

Les données sont obtenues directement auprès des répondants.

Le questionnaire de l' ESCC a fait l'objet d'interviews assistées par ordinateur (IAO). Des unités d'échantillonnage sélectionnées à partir de la base aréolaire ont répondu aux questions suivant la méthode d'interview en personne assistée par ordinateur (IPAO) tandis que les autres unités, sélectionnées à partir des bases de sondage téléphoniques, ont répondu aux questions suivant la méthode de l'interview téléphonique assistée par ordinateur (ITAO).

L'IAO procure un certain nombre d'avantages quant à la qualité des données par rapport aux autres méthodes de collecte. Premièrement, le libellé des questions, comprenant les périodes de référence et les pronoms, est personnalisé automatiquement en fonction de facteurs comme l'âge et le sexe du répondant, de la date de l'interview et des réponses aux questions précédentes.

En second lieu, on applique des mesures de contrôle qui isolent les réponses incohérentes ou hors normes, et des prompteurs apparaissent à l'écran lorsqu'une entrée incorrecte est enregistrée. Le répondant reçoit une rétroaction immédiate et l'intervieweur peut corriger toute incohérence.

Troisièmement, le processus permet de sauter automatiquement les questions qui ne concernent pas le répondant.

Les intervieweurs IPAO travaillaient séparément depuis leur domicile à l'aide d'un ordinateur portatif et étaient supervisés à distance par des intervieweurs principaux. Les interviews complétées étaient envoyées quotidiennement de leur domicile au bureau central de Statistique Canada, et ce, par transmission téléphonique protégée.

Les intervieweurs ITAO travaillaient dans des bureaux centralisés sous la supervision d'un intervieweur principal. Il incombait au surveillant de projet du bureau régional, à l'intervieweur principal et à l'équipe d'assistance technique de transmettre les dossiers de chacun des cinq bureaux ITAO au bureau central.

On ne pouvait compter, pour la collecte par ITAO, sur un ordonnanceur d'appels automatique, c'est-à-dire un système central qui optimise l'agencement des rappels et l'ordonnancement des rendez-vous. Au lieu, un lot de cas était distribué au début de chaque mois à chaque ordinateur de tous les bureaux ITAO. Le nombre de cas attribués à chaque ordinateur faisait alors l'objet d'un traitement manuel. À cause du nombre relativement restreint de cas réservés à l'ITAO, cette démarche s'est révélée raisonnablement efficace et l'absence d'un ordonnanceur d'appels ne semble pas avoir eu d'effet nuisible sur la qualité des données.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

La vérification des données est exécutée en partie par l'application d'interview assistée par ordinateur (IAO) durant la collecte des données. Il est impossible que les intervieweurs saisissent des valeurs situées en dehors de la fourchette permise et qu'ils commettent des erreurs d'enchaînement, car celui-ci était contrôlé par le système programmé de sauts de question (commandes « passez à ») de l'IAO. Par exemple, l'IAO fait en sorte que les questions qui ne s'appliquent pas au répondant ne soient pas posées. Dans le cas de certains types de déclarations non cohérentes ou inhabituelles, l'application affiche des messages d'avertissement.

Plusieurs vérifications sont effectuées au Bureau central lors de l'étape du traitement des données. Une vérification des erreurs critiques provoquant le rejet d'enregistrements de répondants (par exemple, dans les cas de population hors cible) est réalisée. Les cheminements de question sont aussi ajustés au cours du traitement et un programme de détection et de correction des incohérences entre les données sont appliqués. Des comparaisons entre les fréquences obtenues au cours de la période courante et celles obtenues lors de périodes de référence antérieures sont également effectuées dans le but d'identifier des erreurs avant la diffusion.

Imputation

À cause de leur caractère privé ou délicat, de nombreuses questions ou modules du questionnaire du cycle 1.1 de l'ESCC ne se prêtaient qu'à des réponses personnelles et étaient sautées lorsque l'interview était effectuée par procuration. Au cours de la collecte des données, une plus grande proportion que prévue d'interviews a été faite par procuration. Il n'était permis de recourir à ces interviews par procuration qu'après confirmation que le répondant sélectionné ne serait pas disponible au cours de la période de collecte, en cas d'incapacité mentale ou physique, ou lorsqu'il y avait barrière de langue. À la fin de la collecte des données, 6,3 % des interviews avaient été complétées par procuration; le taux variait entre 2 % et 23 % dans les régions sociosanitaires. Si bien qu'il manquait des renseignements importants sur les personnes représentées, ce qui valait pour le tiers, environ, du questionnaire. On a dû sauter dix modules communs du questionnaire entièrement, et deux partiellement, de même que 21 des modules optionnels.

Par conséquent, des valeurs ont été imputées par la méthode du « plus proche voisin » à l'étape du traitement des données pour remplacer les renseignements non recueillis durant les interviews par procuration. L'imputation n'a été utilisée que pour compléter les renseignements recueillis sur les personnes pour lesquelles l'interview avait été réalisée par procuration. Elle n'a pas été utilisée en cas de non-réponse totale ou partielle lors des interviews réalisées auprès de la personne sélectionnée proprement dite. En vertu de cette méthode, on a recherché, dans des catégories d'imputation prédéfinies, un répondant « donneur » dont les caractéristiques étaient semblables (le plus proche voisin) à celles de la personne pour laquelle les renseignements avaient été recueillis par procuration; puis, on a imputé à cette dernière les valeurs recueillies pour le « donneur ». On a trouvé le plus proche voisin à l'aide d'une fonction de distance précise qui utilisait des renseignements pertinents disponibles et sur le répondant par procuration et sur le répondant « donneur ». Là où on ne pouvait assurer la qualité des données par imputation, on a attribué le code manquant aux réponses.

Voici les modules entièrement imputés :

. La tension artérielle
. Les visites chez le dentiste
. Les examens de la vue
. Le contact avec des professionnels de la santé mentale
. La dépendance à l'alcool
. La conduite en état d'ébriété
. Le soutien social
. La dépression
. Les pensées suicidaires et les tentatives de suicide
. Les comportements sexuels
. La consommation de fruits et de légumes

Voici les modules partiellement imputés :
.
. Le test de Papanicolaou (PAPA_ 020 seulement)
. Le test de dépistage de l'antigène prostatique (PSAA_170 seulement)
. La mammographie (MAMA_30, MAMA_37 et MAMA_38)
. La vaccination anti-grippale (FLUA_160 seulement)
. L'examen des seins (BRXA_110 seulement)
. L'auto-examen des seins (BSXA_120 seulement)
- La taille et le poids (HWTA_4 seulement)

Voici les modules, sautés durant l'interview par procuration, qui n'ont pas été imputés :

. L'examen médical complet
. Les aides au renoncement au tabac
. L'état général de santé
. L'estime de soi
. La maîtrise de soi
. La spiritualité
. L'humeur
. La détresse
. Le stress au travail
. Les activités physiques
. Les activités sédentaires
. L'utilisation d'équipement de protection
. Les changements effectués pour améliorer la santé
. L'allaitement naturel
. La satisfaction du patient

Estimation

Le principe sur lequel s'appuie l'estimation dans le cas d'un échantillon probabiliste tel que celui de l'ESCC veut que, outre elle-même, chaque personne faisant partie de l'échantillon en « représente » plusieurs autres qui ne font pas partie de l'échantillon. Par exemple, dans un échantillon aléatoire simple au 1/50 (2 %) de la population, chaque personne représente 50 membres de la population. Conformément à la terminologie utilisée ici, chaque personne a un coefficient de pondération (ou poids) de 50. La phase de pondération est l'étape où l'on calcule ce poids d'échantillonnage pour chaque personne. Le poids doit être utilisé pour produire des estimations représentatives d'après les données de l'enquête. Par exemple, si l'on veut estimer le nombre de personnes qui ont vécu un épisode dépressif majeur, on additionne les poids des répondants à l'enquête qui présentent cette caractéristique. Afin que les estimations produites à partir des données d'enquête soient représentatives de la population couverte et non seulement de l'échantillon lui-même, il est primordial que les utilisateurs incorporent les poids dans les calculs.

Afin de déterminer la qualité de l'estimation, la variance doit être calculée. Étant donné que l'ESCC utilise un plan de sondage à plusieurs degrés, il n'existe pas de formule simple pour calculer les estimations de la variance. Par conséquent, il est nécessaire d'utiliser une méthode approximative. Le coefficient de variation, l'écart type et les intervalles de confiance peuvent ensuite être calculés à partir de la variance. La méthode de ré-échantillonnage bootstrap utilisée pour l'ESCC sous-tend la sélection d'échantillons aléatoires simples, appelés les échantillons répétés, et le calcul de l'écart entre les estimations d'un échantillon répété à l'autre. Dans chaque strate, on sélectionne un échantillon aléatoire simple de (n-1) des n grappes avec remise pour former un échantillon répété. Il est à noter que puisque la sélection se fait avec remplacement, une grappe peut être choisie plus d'une fois. Pour chaque échantillon répété, on recalcule le poids de sondage de chaque enregistrement dans les grappes (n-1) sélectionnées. Ces poids sont par la suite post-stratifiés en fonction de l'information démographique de la même façon que les pondérations du plan de sondage, ce qui permet d'obtenir les poids bootstrap finaux. Le processus complet (sélectionner les échantillons aléatoires simples, recalculer et post-stratifier les poids de chaque strate) est répété B fois, B prenant une grande valeur. En général, on utilise B=500 pour l'ESCC afin de produire 500 poids bootstrap. Pour obtenir l'estimateur bootstrap de la variance, on doit calculer l'estimation ponctuelle de chacun des B échantillons. L'écart type de ces estimations représente l'estimateur bootstrap de la variance. Statistique Canada a élaboré un programme qui peut effectuer tous ces calculs pour l'utilisateur : le programme Bootvar.

Évaluation de la qualité

La conception de l'enquête exerce une influence profonde sur ses objectifs, énumérés sous la rubrique « Description de l'enquête ». Pour atteindre ces objectifs, un Comité directeur et un Conseil consultatif composés de responsables des ministères provinciaux et territoriaux de la Santé, de l'Institut canadien d'information sur la santé et de Santé Canada ont fixé les concepts et les centres d'intérêt. Ils ont réuni des groupes d'experts pour les conseiller sur les mesures à prendre afin d'obtenir les résultats envisagés et pour leur recommander des instruments de collecte et des indices éprouvés. Les données qui en résultent sont reconnues comme mesures valables de concepts contemporains tels que la dépression, la limitation de l'activité, les problèmes de poids et la douleur chronique.

Les bases de sondage servant à tirer l'échantillon, l'Enquête sur la population active, ITAO et les listes de numéros de téléphone, ont été combinées à des méthodologies de plan d'échantillonnage vérifiées, utilisées à plusieurs reprises et ayant fait la preuve de la qualité de leurs résultats. Le grand échantillon de chaque province et territoire contribue à la garantie de résultats exacts et significatifs.

Un taux de réponse élevé est essentiel à la qualité des données. On a pris des mesures pour réduire au minimum les erreurs non dues à l'échantillonnage. Pour réduire le nombre de cas de non-réponse, les intervieweurs de Statistique Canada reçoivent une formation intensive, disposent de manuels détaillés et travaillent sous la direction de superviseurs. L'ampleur de la non-réponse varie de non-réponse partielle (le fait de ne pas répondre à une ou plusieurs questions) à une non-réponse totale. Il n'y a presque pas eu de non-réponse partielle car une fois le questionnaire débuté les répondants avaient tendance à le terminer. Dans la plupart des cas, la non-réponse partielle à l'enquête était attribuable au fait que le répondant ne comprenait pas une question ou l'interprétait mal, refusait d'y répondre, ne se souvenait pas de l'information demandée ou n'était pas en mesure de fournir de l'information sur lui-même ou sur la personne pour laquelle il fournissait une réponse par procuration. Il y a eu non-réponse totale lorsqu'il était impossible de dépister le répondant, qu'aucun membre du ménage ne pouvait fournir les renseignements voulus ou que le répondant refusait de participer à l'enquête. On a traité les cas de non-réponse totale en corrigeant les poids des personnes qui ont répondu à l'enquête afin de compenser pour ceux qui n'ont pas répondu. Les personnes qui ont refusé de répondre ont fait l'objet d'un suivi par un intervieweur principal, un superviseur de projet ou un autre intervieweur en vue de les encourager à participer à l'enquête. En outre, pour maximiser le taux de réponse, les cas de non réponse ont également fait l'objet d'un suivi lors des cycles de collecte subséquents.

Contrôle de la divulgation

Des Fichiers de microdonnées à grande diffusion (FMGD) ont été produits en plus des fichiers maîtres. Les FMGD diffèrent des fichiers maîtres détenus par Statistique Canada en de nombreux points. Ces différences sont le résultat d'actions prises afin de protéger l'anonymat des répondants individuels aux enquêtes. Premièrement, seules les données transversales sont disponibles sur de tels fichiers, car l'information longitudinale permet d'identifier des répondants. Aussi, quelques variables sensibles ont été regroupées, maximisées ou complètement enlevées des fichiers. Les utilisateurs devant avoir accès à l'information exclue des fichiers de microdonnées peuvent acheter des totalisations spéciales, ou accéder aux fichiers maîtres par l'entremise du programme des Centres de données de recherche ou par le programme de télé-accès. Les résultats sont vérifiés pour respecter la confidentialité avant d'être fournis aux utilisateurs.

Avant de diffuser et/ou de publier des estimations tirées de ces fichiers de microdonnées, les utilisateurs doivent d'abord déterminer le nombre de répondants qui ont fourni les données entrant dans le calcul de l'estimation. Si ce nombre est inférieur à 30, l'estimation pondérée ne doit pas être diffusée, quelle que soit la valeur de son coefficient de variation. Pour les estimations pondérées basées sur des échantillons composés de 30 répondants ou plus, les utilisateurs doivent calculer le coefficient de variation de l'estimation arrondie et suivre les lignes directrices ci-après.

Les estimations qui figurent dans le corps d'un tableau statistique doivent être arrondies à la centaine près selon la méthode d'arrondissement classique. Si le premier ou le seul chiffre à supprimer se situe entre zéro et quatre, le dernier chiffre qu'on garde ne change pas. Si le premier ou le seul chiffre à supprimer se situe entre cinq et neuf, on augmente d'une unité la valeur du dernier chiffre à garder. Les totaux partiels marginaux et les totaux marginaux des tableaux statistiques doivent être calculés d'après leurs éléments correspondants non arrondis, puis arrondis à leur tour à la centaine près selon la méthode d'arrondissement classique. Les moyennes, les proportions, les taux et les pourcentages doivent être calculés à partir d'éléments non arrondis (par exemple les numérateurs ou les dénominateurs), puis arrondis à une décimale près selon la méthode d'arrondissement classique. Pour arrondir à un seul chiffre selon cette méthode classique, si le dernier ou le seul chiffre à supprimer se situe entre zéro et quatre, le dernier chiffre à garder ne change pas. Si le premier ou le seul chiffre à supprimer se situe entre cinq et neuf, on augmente d'une unité le dernier chiffre à garder. Les sommes et les différences d'agrégat (ou de rapports) doivent être calculées à partir de leurs éléments correspondants non arrondis, puis arrondies à leur tour à la centaine près (ou à la première décimale près) selon la méthode d'arrondissement classique. On ne doit en aucun cas publier ni diffuser d'une autre façon des estimations non arrondies. Les estimations non arrondies donnent l'impression d'être beaucoup plus précises qu'elles ne le sont en réalité.

Exactitude des données

La plupart des vérifications des données de l'ESCC sont réalisées au moment de l'interview au moyen de l'application d'interview assistée par ordinateur (IAO). Certains types de réponses incohérentes ou inhabituelles ont été vérifiées au Bureau central après la collecte des données. En général, les problèmes d'incohérence ont été résolus en fixant les réponses aux questions à «Non déclaré».

Dans le cas du cycle 1.1, certains modules ou questions ne convenaient qu'à l'autodéclaration et ont été omis pour les 6,3% d'interviews réalisées par procuration. Les valeurs manquantes ont été imputées par la méthode du «plus proche voisin», sauf pour certains modules pour lesquels il était impossible d'améliorer la qualité des données par imputation.

Des guides détaillés d'utilisation des fichiers de microdonnées ont été produits pour chaque cycle en vue de fournir tous les renseignements contextuels pertinents sur chaque enquête (contexte, méthodologie, qualité des données, dictionnaire des données, spécifications des variables dérivées, etc.).

Les données d'enquête ont fait l'objet d'études spéciales, dont une validation des résultats de l'ESCC comparativement à ceux d'autres enquêtes pour les deux cycles de collecte réalisées jusqu'à présent. Une étude spéciale a également été réalisée en vue de comparer le profil des répondants qui acceptent que les données qu'ils fournissent soient partagées avec d'autres ministères. Une autre étude a porté sur l'effet du mode de collecte (interview téléphonique c.interview sur place pour le cycle1.1) sur les estimations.

Voir ce document pour de l'information sur les taux de réponse et sur d'autres questions concernant l'exactitude des données.

Documentation

Fichier des données