Enquête sur la technologie numérique et l'utilisation d'Internet (ETNUI)
Information détaillée pour 2021
Statut :
Active
Fréquence :
Occasionnelle
Numéro d'enregistrement :
4225
L'Enquête sur la technologie numérique et l'utilisation d'Internet (ETNUI) de 2021 sert à mesurer l'incidence des technologies numériques, y compris Internet et des technologies de l'information et des communications (TIC) particulières, sur les activités des entreprises canadiennes.
Date de la parution - 13 septembre 2022
- Questionnaire(s) et guide(s) de déclaration
- Aperçu
- Sources de données et méthodologie
- Exactitude des données
Aperçu
L'Enquête sur la technologie numérique et l'utilisation d'Internet (ETNUI) de 2021 a été conçue dans le but de mesurer les répercussions des technologies numériques sur les activités des entreprises canadiennes.
Les renseignements recueillis permettent de mieux comprendre la façon dont les entreprises utilisent Internet, y compris leur présence sur le Web, leur participation au commerce en ligne, leur utilisation de certaines technologies de l'information et des communications (TIC) et leur recours aux services en ligne offerts par le gouvernement fédéral. L'enquête porte également sur les compétences et l'emploi relatifs aux postes liés aux TIC. Les données de cette enquête sont utilisées par les ministères et organismes gouvernementaux afin d'élaborer des politiques et des programmes qui aident à améliorer le système d'innovation du Canada ainsi qu'à renforcer l'ensemble de l'économie nationale.
L'ETNUI est parrainé par Innovation, Sciences et Développement économique Canada (ISDE). De nombreux autres ministères et organismes gouvernementaux ont aussi apporté leur contribution pendant l'étape d'élaboration du contenu du questionnaire.
Les résultats de cette enquête sont également suivis par l'Organisation de coopération et de développement économiques (OCDE) pour faire des comparaisons et pour étudier le développement et l'influence de l'économie numérique.
Période de référence : Les 12 mois de l'année civile
Période de collecte : novembre de l'année de référence à mars de l'année suivante
Sujets
- Technologie de l'information et des communications
- Utilisation d'Internet par les entreprises et les gouvernements
Sources de données et méthodologie
Population cible
La population cible provient du Registre des entreprises (RE) de Statistique Canada. Le RE est une base de données sur la population des entreprises canadiennes et il sert de base de sondage à toutes les enquêtes-entreprises de Statistique Canada. Il s'agit d'une liste structurée d'entreprises productrices de biens et de services au Canada.
Cette enquête vise les entreprises exerçant des activités au Canada dans presque tous les secteurs industriels. Les industries de la population cible sont fondées sur le Système de classification des industries de l'Amérique du Nord (SCIAN) de 2017. Les secteurs 21, 22, 23, 31, 32, 33, 41, 44, 45, 48, 49, 51, 52, 53, 54, 55, 56, 61, 62, 71, 72 et 81 sont inclus. Les entités suivantes sont exclues de la population cible :
- Entités publiques;
- Entreprises comptant moins de cinq employés;
- Agriculture, foresterie, pêche et chasse (11), entrepreneurs spécialisés (238), sièges sociaux (551114), ménages privés (814) et administrations publiques (91);
- Entreprises des secteurs 23, 48, 49, 53, 54, 56, 61, 62, 71, 72 et 81 dont les revenus sont inférieurs à 100 000 $;
- Entreprises des secteurs 21, 22, 31, 32, 33, 41, 44, 45, 51, 52 et 55 dont les revenus sont inférieurs à 250 000 $.
Élaboration de l'instrument
Les données de l'enquête seront recueillies au moyen d'un questionnaire électronique.
Le questionnaire a fait l'objet de révisions mineures par rapport au cycle précédent (2019) afin de mieux répondre aux besoins stratégiques du partenaire parrain, ISDE, et de mieux harmoniser l'ETNUI avec les enquêtes menées par d'autres organismes nationaux de statistique. De plus, des spécialistes du domaine, des entreprises privées et des intervenants externes ont été consultés au cours du processus d'élaboration du contenu.
Les tests cognitifs relativement au contenu du questionnaire ont été réalisés dans les deux langues officielles conjointement avec le Centre de ressources en conception de questionnaires de Statistique Canada. Pour le cycle de 2019, l'ensemble du questionnaire a été mis à l'essai au moyen d'interviews individuelles auprès de répondants potentiels à Gatineau, à Montréal et à Toronto. Pour le cycle de 2021, le contenu révisé a été mis à l'essai au moyen d'interviews téléphoniques individuelles auprès de répondants potentiels. Des modifications ont été apportées au questionnaire en fonction des commentaires reçus et de l'analyse des interviews pour accroître la pertinence des questions et pour qu'il soit plus facile d'y répondre.
Échantillonnage
Il s'agit d'une enquête transversale par échantillon.
La base de sondage a été établie en sélectionnant toutes les entreprises qui satisfont aux critères de la population cible dans le Registre des entreprises. La population cible comptait 332 241 entreprises en juillet 2021.
Les entreprises ont été stratifiées par industrie et selon deux ensembles de catégories de taille pour répondre aux besoins en données des intervenants nationaux et internationaux. Les catégories de taille sont fondées sur le nombre d'employés de l'entreprise. Le premier ensemble de catégories de taille regroupe les catégories suivantes : petite (de 5 à 19 employés), moyenne (de 20 à 99 employés à l'extérieur du secteur de la fabrication ou de 20 à 499 employés dans le secteur de la fabrication) et grande (100 employés ou plus à l'extérieur du secteur de la fabrication ou 500 employés ou plus dans le secteur de la fabrication). Le deuxième ensemble de catégories de taille regroupe les catégories suivantes : petite (de 5 à 49 employés), moyenne (de 50 à 249 employés) et grande (250 employés ou plus).
La taille globale de l'échantillon de l'enquête a été déterminée en fonction des paramètres suivants :
- une erreur-type prévue de 8 % pour les deux ensembles de domaines qui se chevauchent (niveau du Système de classification des industries de l'Amérique du Nord [SCIAN] selon la catégorie de taille pour les deux ensembles de catégories de taille) pour une proportion déclarée de 50 %;
- les niveaux du SCIAN précisés au niveau à trois chiffres du SCIAN pour les secteurs 23, 31, 32, 33, 41, 44, 45, 48, 49, 51, 52, 53, 56, 62, 71 et 72;
- les niveaux du SCIAN précisés au niveau à deux chiffres du SCIAN pour tous les autres secteurs;
- un taux de réponse de 65 %.
Une répartition proportionnelle de l'échantillon a été effectuée dans chacune des strates définies en fonction du niveau du SCIAN et des ensembles de catégories de taille. La probabilité qu'une entreprise particulière soit sélectionnée dans l'échantillon de l'enquête est déterminée en fonction du nombre d'entreprises sélectionnées dans la strate et de la taille de la population de la strate.
La taille finale de l'échantillon était de 15 683 entreprises.
Sources des données
Collecte des données pour cette période de référence : 2021-11-25 à 2022-03-21
Il s'agit d'une enquête à participation obligatoire.
Les données sont obtenues directement auprès des répondants.
Les données sont recueillies au moyen d'un questionnaire électronique. La première prise de contact avec les entreprises se fait par téléphone durant une phase de contact préliminaire dont l'objectif est de trouver une personne-ressource au sein de l'entreprise qui est en mesure de répondre aux questions de l'enquête.
Les suivis en cas de non-réponse, de données incohérentes ou de données manquantes se font au téléphone par ordre de priorité.
Voir le(s) Questionnaire(s) et guide(s) de déclaration .
Détection des erreurs
La détection des erreurs fait partie intégrante des activités de collecte et de traitement des données. Des vérifications automatisées sont appliquées aux enregistrements de données durant la collecte afin de repérer les erreurs de déclaration et de les corriger.
La phase de traitement de l'enquête a consisté pour l'essentiel à appliquer les vérifications de la cohérence et de la validité à chaque enregistrement. La vérification de la cohérence permet de s'assurer que les données d'une question ne contredisent pas l'information fournie en réponse à une autre question. La vérification de la validité permet de s'assurer que les données déclarées sont valides (p. ex. les pourcentages ne dépassent pas 100 %).
Les variables clés ont également fait l'objet de vérifications visant la détection des valeurs aberrantes lors du traitement des données. Certaines valeurs aberrantes qui n'ont pas pu être validées ont été remplacées par des valeurs imputées.
Imputation
Les non-réponses et les enregistrements erronés ont été imputés par enregistrement donneur selon la méthode du plus proche voisin dans le système généralisé BANFF. Cette méthode utilise une approche du plus proche voisin pour trouver, pour chaque enregistrement exigeant une imputation, l'enregistrement valide le plus semblable et qui garantira que l'enregistrement imputé ne contrevient à aucun des enchaînements logiques et des restrictions d'entrée du questionnaire.
Des enregistrements semblables sont trouvés en définissant des classes d'imputation qui prennent en compte d'autres variables qui sont corrélées avec les valeurs manquantes ou erronées. Lorsqu'on ne peut pas trouver de voisin le plus proche pour certains enregistrements dans les classes d'imputation les plus spécifiques, la définition des classes d'imputation est élargie et les données font l'objet d'un nouveau traitement. Ce traitement par imputation se poursuit selon une séquence prédéterminée jusqu'à ce que des enregistrements donneurs selon la méthode du plus proche voisin aient été attribués à tous les enregistrements à imputer.
Estimation
Les valeurs de réponse des unités échantillonnées ont été multipliées par un poids final pour obtenir une estimation pour l'ensemble de la population. Le poids final a été calculé à l'aide de plusieurs facteurs, notamment la probabilité qu'une unité soit sélectionnée dans l'échantillon et un ajustement pour représenter les unités qui n'ont pas pu être jointes ou qui ont refusé de répondre. L'utilisation d'une technique statistique appelée calage a permis d'ajuster l'ensemble définitif de poids de manière à ce que l'échantillon représente le plus fidèlement possible la population entière.
L'erreur d'échantillonnage a été mesurée par l'erreur-type (ET) pour les proportions et par le coefficient de variation (c.v.) pour les réponses numériques. Ces mesures représentent la proportion de l'estimation qui découle de la variabilité associée à l'échantillonnage. Les ET et les c.v. ont été calculés et ils sont notés au moyen d'indicateurs de la qualité dans les tableaux de données.
Évaluation de la qualité
Avant la diffusion des données, les résultats combinés de l'enquête sont analysés afin d'en évaluer la comparabilité. Cette analyse comprend un examen détaillé des éléments suivants :
- les réponses individuelles (particulièrement pour les plus grands organismes);
- la cohérence avec les résultats d'autres enquêtes et études relatives aux technologies numériques et à l'utilisation d'Internet, y compris les itérations précédentes de l'enquête;
- les renseignements d'autres sources externes (p. ex. rapports annuels et articles de journaux).
Contrôle de la divulgation
La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.
Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.
Révisions et désaisonnalisation
Cette méthodologie ne s'applique pas à cette enquête.
Exactitude des données
Il peut se produire des erreurs pour diverses raisons au cours de la collecte et du traitement des données. La non-réponse, par exemple, est une source possible d'erreurs. La sous-couverture ou la couverture excessive de la population, les écarts dans l'interprétation des questions ainsi que les erreurs de consignation et de traitement des données sont d'autres erreurs possibles. Dans la mesure du possible, ces erreurs sont réduites au minimum par la conception minutieuse du questionnaire d'enquête et la vérification des données de l'enquête.
Les indicateurs de l'exactitude des données utilisés pour l'ETNUI sont l'erreur-type et le coefficient de variation. L'erreur-type est une mesure statistique communément utilisée qui indique l'erreur d'échantillonnage que comporte une estimation. Le coefficient de variation est l'erreur-type exprimée en pourcentage de l'estimation.
Les indicateurs de la qualité des données à l'enquête sont fondés sur l'erreur-type (ET) ou le coefficient de variation (c.v.), et les taux d'imputation. Les indicateurs de la qualité vont comme suit pour l'ET : A est très fiable (ET allant jusqu'à 2,5 %); B est fiable (ET de 2,5 % jusqu'à 5,0 %); C est bon (ET de 5,0 % jusqu'à 7,5 %); D est acceptable (ET de 7,5 % jusqu'à 10,0 %); E est à utiliser avec prudence (ET de 10,0 % jusqu'à 12,5 %); et F est trop peu fiable pour être publié (ET de 12,5 % et plus). Les indicateurs de la qualité vont comme suit pour le c.v. : A est très fiable (c.v. allant jusqu'à 5 %); B est fiable (c.v. de 5 % jusqu'à 10 %); C est bon (c.v. de 10 % jusqu'à 15 %); D est acceptable (c.v. de 15 % jusqu'à 20 %); E est à utiliser avec prudence (c.v. de 20 % jusqu'à 25 %); et F est trop peu fiable pour être publié (c.v. de 25 % et plus).
Taux de réponse :
Le taux de réponse à la phase d'estimation était de 73 %.
Biais de non-réponse :
En plus d'augmenter la variance, la non-réponse peut donner lieu à des estimations biaisées si les non-répondants présentent des caractéristiques différentes de celles des répondants. La non-réponse est traitée au moment de la conception de l'enquête, du suivi auprès des répondants, de la repondération, ainsi que de la vérification et de la validation des microdonnées. D'autres indicateurs de la qualité comme le taux de réponse sont également fournis.
Erreur de couverture :
Le Registre des entreprises a été utilisé comme base de sondage.
- Date de modification :