Enquête sur la technologie numérique et l'utilisation d'Internet (ETNUI)

Information détaillée pour 2019

Statut :

Active

Fréquence :

Occasionnelle

Numéro d'enregistrement :

4225

L'Enquête sur la technologie numérique et l'utilisation d'Internet (ETNUI) de 2019 sert à mesurer l'incidence des technologies numériques, y compris Internet et des technologies de l'information et des communications (TIC) particulières, sur les activités des entreprises canadiennes.

Date de la parution - 23 novembre 2020

Aperçu

L'Enquête sur la technologie numérique et l'utilisation d'Internet (ETNUI) de 2019 a été conçue dans le but de mesurer les répercussions des technologies numériques sur les activités des entreprises canadiennes.

Les renseignements recueillis permettent de mieux comprendre la façon dont les entreprises utilisent Internet, y compris leur présence sur le Web, leur participation au commerce en ligne, leur utilisation de certaines technologies de l'information et des communications (TIC) et leur recours aux services en ligne offerts par le gouvernement fédéral. L'enquête porte également sur les compétences et l'emploi relatifs aux postes liés aux TIC. Les données de cette enquête sont utilisées par les ministères et organismes gouvernementaux afin d'élaborer des politiques et des programmes qui aident à améliorer le système d'innovation du Canada ainsi qu'à renforcer l'ensemble de l'économie nationale.

La version 2019 de l'ETNUI est parrainée par Innovation, Sciences et Développement économique Canada (ISDE). De nombreux autres ministères ont aussi apporté leur contribution pendant l'étape d'élaboration du contenu du questionnaire.

Les résultats de cette enquête sont également suivis par l'Organisation de coopération et de développement économiques (OCDE) pour faire des comparaisons et pour étudier le développement et l'influence de l'économie numérique.

Période de référence : Les 12 mois de l'année civile

Période de collecte : novembre de l'année de référence à mars de l'année suivante

Sujets

  • Technologie de l'information et des communications
  • Utilisation d'Internet par les entreprises et les gouvernements

Sources de données et méthodologie

Population cible

La population cible provient du Registre des entreprises (RE) de Statistique Canada. Le RE est une base de données sur la population des entreprises canadiennes et il sert de base de sondage à toutes les enquêtes-entreprises de Statistique Canada. Il s'agit d'une liste structurée d'entreprises productrices de biens et de services au Canada.

Cette enquête vise les entreprises exerçant des activités au Canada dans presque tous les secteurs industriels. Les industries de la population cible sont fondées sur le Système de classification des industries de l'Amérique du Nord (SCIAN) de 2017. Les secteurs 21, 22, 23, 31, 32, 33, 41, 44, 45, 48, 49, 51, 52, 53, 54, 55, 56, 61, 62, 71, 72 et 81 sont inclus. Les entités suivantes sont exclues de la population cible :

- Entités publiques;
- Entreprises comptant moins de cinq employés;
- Agriculture, foresterie, pêche et chasse (11), entrepreneurs spécialisés (238), sièges sociaux (551114), ménages privés (814) et administrations publiques (91);
- Entreprises des secteurs 23, 48, 49, 53, 54, 56, 61, 62, 71, 72 et 81 dont les revenus sont inférieurs à 100 000 $;
- Entreprises des secteurs 21, 22, 31, 32, 33, 41, 44, 45, 51, 52 et 55 dont les revenus sont inférieurs à 250 000 $.

Élaboration de l'instrument

Les données de l'enquête ont été recueillies au moyen d'un questionnaire électronique.

Le questionnaire a été considérablement remanié par rapport à la version précédente de 2013 pour répondre aux besoins stratégiques du partenaire parrain.

Le contenu du questionnaire a fait l'objet de tests cognitifs menés en deux phases, dans les deux langues officielles, en collaboration avec le Centre de ressources en conception de questionnaires de Statistique Canada. La première phase visait principalement à valider la compréhension par les répondants des concepts, des questions et de la terminologie, ainsi que la pertinence des catégories de réponse et l'accessibilité aux renseignements demandés. Au cours de la deuxième phase, le contenu a été mis à l'essai dans le cadre d'interviews individuelles menées auprès de 18 répondants potentiels à Gatineau, à Montréal et à Toronto. D'autres modifications ont été apportées au questionnaire en fonction des commentaires reçus et de l'analyse de ces interviews pour accroître la pertinence des questions et pour qu'il soit plus facile d'y répondre.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

La base de sondage est établie en sélectionnant à partir du RE toutes les entreprises qui satisfont aux critères de la population cible. À l'heure actuelle, la population cible compte 339 207 entreprises.

Les entreprises sont stratifiées par industrie et par catégorie de taille. La catégorie de taille est fondée sur le nombre d'employés de l'entreprise. Trois catégories de taille ont été créées : petite (de 5 à 49 employés), moyenne (de 50 à 249 employés) et grande (250 employés ou plus).

La taille de l'échantillon de l'enquête a été déterminée en fonction des paramètres suivants :

- L'allocation proportionnelle a été utilisée en supposant une proportion déclarée de 50 % pour chaque variable d'intérêt ;
- Les domaines ont été précisés au niveau à trois chiffres du SCIAN pour les secteurs 23, 31, 32, 33, 41, 44, 45, 48, 49, 51, 52, 53, 56, 62, 71 et 72;
- Les domaines ont été précisés au niveau à quatre chiffres du SCIAN pour le secteur 54;
- Pour tous les autres secteurs, les domaines ont été précisés au niveau à deux chiffres du SCIAN;
- Un taux de réponse minimal de 65 % était attendu.

La probabilité qu'une entreprise particulière soit sélectionnée dans l'échantillon de l'enquête a été déterminée en fonction de la proportion de l'échantillon de l'enquête attribuée à son domaine, du nombre d'entreprises de son domaine dans la population et de ses revenus.

La taille de l'échantillon était de 14 127 entreprises.

Sources des données

Collecte des données pour cette période de référence : 2019-11-28 à 2020-03-04

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants.

Les données sont recueillies au moyen d'un questionnaire électronique. La première prise de contact avec les entreprises se fait par téléphone durant une phase de contact préliminaire dont l'objectif est de trouver une personne-ressource au sein de l'entreprise qui est en mesure de répondre aux questions de l'enquête.
Les suivis en cas de non-réponse, de données incohérentes ou de données manquantes se font au téléphone par ordre de priorité.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

La détection des erreurs fait partie intégrante des activités de collecte et de traitement des données. Des vérifications automatisées sont appliquées aux enregistrements de données durant la collecte afin de repérer les erreurs de déclaration et de les corriger.

La phase de traitement de l'enquête a consisté pour l'essentiel à appliquer les vérifications de la cohérence et de la validité à chaque enregistrement. La vérification de la cohérence permet de s'assurer que les données d'une question ne contredisent pas l'information fournie en réponse à une autre question. La vérification de la validité permet de s'assurer que les données déclarées sont valides (p. ex. les pourcentages ne dépassent pas 100 %).

Les variables clés ont également fait l'objet de vérifications visant la détection des valeurs aberrantes lors du traitement des données. Certaines valeurs aberrantes qui n'ont pas pu être validées ont été remplacées par des valeurs imputées.

Imputation

Les non-réponses et les enregistrements erronés ont été imputés par enregistrement donneur selon la méthode du plus proche voisin dans le système généralisé BANFF. Cette méthode utilise une approche du plus proche voisin pour trouver, pour chaque enregistrement exigeant une imputation, l'enregistrement valide le plus semblable et qui garantira que l'enregistrement imputé ne contrevient à aucun des enchaînements logiques et des restrictions d'entrée du questionnaire.

Des enregistrements semblables sont trouvés en définissant des classes d'imputation qui prennent en compte d'autres variables qui sont corrélées avec les valeurs manquantes ou erronées. Lorsqu'on ne peut pas trouver de voisin le plus proche pour certains enregistrements dans les classes d'imputation les plus spécifiques, la définition des classes d'imputation est élargie et les données font l'objet d'un nouveau traitement. Ce traitement par imputation se poursuit selon une séquence prédéterminée jusqu'à ce que des enregistrements donneurs selon la méthode du plus proche voisin aient été attribués à tous les enregistrements à imputer.

Estimation

Les valeurs de réponse des unités échantillonnées ont été multipliées par un poids final pour obtenir une estimation pour l'ensemble de la population. Le poids final a été calculé à l'aide de plusieurs facteurs, notamment la probabilité qu'une unité soit sélectionnée dans l'échantillon et un ajustement pour représenter les unités qui n'ont pas pu être jointes ou qui ont refusé de répondre. L'utilisation d'une technique statistique appelée calage a permis d'ajuster l'ensemble définitif de poids de manière à ce que l'échantillon représente le plus fidèlement possible la population entière.

L'erreur d'échantillonnage a été mesurée par l'erreur-type (ET) pour les proportions et par le coefficient de variation (c.v.) pour les réponses numériques. Ces mesures représentent la proportion de l'estimation qui découle de la variabilité associée à l'échantillonnage. Les ET et les c.v. ont été calculés et ils sont notés au moyen d'indicateurs de la qualité dans les tableaux de données.

Évaluation de la qualité

Avant la diffusion des données, les résultats combinés de l'enquête sont analysés afin d'en évaluer la comparabilité. Cette analyse comprend un examen détaillé des éléments suivants :
- les réponses individuelles (particulièrement pour les plus grands organismes);
- la cohérence avec les résultats d'autres enquêtes et études relatives aux technologies numériques et à l'utilisation d'Internet, y compris les itérations précédentes de l'enquête
- les renseignements d'autres sources externes (p. ex. rapports annuels et articles de journaux).

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Cette méthodologie ne s'applique pas à cette enquête.

Exactitude des données

Il peut se produire des erreurs pour diverses raisons au cours de la collecte et du traitement des données. La non-réponse, par exemple, est une source possible d'erreurs. La sous-couverture ou la couverture excessive de la population, les écarts dans l'interprétation des questions ainsi que les erreurs de consignation et de traitement des données sont d'autres erreurs possibles. Dans la mesure du possible, ces erreurs sont réduites au minimum par la conception minutieuse du questionnaire d'enquête et la vérification des données de l'enquête.

Les indicateurs de l'exactitude des données utilisés pour l'ETNUI sont l'erreur-type et le coefficient de variation. L'erreur-type est une mesure statistique communément utilisée qui indique l'erreur d'échantillonnage que comporte une estimation. Le coefficient de variation est l'erreur-type exprimée en pourcentage de l'estimation.

Les indicateurs de la qualité des données à l'enquête sont fondés sur l'erreur-type (ET) ou le coefficient de variation (c.v.), et les taux d'imputation. Les indicateurs de la qualité vont comme suit pour l'ET : A est très fiable (ET allant jusqu'à 2,5 %); B est fiable (ET de 2,5 % jusqu'à 5,0 %); C est bon (ET de 5,0 % jusqu'à 7,5 %); D est acceptable (ET de 7,5 % jusqu'à 10,0 %); E est à utiliser avec prudence (ET de 10,0 % jusqu'à 12,5 %); et F est trop peu fiable pour être publié (ET de 12,5 % et plus). Les indicateurs de la qualité vont comme suit pour le c.v. : A est très fiable (c.v. allant jusqu'à 5 %); B est fiable (c.v. de 5 % jusqu'à 10 %); C est bon (c.v. de 10 % jusqu'à 15 %); D est acceptable (c.v. de 15 % jusqu'à 20 %); E est à utiliser avec prudence (c.v. de 20 % jusqu'à 25 %); et F est trop peu fiable pour être publié (c.v. de 25 % et plus).

Taux de réponse :
Le taux de réponse à la phase d'estimation était de 77 %.

Biais de non-réponse :
En plus d'augmenter la variance, la non-réponse peut donner lieu à des estimations biaisées si les non-répondants présentent des caractéristiques différentes de celles des répondants. La non-réponse est traitée au moment de la conception de l'enquête, du suivi auprès des répondants, de la repondération, ainsi que de la vérification et de la validation des microdonnées. D'autres indicateurs de la qualité comme le taux de réponse sont également fournis.

Erreur de couverture :
Le Registre des entreprises a été utilisé comme base de sondage.

Date de modification :