Enquête sur la technologie numérique et l'utilisation d'Internet (ETNUI)

Information détaillée pour 2013

Statut :

Active

Fréquence :

Occasionnelle

Numéro d'enregistrement :

4225

L'Enquête sur la technologie numérique et l'utilisation d'Internet mesure l'adoption et l'utilisation de diverses technologies numériques, y compris Internet.

Date de la parution - 11 juin 2014

Aperçu

L'utilisation d'Internet et des technologies numériques est omniprésente dans la société d'aujourd'hui. À l'instar de l'électricité, Internet est maintenant à ce point intégré au mode de fonctionnement des entreprises qu'on peut le considérer comme une technologie d'application générale parce qu'il influence tout le roulement de l'économie. Si prometteur soit-il, l'emploi des technologies numériques et du commerce électronique présente également de nombreux défis tant aux entreprises qu'aux décideurs. Afin de comprendre les effets et les répercussions de ces technologies, il faut d'abord savoir qui s'en sert et comment.

Les données de cette enquête sont utilisées par les entreprises et les décideurs pour suivre les tendances de l'adoption des technologies de l'information et des communications (TIC) et pour en évaluer l'impact sur l'économie. Les résultats sont également suivis par des organismes internationaux tels que l'Organisation de coopération et de développement économiques (OCDE) pour faire des comparaisons et pour étudier le développement et l'influence de l'économie numérique.

Activité statistique

Les sciences et la technologie (S&T) et la société de l'information ont une incidence sur notre travail, nos affaires et nos vies. Ces concepts sont étroitement interreliés : les sciences fournissent de nouvelles façons de comprendre le fonctionnement du monde, la technologie se sert de cette nouvelle compréhension pour l'élaboration de produits et services innovateurs, et la société de l'information est l'un des résultats de ces innovations.

Les gens s'adressent à Statistique Canada pour obtenir une mesure et une explication des répercussions sociales et économiques de ces changements.

Ce programme vise à élaborer des indicateurs utiles à l'égard de l'activité liée aux sciences et à la technologie au Canada, dans un cadre les regroupant de manière cohérente.

Période de référence : Les 12 mois de l'année civile

Période de collecte : novembre de l'année de référence à mars de l'année suivante

Sujets

  • Technologie de l'information et des communications
  • Utilisation d'Internet par les entreprises et les gouvernements

Sources de données et méthodologie

Population cible

Cette enquête couvre les entreprises privées d'à peu près tous les secteurs industriels à l'exception des sous-secteurs du SCIAN suivants : 111, 112, 114, 1151, 1152, 238, 55114, 814.

Toutes les entreprises, sauf les très petites, font partie de la population cible. Les entreprises dont le revenu est inférieur à 100 000 $ ou à 250 000 $, selon le secteur, ont été exclues de la base de population.

La classification industrielle attribuée à l'entreprise qui participe au commerce électronique correspond à la classification industrielle de l'établissement ayant la valeur ajoutée la plus élevée au sein de l'entreprise. Par exemple, si une transaction par Internet était effectuée dans un établissement au détail d'une entreprise du secteur de la fabrication, cette activité serait classifiée comme une vente du secteur de la fabrication si l'établissement a la valeur ajoutée la plus élevée au sein de l'entreprise.

Élaboration de l'instrument

Les données de l'enquête ont été recueillies au moyen d'un questionnaire électronique.

Le questionnaire a été considérablement remanié par rapport à la version précédente de 2013 pour répondre aux besoins stratégiques du partenaire parrain.

Le contenu du questionnaire a fait l'objet de tests cognitifs menés en deux phases, dans les deux langues officielles, en collaboration avec le Centre de ressources en conception de questionnaires de Statistique Canada. La première phase visait principalement à valider la compréhension par les répondants des concepts, des questions et de la terminologie, ainsi que la pertinence des catégories de réponse et l'accessibilité aux renseignements demandés. Au cours de la deuxième phase, le contenu a été mis à l'essai dans le cadre d'interviews individuelles menées auprès de 18 répondants potentiels à Gatineau, à Montréal et à Toronto. D'autres modifications ont été apportées au questionnaire en fonction des commentaires reçus et de l'analyse de ces interviews pour accroître la pertinence des questions et pour qu'il soit plus facile d'y répondre.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

L'enquête, qui met l'accent sur l'utilisation de technologies de l'information et des communications telles que les ordinateurs personnels, le courriel et Internet, est réalisée auprès d'un échantillon des entreprises canadiennes du secteur privé, sa population cible.

La base de sondage est constituée d'entreprises du Registre des entreprises (RE) de Statistique Canada. Elle est d'abord stratifiée en fonction du Système de classification des industries de l'Amérique du Nord (SCIAN) au niveau requis pour les estimations (niveau 2 ou 3 du SCIAN). À l'intérieur de chaque niveau industriel, trois strates de taille sont créées : les grandes unités, dont l'échantillonnage se fait avec certitude, et les petites et moyennes unités, dont l'échantillonnage se fait selon une probabilité de sélection. La taille est basée sur le revenu de l'entreprise. Il y a également une strate à tirage nul. Les entreprises dont le revenu est inférieur à 100 000 $ ou à 250 000 $, selon le secteur, ont été exclues de la base de population.

L'unité d'échantillonnage de l'enquête est l'entreprise, qui est l'unité organisationnelle d'une entreprise qui dirige et qui contrôle les ressources rattachées à ses activités au Canada et pour laquelle des états financiers et des bilans consolidés sont tenus. De ce fait, l'enquête recueille des renseignements sur les opérations entre les entreprises tout en excluant de façon particulière les opérations à l'intérieur des entreprises, c'est-à-dire les transactions par Internet susceptibles d'avoir lieu entre deux établissements ou compagnies de la même entreprise.

La méthode utilisée est l'algorithme de Lavallée-Hidirouglou, qui permet de stratifier l'échantillon et de le répartir dans les strates en réduisant sa taille au minimum tout en atteignant le coefficient de variation (CV) cible selon la variable de taille.

Un échantillon d'environ 17 000 entreprises permet de viser un CV d'entre 2,5 % et 3,5 % dans la majorité des industries.

Une fois l'échantillon stratifié et réparti, un échantillon minimum de 20 unités est établi pour les petites unités de certains secteurs. De plus, on accroît la taille de l'échantillon de secteurs clés pour s'assurer d'obtenir des résultats plus précis dans les strates des petites et moyennes unités.

Toutes les unités sont échantillonnées avec certitude dans les strates à tirage complet, tandis qu'un échantillon aléatoire est sélectionné dans les strates à tirage partiel.

Sources des données

Collecte des données pour cette période de référence : 2013-09-30 à 2014-03-14

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants.

Deux modes servent à recueillir les données : un questionnaire électronique surtout, mais également un questionnaire papier. La première prise de contact avec les entreprises s'est faite par téléphone durant une phase de contact préliminaire afin de leur demander si elles utilisaient Internet et les noms et l'adresse de courriel d'une personne-ressource au sein de l'entreprise. Le questionnaire papier n'était posté qu'aux entreprises qu'il était impossible de joindre ou qui ne fournissaient pas d'adresse de courriel durant le contact préliminaire. Les entreprises qui recevaient un questionnaire électronique pouvaient également demander un questionnaire papier à l'occasion.

Les suivis en cas de non-réponse, de données incohérentes ou de données manquantes se font au téléphone sur une base prioritaire.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

À la collecte des données, certaines vérifications sont effectuées pour chaque questionnaire, comme les règles de cohérence et de validité. D'autres vérifications de la cohérence sont effectuées durant le traitement des données. La détection des valeurs aberrantes est appliquée à la variable « Ventes effectuées par Internet » au moyen du Système généralisé de vérification et d'imputation de Statistique Canada (système BANFF). La détection des valeurs aberrantes est faite pour chaque industrie. De plus, des données historiques ont servi à valider les valeurs déclarées à la variable « Ventes effectuées par Internet ».

Imputation

L'imputation est appliquée dans les cas de non-réponse partielle. En raison du chevauchement dans l'échantillon et de la répétition de certaines questions dans le questionnaire, des données historiques existent pour certaines unités. Grâce aux données historiques, la méthode d'imputation a pu être appliquée aux valeurs manquantes lorsque cela était possible. L'imputation au moyen de données historiques a été appliquée de diverses façons, soit par le remplacement direct, le remplacement avec ratio d'ajustement et l'imputation par donneur, lorsque le donneur et le receveur avaient la même réponse dans les données historiques.

Les données fiscales ont servi à l'imputation de la variable « Ventes effectuées par Internet » conjointement avec le « pourcentage des ventes effectuées par Internet ». L'imputation à l'aide des données administratives est utilisée pour la question portant sur le nombre de salariés.
L'imputation par donneur est utilisée dans les autres cas pour remplacer les valeurs manquantes ou incohérentes par celles du plus proche répondant selon des caractéristiques comme la taille, la classification industrielle et les variables clés du questionnaire. On utilise une méthode du système BANFF pour procéder à l'imputation par donneur avec le plus proche voisin. L'imputation est exécutée à l'intérieur de groupes homogènes, le groupe initial d'imputation correspondant à la strate. Si le nombre ou la proportion de donneurs sont insuffisants à l'intérieur d'un groupe ou si une imputation effectuée à partir de tous les donneurs disponibles risque d'entraîner des incohérences dans le questionnaire, on passe à un groupe d'imputation plus agrégé.

Les entreprises pour lesquelles on a relevé des valeurs aberrantes sont exclues du bassin de donneurs. Au moment de procéder à l'imputation pour les ventes effectuées par Internet, les revenus du donneur doivent se situer entre 75 % et 125 % des revenus du receveur. Une fois l'imputation terminée, les règles de vérification initiales sont appliquées de nouveau pour assurer la cohérence de tous les questionnaires qui seront utilisés au cours du processus d'estimation.

Estimation

On rajuste la pondération dans les cas de non-réponse totale. La pondération est effectuée en deux étapes étant donné qu'une question de sélection a été posée lors du contact préliminaire. On fait appel au Système généralisé d'estimation de Statistique Canada pour procéder à l'estimation. Trois types d'estimation sont produits : dans le cas des variables de pourcentage (P), un ratio est utilisé pour obtenir l'estimation; pour les variables catégoriques (C), on utilise aussi un ratio; et dans le cas des variables numériques (Y), on utilise l'estimateur habituel du total.

Évaluation de la qualité

Les résultats de l'enquête sont analysés aux niveaux micro et macro. Au niveau micro, des contrôles sont effectués par rapport aux données pour vérifier la cohérence des données entre elles et repérer les valeurs extrêmes. Au niveau macro, les données font l'objet d'un examen détaillé de la qualité, y compris une analyse comparative avec les données de l'année précédente. Les erreurs importantes sont par conséquent décelées et corrigées.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite au moyen du Système généralisé de contrôle de la divulgation (G-Confid) de Statistique Canada. G-Confid est utilisé pour la suppression primaire (divulgation directe), ainsi que pour la suppression secondaire (divulgation par recoupements). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou que la cellule est dominée par quelques entreprises. Il y a divulgation par recoupements lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Cette méthodologie ne s'applique pas à cette enquête.

Exactitude des données

Malgré les efforts considérables déployés pour que toutes les étapes de la collecte et du traitement se déroulent en fonction de normes rigoureuses, les estimations de l'Enquête sur la technologie numérique et l'utilisation d'Internet qui en résultent comportent inévitablement une certaine part d'erreur. Les erreurs en question peuvent être classées en deux grandes catégories : les erreurs non dues à l'échantillonnage et les erreurs d'échantillonnage.

Les erreurs non dues à l'échantillonnage ne sont pas liées à l'échantillonnage et peuvent se produire pour de nombreuses raisons. Par exemple, la non-réponse est une source importante d'erreurs non dues à l'échantillonnage. L'erreur de couverture de la population, les différences d'interprétation des questions et les erreurs commises lors de l'enregistrement, du codage et du traitement des données sont d'autres exemples d'erreurs non dues à l'échantillonnage.

L'erreur de couverture est le résultat d'une représentation inadéquate de la population visée. Cette erreur peut se produire lors de la sélection de la population observée ou durant la collecte et le traitement des données. Pour éviter une telle erreur, plusieurs sources décrivant la population de l'industrie sont utilisées et comparées.

Le taux de réponse à l'estimation était 75,0 %.

L'erreur de réponse peut être attribuable à de nombreux facteurs, notamment la conception du questionnaire, une interprétation erronée des questions par les intervieweurs ou les répondants ou la déclaration de données inexactes par les répondants. Des changements fréquents au sein du personnel d'une entreprise peuvent aussi mener à des erreurs de réponse. Plusieurs éléments sont en place pour aider les répondants à remplir le questionnaire, notamment des vérifications de la logique et de la cohérence, ainsi qu'un glossaire de termes et de concepts. Les réponses sont comparées d'une année à l'autre et tout écart important est examiné par des analystes dans le but d'en vérifier l'exactitude. Cependant, même avec ces vérifications, la qualité des données dépend de la volonté des répondants de consulter leurs dossiers.

L'erreur due à la non-réponse se produit parce que les répondants ne coopèrent pas tous pleinement. Pour atténuer l'incidence sur l'enquête, on demande habituellement aux répondants de fournir les variables clés et des estimations sont faites pour les autres.

Les erreurs d'échantillonnage se produisent parce que les estimations proviennent d'un échantillon de la population plutôt que de la population entière. Elles dépendent de facteurs comme la taille de l'échantillon, le plan d'échantillonnage et la méthode d'estimation. L'erreur d'échantillonnage est mesurée par une quantité appelée écart-type. Celui-ci mesure la variabilité attendue de l'estimation qu'on obtiendrait si on effectuait un échantillonnage à plusieurs reprises. La valeur réelle de l'écart-type est inconnue, mais elle peut être estimée à partir de l'échantillon.

Date de modification :