Enquête canadienne sur la cybersécurité et le cybercrime (ECCC)

Information détaillée pour 2021

Statut :

Active

Fréquence :

Occasionnelle

Numéro d'enregistrement :

5244

Le but de l'Enquête canadienne sur la cybersécurité et le cybercrime de 2021 est de mesurer l'incidence de la cybercriminalité sur les entreprises canadiennes.

Cette enquête recueille des renseignements concernant :
- Les mesures que les entreprises mettent en place en matière de cybersécurité, y compris la formation du personnel;
- Les types d'incidents de cybersécurité qui ont des répercussions sur les entreprises; et
- Les coûts associés à la prévention des incidents de cybersécurité et au rétablissement des activités à la suite des incidents.

Date de la parution - 18 octobre 2022

Aperçu

L'Enquête canadienne sur la cybersécurité et le cybercrime de 2021 est menée pour le compte de Sécurité publique Canada. Le lancement de cette enquête repose sur la nécessité de référencer et de surveiller l'environnement en évolution rapide qui entoure la cybersécurité et le cybercrime. Les données recueillies servent les objectifs généraux suivants : mieux comprendre l'incidence du cybercrime sur les entreprises canadiennes, dont les aspects comme l'investissement dans les mesures de cybersécurité, la formation sur la cybersécurité, le nombre d'incidents de cybersécurité et les coûts associés à l'intervention lors de ces incidents.

Période de référence : Les 12 mois de l'année civile

Période de collecte : De janvier à mars

Sujets

  • Crime et justice
  • Technologie de l'information et des communications
  • Utilisation d'Internet par les entreprises et les gouvernements

Sources de données et méthodologie

Population cible

La population cible provient du Registre des entreprises (RE) de Statistique Canada. Le RE est une base de données sur la population des entreprises canadiennes et il sert de base de sondage à toutes les enquêtes-entreprises de Statistique Canada. Il s'agit d'une liste structurée d'entreprises productrices de biens et de services au Canada.

Cette enquête vise les entreprises exerçant des activités au Canada dans presque tous les secteurs industriels. Les industries de la population cible sont fondées sur le Système de classification des industries de l'Amérique du Nord (SCIAN) de 2017. Les secteurs 11, 21, 22, 23, 31, 32, 33, 41, 44, 45, 48, 49, 51, 52, 53, 54, 55, 56, 61, 62, 71, 72 et 81 sont inclus. Les entités suivantes sont exclues de la population cible :

- Entreprises comptant moins de dix employés;
- Cultures agricoles (111), élevage et aquaculture (112), pêche, chasse et piégeage (114), activités de soutien aux cultures agricoles (1151), activités de soutien à l'élevage (1152), entrepreneurs spécialisés (238), sièges sociaux (551114), ménages privés (814) et administrations publiques (91);
- Entreprises des secteurs 11, 23, 48, 49, 53, 54, 56, 61, 62, 71, 72 et 81 dont les revenus sont inférieurs à 100 000 $;
- Entreprises des secteurs 21, 22, 31, 32, 33, 41, 44, 45, 51, 52 et 55 dont les revenus sont inférieurs à 250 000 $.

Élaboration de l'instrument

Les données d'enquête sont recueillies au moyen d'un questionnaire électronique.

Le questionnaire a fait l'objet de modifications mineures par rapport à la version précédente de 2019 pour mieux tenir compte des besoins stratégiques de partenaire parrain : Sécurité publique Canada. De plus, des spécialistes du domaine, des entreprises privées et des intervenants externes ont été consultés au cours du processus d'élaboration du contenu.

Les tests cognitifs relativement au contenu du questionnaire ont été réalisés dans les deux langues officielles conjointement avec le Centre de ressources en conception de questionnaires de Statistique Canada. Pour le cycle de 2017, le questionnaire en entier a été mis à l'essai lors d'interviews individuelles auprès de répondants potentiels, tenues à Ottawa, Toronto, Montréal et Vancouver. Pour les cycles de 2019 et 2021, le contenu révisé a été mis à l'essai lors d'interviews téléphoniques individuelles auprès de répondants potentiels. Des modifications ont été apportées au questionnaire en fonction des commentaires reçus et de l'analyse des interviews pour accroître la pertinence des questions et pour qu'il soit plus facile d'y répondre.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

La base de sondage a été établie en sélectionnant à partir du RE toutes les entreprises qui satisfont aux critères de la population cible. La population cible comptait 188 359 entreprises.

Les entreprises sont stratifiées par industrie et par catégorie de taille. La catégorie de taille est fondée sur le nombre d'employés de l'entreprise. Trois catégories de taille ont été créées : petite (de 10 à 49 employés), moyenne (de 50 à 249 employés) et grande (250 employés ou plus).

La taille globale de l'échantillon de l'enquête a été déterminée en fonction des paramètres suivants :

- Les domaines précisés au niveau à deux chiffres, à trois chiffres ou à quatre chiffres du SCIAN, selon le secteur;
- Un erreur-type prévue avec la qualité étant égale pour les trois groupes de taille d'effectif de 4,75 % pour le niveau à deux chiffres du SCIAN, et de 5,85 % pour certains codes à trois ou à quatre chiffres du SCIAN, pour une proportion déclarée de 50 %;
- Un taux de réponse de 65 %

La probabilité qu'une entreprise particulière soit sélectionnée dans l'échantillon de l'enquête a été déterminée en fonction de la proportion de l'échantillon de l'enquête attribuée à son domaine, du nombre d'entreprises de son domaine dans la population et de ses revenus.

La taille de l'échantillon était 12 158 entreprises.

Sources des données

Collecte des données pour cette période de référence : 2022-01-10 à 2022-03-31

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants.

Les données sont recueillies au moyen d'un questionnaire électronique. La première prise de contact avec les entreprises se fait par téléphone durant une phase de contact préliminaire dont l'objectif est de trouver une personne-ressource au sein de l'entreprise qui est en mesure de répondre aux questions de l'enquête.

Les suivis en cas de non-réponse, de données incohérentes ou de données manquantes se font au téléphone par ordre de priorité

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

La détection des erreurs fait partie intégrante des activités de collecte et de traitement des données. Des vérifications automatisées sont appliquées aux enregistrements de données durant la collecte afin de repérer les erreurs de déclaration et de les corriger.

La phase de traitement de l'enquête a consisté pour l'essentiel à appliquer les vérifications de la cohérence et de la validité à chaque enregistrement. La vérification de la cohérence permet de s'assurer que les données d'une question ne contredisent pas l'information fournie en réponse à une autre question. La vérification de la validité permet de s'assurer que les données déclarées sont valides (p. ex. les pourcentages ne dépassent pas 100 %).

Les variables clés ont également fait l'objet de vérifications visant la détection des valeurs aberrantes lors du traitement des données. Certaines valeurs aberrantes qui n'ont pas pu être validées ont été remplacées par des valeurs imputées.

Imputation

Les non-réponses et les enregistrements erronés ont été imputés par enregistrement donneur selon la méthode du plus proche voisin dans le système généralisé BANFF. Cette méthode utilise une approche du plus proche voisin pour trouver, pour chaque enregistrement exigeant une imputation, l'enregistrement valide le plus semblable et qui garantira que l'enregistrement imputé ne contrevient à aucun des enchaînements logiques et des restrictions d'entrée du questionnaire.

Des enregistrements semblables sont trouvés en définissant des classes d'imputation qui prennent en compte d'autres variables qui sont corrélées avec les valeurs manquantes ou erronées. Lorsqu'on ne peut pas trouver de voisin le plus proche pour certains enregistrements dans les classes d'imputation les plus spécifiques, la définition des classes d'imputation est élargie et les données font l'objet d'un nouveau traitement. Ce traitement par imputation se poursuit selon une séquence prédéterminée jusqu'à ce que des enregistrements donneurs selon la méthode du plus proche voisin aient été attribués à tous les enregistrements à imputer.

Estimation

Les valeurs de réponse des unités échantillonnées ont été multipliées par un poids final pour obtenir une estimation pour l'ensemble de la population. Le poids final a été calculé à l'aide de plusieurs facteurs, notamment la probabilité qu'une unité soit sélectionnée dans l'échantillon et un ajustement pour représenter les unités qui n'ont pas pu être jointes ou qui ont refusé de répondre. L'utilisation d'une technique statistique appelée calage a permis d'ajuster l'ensemble définitif de poids de manière à ce que l'échantillon représente le plus fidèlement possible la population entière.

L'erreur d'échantillonnage a été mesurée par l'erreur-type (ET) pour les proportions et par le coefficient de variation (c.v.) pour les réponses numériques. Ces mesures représentent la proportion de l'estimation qui découle de la variabilité associée à l'échantillonnage. Les ET et les c.v. ont été calculés et ils sont notés au moyen d'indicateurs de la qualité dans les tableaux de données.

Évaluation de la qualité

Avant la diffusion des données, les résultats combinés de l'enquête sont analysés afin d'en évaluer la comparabilité. Cette analyse comprend un examen détaillé des éléments suivants :

- les réponses individuelles (particulièrement pour les plus grands organismes);

- la cohérence avec les résultats d'autres enquêtes et études liées à la cybersécurité et à la cybercriminalité, y compris les itérations précédentes de l'enquête; et

- les renseignements d'autres sources externes (p. ex. rapports annuels et articles de journaux).

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Révisions et désaisonnalisation

Cette méthodologie ne s'applique pas à ce programme statistique.

Exactitude des données

Il peut se produire des erreurs pour diverses raisons au cours de la collecte et du traitement des données. La non-réponse, par exemple, est une source possible d'erreurs. La sous-couverture ou la couverture excessive de la population, les écarts dans l'interprétation des questions ainsi que les erreurs de consignation et de traitement des données sont d'autres erreurs possibles. Dans la mesure du possible, ces erreurs sont réduites au minimum par la conception minutieuse du questionnaire d'enquête et la vérification des données de l'enquête.

Les indicateurs de l'exactitude des données utilisés pour l'ECCC sont l'erreur-type et le coefficient de variation. L'erreur-type est une mesure statistique communément utilisée qui indique l'erreur d'échantillonnage que comporte une estimation. Le coefficient de variation est l'erreur-type exprimée en pourcentage de l'estimation.

Les indicateurs de la qualité des données à l'enquête sont fondés sur l'erreur-type (ET) ou le coefficient de variation (c.v.), et les taux d'imputation. Les indicateurs de la qualité vont comme suit pour l'ET : A est très fiable (ET allant jusqu'à 2,5 %); B est fiable (ET de 2,5 % jusqu'à 5,0 %); C est bon (ET de 5,0 % jusqu'à 7,5 %); D est acceptable (ET de 7,5 % jusqu'à 10,0 %); E est à utiliser avec prudence (ET de 10,0 % jusqu'à 12,5 %); et F est trop peu fiable pour être publié (ET de 12,5 % et plus). Les indicateurs de la qualité vont comme suit pour le c.v. : A est très fiable (c.v. allant jusqu'à 5 %); B est fiable (c.v. de 5 % jusqu'à 10 %); C est bon (c.v. de 10 % jusqu'à 15 %); D est acceptable (c.v. de 15 % jusqu'à 20 %); E est à utiliser avec prudence (c.v. de 20 % jusqu'à 25 %); et F est trop peu fiable pour être publié (c.v. de 25 % et plus).

Taux de réponse :

Le taux de réponse à la phase d'estimation était de 74 %.

Biais de non-réponse :

En plus d'augmenter la variance, la non-réponse peut donner lieu à des estimations biaisées si les non-répondants présentent des caractéristiques différentes de celles des répondants. La non-réponse est traitée au moment de la conception de l'enquête, du suivi auprès des répondants, de la repondération, ainsi que de la vérification et de la validation des microdonnées. D'autres indicateurs de la qualité comme le taux de réponse sont également fournis.

Erreur de couverture :

Le Registre des entreprises a été utilisé comme base de sondage.

Date de modification :