Enquête sur l'innovation et les stratégies d'entreprise

Information détaillée pour 1 janvier 2020 à 31 décembre 2022

Statut :

Active

Fréquence :

Aux 3 ans

Numéro d'enregistrement :

5171

L'Enquête sur l'innovation et les stratégies d'entreprise recueille des renseignements sur les décisions stratégiques, les activités d'innovation, les stratégies opérationnelles et la participation aux chaînes de valeur mondiales des entreprises au Canada.

Date de la parution - 20 février 2024

Aperçu

L'Enquête sur l'innovation et les stratégies d'entreprise (EISE) touche l'ensemble de l'économie et elle est menée auprès d'entreprises et d'organismes industriels sans but lucratif au Canada.

Les concepts et les définitions utilisés pour recueillir et diffuser les données sur l'innovation sont présentés dans le Manuel d'Oslo : Principes directeurs pour le recueil et l'interprétation des données sur l'innovation, 4e édition (Organisation de coopération et de développement économiques [OCDE et Eurostat, 2018]). Selon le Manuel :

« Une innovation désigne un produit ou un processus (ou une combinaison des deux) nouveau ou amélioré qui diffère sensiblement des produits ou processus précédents d'une unité et a été mis à la disposition d'utilisateurs potentiels (produit) ou mis en oeuvre par l'unité (processus). »

L'EISE recueille des renseignements commerciaux qualitatifs complémentaires, y compris les caractéristiques du marché, l'utilisation de technologies de pointe, les stratégies d'entreprise, les pratiques commerciales et la participation aux chaînes de valeur mondiales. L'enquête recueille également des renseignements quantitatifs sur les ventes totales, les dépenses en innovation, l'achat de biens et de services, et le personnel, auxquels s'ajoutent des répartitions en pourcentage par sous groupe précis.

Période de référence : L'année de référence de l'enquête est 2022. De l'information est aussi collectée pour les trois années civiles (2020 à 2022).

Période de collecte : De janvier à mars de l'année suivant la période de référence.

Sujets

  • Innovation
  • Rendement des entreprises et propriété
  • Sciences et technologie

Sources de données et méthodologie

Population cible

La population cible de l'Enquête sur l'innovation et les stratégies d'entreprise comprend seulement les entreprises identifiées de l'un ou l'autre des 14 secteurs suivants selon le Système de classification des industries de l'Amérique du Nord (SCIAN, Statistique Canada, 2017) :

- Agriculture, foresterie, pêche et chasse (11)
- Extraction minière, exploitation en carrière, et extraction de pétrole et de gaz (21)
- Services publics (22)
- Construction (23)
- Fabrication (31-33)
- Commerce de gros (41)
- Commerce de détail (44-45)
- Transport et entreposage (48-49)
- Industrie de l'information et industrie culturelle (51)
- Finance et assurances (52) à l'exclusion de 521 (Autorités monétaires - banque centrale) et 523910 (entités à vocation spéciale)
- Services immobiliers et services de location et de location à bail (53)
- Services professionnels, scientifiques et techniques (54)
- Gestion de sociétés et d'entreprises (55) à l'exclusion de 551113 (compagnies de portefeuille)
- Services administratifs, services de soutien, services de gestion des déchets et services d'assainissement (56)

Afin de réduire le fardeau de réponse des petites entreprises, seules les entreprises comptant au moins 20 employés et déclarant un chiffre d'affaires d'au moins 250 000 $ ont été prises en compte lors de la sélection de l'échantillon.

Élaboration de l'instrument

L'EISE utilise un questionnaire électronique (QE). On a élaboré son contenu afin qu'il soit conforme aux normes internationales pour ce qui est des concepts d'innovation (OCDE et Eurostat, 2018). Le questionnaire électronique (QE) est le principal mode de collecte, et il a été mis à l'essai auprès d'entreprises répondantes en français et en anglais afin de confirmer leur compréhension de la terminologie, des concepts et des définitions ainsi que leur capacité de fournir l'information demandée et de parcourir les applications du QE.. La ronde de mise à l'essai était axée sur la validation de la compréhension des répondants relative aux concepts, aux questions et à la terminologie, de la pertinence des catégories de réponse et de l'accessibilité de l'information demandée.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

La population cible a été stratifiée selon le Système de classification des industries de l'Amérique du Nord (SCIAN) Canada 2017, par région et en trois catégories de taille en fonction du nombre d'employés de l'entreprise.

Le plan de sondage a exigé un recensement de toutes les grandes entreprises faisant partie des 14 secteurs. L'échantillon a été sélectionné pour satisfaire à deux grands objectifs :

1) Produire des estimations de proportions relatives à des caractéristiques définies pour le Canada et pour certaines provinces et régions, avec une erreur type cible (mesure de la qualité) pour satisfaire aux exigences relatives aux estimations selon l'effectif et l'industrie. L'échantillon n'est pas conçu pour produire des estimations selon l'effectif, le niveau géographique et l'industrie.

2) Permettre l'analyse des microdonnées dans un environnement de fichiers couplés.

Unité d'échantillonnage:
Entreprise

Méthode de stratification:
La stratification à l'échelle nationale correspond aux entreprises ayant au moins 250 000 $ de revenus au sein des groupements industriels visés et aux catégories de taille d'entreprise (en fonction du nombre d'employés) :

- Petites entreprises (20 à 99)
- Moyennes entreprises (100 à 249)
- Grandes entreprises (250 ou plus)

La stratification à l'échelle régionale correspond aux entreprises ayant au moins 250 000 $ de revenus au sein des groupements industriels visés pour les régions suivantes : la région de l'Atlantique, le Québec, l'Ontario, l'Alberta et le reste du Canada. Les provinces qui ne sont pas énumérées n'ont pas été échantillonnées individuellement.

Échantillonnage et sous-échantillonnage:
La taille de l'échantillon de l'enquête est de 15,103 entreprises parmi les 74,230 entreprises qui constituent la population cible. Le taux de réponse attendu est de 50 % par strate. Les erreurs type cibles pour le calcul des estimations en proportions sont les suivantes :

- 7,2 % pour le SCIAN2 (11, 22, 23, 44-45, 49, 53, 55, 56) selon la taille de l'effectif
- 5,0 % pour le SCIAN2 (21, 31-33, 41, 48, 51, 52, 54) selon la taille de l'effectif
- 9,1 % pour le SCIAN3 selon la taille de l'effectif
- 10,0 % pour le SCIAN4 selon la taille de l'effectif
- 12,0 % pour le SCIAN5 selon la taille de l'effectif
- 12,0 % pour le SCIAN6 selon la taille de l'effectif
- 9,3 % pour l'Alberta, la région de l'Atlantique, le Québec et l'Ontario
- 12,0 % pour le reste du Canada

Sources des données

Collecte des données pour cette période de référence : 2023-01-17 à 2023-03-31

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants.

Il s'agit d'une enquête à participation obligatoire, sauf pour la question relative aux caractéristiques démographique du chef d'entreprise qui est volontaire.

Les données sont obtenues directement auprès des répondants.

Les données ont été recueillies au moyen d'un questionnaire électronique (QE), et il y avait un suivi des cas de non réponse et un suivi des questionnaires rejetés au contrôle pour les questions prioritaires.

Les questions 1, 2, 18, 22, 23, 24, 30, 38, 48 et 54 sont obligatoires.

Des données administratives (T2, PD7 et données des exportateurs) seront utilisées aux fins de validation des données et pour faciliter l'imputation seulement.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

La détection des erreurs fait partie intégrante des activités de collecte et de traitement des données. Des vérifications automatisées sont appliquées aux enregistrements de données durant la collecte afin de repérer les erreurs de déclaration. D'autres vérifications sont utilisées pendant le traitement des données afin de détecter automatiquement les erreurs ou les incohérences qui subsistent après la collecte. Les données incohérentes sont corrigées en fonction des réponses à des questions de contrôle clés. En l'absence de questions de contrôle, les données sont corrigées en fonction des données déclarées pour la section ou par imputation selon les réponses de la strate.

Les répondants sont demandés de déclarer les ventes et les dépenses en milliers de dollars. Les totaux sont examinés pour veiller à ce qu'il n'y ait pas d'erreurs de déclaration concernant l'ordre de grandeur.

Imputation

L'imputation est effectuée pour traiter les éléments de non-réponse.

Les non réponses partielles sont imputées par la méthode de l'enregistrement donneur et du plus proche voisin dans le système généralisé BANFF. Cette méthode permet de trouver, pour chaque enregistrement exigeant une imputation des réponses, l'enregistrement valide le plus semblable, ce qui permet ainsi à l'enregistrement receveur imputé d'être accepté suivant les vérifications d'imputation précisées et les règles de post-vérification.

Il est possible de trouver des enregistrements semblables en tenant compte d'autres variables en corrélation avec les valeurs manquantes au moyen des classes d'imputation personnalisées et des variables correspondantes (au besoin) pour chaque élément (variable) à imputer. Lorsqu'il n'est pas possible de trouver des enregistrements donneurs selon la méthode du plus proche voisin pour tous les enregistrements receveurs, il faut adopter une méthode moins restrictive en modifiant les classes d'imputation et en traitant à nouveau les données. Ce processus d'imputation se poursuit selon une séquence prédéterminée, jusqu'à ce que des enregistrements donneurs, selon la méthode du plus proche voisin, aient été attribués à tous les enregistrements à imputer ou qu'il ne reste plus d'enregistrements donneurs, selon la méthode du plus proche voisin. Des vérifications et des postvérifications sont effectuées durant l'imputation pour que l'enregistrement résultant n'enfreigne aucune des règles de vérification précisées.

Estimation

Les valeurs de réponse des unités échantillonnées ont été multipliées par un poids final pour obtenir une estimation pour l'ensemble de la population. Le poids final a été calculé au moyen d'un certain nombre de facteurs, y compris la probabilité qu'une unité soit sélectionnée dans l'échantillon et l'ajustement pour les unités qui n'ont pas pu être jointes ou qui ont refusé de répondre. L'utilisation d'une technique statistique appelée le calage permet d'ajuster l'ensemble final de poids de manière à ce que l'échantillon représente le plus fidèlement possible la population entière.

L'erreur d'échantillonnage a été mesurée selon l'erreur type (ET), pour les proportions, et selon le coefficient de variation (c.v.), qui représente la proportion de l'estimation qui provient de la variabilité qui lui est associée. Les ET et les c.v. ont été calculés et ils sont signalés au moyen d'indicateurs de la qualité dans les tableaux de données.

Le processus d'ajustement tabulaire aléatoire (ATA) applique des modifications aléatoires et ajoute un degré d'incertitude à la précision des estimations afin de prévenir la divulgation de valeurs individuelles. Ainsi, les estimations qui pourraient donner lieu à la divulgation de la réponse d'un répondant ne seront pas diffusées. (Il convient de noter que si les estimations ajustées font partie d'un tableau comprenant des totaux ou des sous-totaux, les estimations des totaux ou des sous totaux en question seront aussi ajustées.)

Évaluation de la qualité

L'Enquête sur l'innovation et les stratégies d'entreprise de 2022 comportait deux principaux types de questions :

- Questions qualitatives : case à cocher (Oui/Non; Oui/Non/Ne sait pas; Oui/Non/Ne s'applique pas; Sélectionner une réponse; Sélectionner toutes les réponses qui s'appliquent; Échelle de Likert)
- Questions quantitatives : monnaie (milliers de dollars); emploi (personnel équivalent temps plein [ETP]); répartitions en pourcentage (la somme des composantes est de 100 %)

La validation des données pour les questions qualitatives consistait à s'assurer du respect de l'enchaînement des questions, pour confirmer que la bonne population avait répondu à chacune des questions, et à veiller à la cohérence dans une question et entre les questions d'un module thématique ainsi qu'à la cohérence entre les questions du questionnaire.

Pour les questions quantitatives, deux processus de validation principaux ont été menés : la cohérence et la confrontation des données. La cohérence des données consiste à examiner différentes parties du questionnaire qui portent sur des questions directement ou indirectement liées pour veiller à ce que les réponses soient cohérentes avec ce qui a été observé dans la pratique.

Exemple : les revenus par employé se situeront dans une fourchette donnée pour chaque strate (groupe selon la taille de l'entreprise). Si un enregistrement se situe largement à l'extérieur de la fourchette des valeurs typiques, la confrontation des données peut alors être utilisée pour relever une erreur possible, comme la déclaration en dollars plutôt qu'en milliers de dollars ou la déclaration pour une composante de l'entreprise plutôt que pour l'entreprise au complet.

La confrontation des données consiste à comparer la réponse du répondant avec d'autres sources d'information à propos de ce répondant en particulier ou d'autres entreprises au sein de cette industrie. Pour l'EISE, diverses données administratives ont été obtenues aux fins de confrontation des données, y compris les suivantes :

- les données fiscales (données sur les revenus T2 utilisées pour classer selon la taille et pour comparer les réponses)
- les données sur l'emploi (PD7)
- le Registre des exportateurs (données administratives sur les exportations)
- les comparaisons historiques (si elles sont disponibles)
- l'information accessible au public au sujet de sociétés individuelles (rapports annuels des entreprises cotées en bourse, renseignements sur Internet)

Généralement, les données administratives sont disponibles pour des périodes antérieures à la période de référence de l'enquête, mais elles peuvent être utilisées pour cerner les questions concernant l'ordre de grandeur et les cas où le répondant fait une déclaration au sujet d'un autre niveau de l'entité commerciale.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer tout renseignement recueilli qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans son consentement préalable ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la divulgation de tout renseignement jugé confidentiel.

Le processus d'ajustement tabulaire aléatoire (ATA) applique des modifications aléatoires et ajoute un degré d'incertitude à la précision des estimations afin de prévenir la divulgation de valeurs individuelles. Ainsi, les estimations qui pourraient donner lieu à la divulgation de la réponse d'un répondant ne seront pas diffusées. (Il convient de noter que si les estimations ajustées font partie d'un tableau comprenant des totaux ou des sous-totaux, les estimations des totaux ou des sous totaux en question seront aussi ajustées.)

Révisions et désaisonnalisation

Cette méthodologie ne s'applique pas à cette enquête.

Exactitude des données

Deux types d'erreurs peuvent avoir une incidence sur les données : les erreurs d'échantillonnage et les erreurs non dues à l'échantillonnage. Des erreurs non dues à l'échantillonnage peuvent se produire pour diverses raisons au cours de la collecte et du traitement des données. La non réponse, par exemple, est une source importante d'erreurs non dues à l'échantillonnage. Le sous dénombrement ou le surdénombrement de la population, les différences d'interprétation des questions et les erreurs dans la consignation et le traitement des données sont d'autres exemples d'erreurs non dues à l'échantillonnage. Dans la mesure du possible, ces erreurs sont réduites au minimum par une conception soignée du questionnaire d'enquête et par une vérification des données d'enquête.

Les indicateurs d'exactitude des données utilisés sont l'erreur type et le coefficient de variation. L'erreur type est une mesure statistique communément utilisée qui indique l'erreur d'échantillonnage que comporte une estimation. Le coefficient de variation est l'erreur type exprimée en pourcentage de l'estimation.

L'erreur d'échantillonnage, le taux de réponse et le taux d'imputation sont combinés en un seul code d'évaluation de la qualité. Ce code comprend des lettres allant de A à F, où A signifie que les données sont d'excellente qualité et F signifie qu'elles ne sont pas fiables. Les estimations ayant une qualité F ne seront pas publiées. Des détails sur ces codes de qualité peuvent être demandés et doivent toujours être pris en considération lors de l'analyse des données.

Taux de réponse:
La métadonnée sera fournie lors de la diffusion.

Erreur non due à l'échantillonnage:
Des erreurs non dues à l'échantillonnage peuvent se produire pour diverses raisons au cours de la collecte et du traitement des données. Par exemple, la non réponse est une source importante d'erreurs non dues à l'échantillonnage. Le sous dénombrement ou le surdénombrement de la population, les différences d'interprétation des questions et les erreurs dans la consignation et le traitement des données sont d'autres exemples d'erreurs non dues à l'échantillonnage. Dans la mesure du possible, ces erreurs sont réduites au minimum par une conception soignée du questionnaire d'enquête et par une vérification des données d'enquête.

Biais de non-réponse:
En plus d'augmenter la variance, la non réponse peut donner lieu à des estimations biaisées si les non répondants présentent des caractéristiques différentes de celles des répondants. La non réponse est traitée au moment de la conception de l'enquête, du suivi auprès des répondants, de la repondération, ainsi que de la vérification et de la validation des microdonnées.
En cas de non réponse, celle-ci est prise en compte, et la qualité de l'estimation est réduite en fonction de son importance dans l'estimation.

Erreur de couverture:
Les erreurs de couverture comprennent les omissions, les inclusions erronées, les doubles comptes et les classifications erronées dans la base de sondage.
Le Registre des entreprises (RE) a été utilisé comme base. Le RE est un centre de services de données mis à jour à l'aide de plusieurs sources, notamment les fichiers de données administratives, les commentaires reçus dans le cadre des enquêtes entreprises de Statistique Canada et les activités d'établissements de profils, qui comprennent un contact direct avec les entreprises pour obtenir des renseignements sur leurs activités ainsi que les résultats de recherche sur Internet.

Autres erreurs non dues à l'échantillonnage:

Erreurs de réponse
Les erreurs de réponse se produisent lorsque les données sont demandées, fournies, reçues ou enregistrées incorrectement. Ces erreurs sont causées par les facteurs suivants :

- une piètre conception du questionnaire;
- une interview biaisée;
- les erreurs du répondant;
- les problèmes avec le processus d'enquête.

Erreurs dues à la non réponse
Les erreurs dues à la non réponse se produisent lorsque le répondant n'a pas donné suffisamment de réponses aux questions de l'enquête. Il y a deux types d'erreurs de non réponse : complète et partielle.

Erreurs de traitement
Les erreurs de traitement se produisent parfois pendant la préparation des fichiers de données définitifs. Par exemple, des erreurs peuvent se produire lorsque les données sont codées, saisies, corrigées ou imputées.

Erreurs d'estimation
Si une méthode d'estimation inappropriée est utilisée, le biais peut persister à l'étape de l'estimation, même si l'enquête était sans erreur avant l'estimation.

Erreurs d'analyse
Les erreurs d'analyse se produisent lorsque les mauvais outils ou méthodes d'analyse sont utilisés. Les erreurs qui se produisent pendant la publication des résultats des données sont également considérées comme des erreurs d'analyse.

Date de modification :