Enquête annuelle sur la recherche et le développement dans l'industrie canadienne (RDIC)
Information détaillée pour 2018
Statut :
Active
Fréquence :
Annuelle
Numéro d'enregistrement :
4201
L'Enquête annuelle sur la recherche et le développement dans l'industrie canadienne vise à recueillir des données sur les dépenses et le personnel au titre de la recherche et développement qui sont utilisées pour suivre les activités scientifiques et technologiques des entreprises et des organismes industriels sans but lucratif au Canada.
Date de la parution - 26 août 2019 (perspectives); 30 janvier 2020 (données provisoires); 13 octobre 2020 (propriété intellectuelle données définitives)
- Questionnaire(s) et guide(s) de déclaration
- Aperçu
- Sources de données et méthodologie
- Exactitude des données
- Documentation
Aperçu
L'Enquête annuelle sur la recherche et le développement dans l'industrie canadienne (RDIC) porte sur l'ensemble des secteurs économiques des entreprises et des organismes industriels sans but lucratif au Canada qui : 1) effectuent ou financent des activités de recherche et développement (R-D); 2) ont déjà déclaré des dépenses de R-D et qui ont récemment versé ou reçu des paiements liés à la technologie. L'enquête comprend des entreprises et des organismes industriels sans but lucratif dans toutes les industries du Système de classification des industries de l'Amérique du Nord, à l'exception des universités (61131 - Universités) et de tous les ordres de l'administration publique (91 - Administrations publiques).
Les définitions et les concepts employés pour recueillir et diffuser les données sur la R-D sont présentés dans le Manuel de Frascati de 2015 (Organisation de coopération et de développement économiques, 2015). Par conséquent, la R-D pourrait être définie ainsi :
« La R-D englobent les activités créatives et systématiques entreprises en vue d'accroître la somme des connaissances - y compris la connaissance de l'humanité, de la culture et la société - et de concevoir de nouvelles applications à partir des connaissances disponibles. »
L'enquête RDIC permet de recueillir des données sur les dépenses intra-muros de R-D et le personnel affecté à la R-D, les dépenses associées aux activités de R-D exécutée en sous-traitance ainsi que les paiements versés et reçus liés à la technologie.
Les dépenses intra-muros de R-D comprennent les dépenses courantes (c.-à-d., les salaires et traitements des employés permanents, temporaires et occasionnels, les services appuyant la R-D, les ressources de R-D et toutes les autres dépenses courantes) et les dépenses en immobilisations (c.-à-d., les logiciels, les terrains, les bâtiments et les structures, le matériel, les machines et toutes les autres dépenses en immobilisations). Les dépenses intra-muros de R-D se caractérisent selon leur répartition géographique (provinces et territoires), leurs sources de financement (secteur d'origine au Canada ou à l'étranger), les domaines de R-D et la nature de l'activité de R-D (recherche fondamentale, recherche appliquée et développement expérimental).
Le personnel affecté à la R-D est composé des chercheurs et des gestionnaires de la recherche, du personnel technique, administratif et de soutien de la R-D et d'autres personnes qui occupent des postes liés à la R-D. Ces données sont disponibles selon la répartition géographique (provinces et territoires).
Les dépenses associées aux activités de R-D exécutées en sous-traitance comprennent les paiements versés à d'autres organismes afin qu'ils effectuent des travaux de R-D et peuvent être destinés à d'autres organismes (comme des entreprises, des organismes sans but lucratif du secteur privé, des instituts ou des organismes de recherche industrielle, des hôpitaux, des universités, des ministères ou des organismes fédéraux, provinciaux ou territoriaux, des organismes provinciaux ou territoriaux de recherche ou d'autres organisations ou particuliers) qui se situent au Canada ou à l'étranger.
Les paiements liés à la technologie comprennent les paiements versés ou reçus pour des brevets, des droits d'auteur, des marques de commerce, des dessins industriels et de topographie de circuits intégrés, des logiciels originaux, des logiciels de série, des bases de données dont la durée de vie est supérieure à un an, de l'assistance technique, des procédés industriels et du savoir-faire. Les paiements liés à la technologie peuvent être reçus d'organisations affiliées ou non, ou leur être versés, au Canada ou à l'étranger.
Activité statistique
L'enquête est menée dans le cadre du Programme intégré de la statistique des entreprises (PISE). Le PISE a été conçu pour intégrer les quelque 200 enquêtes auprès des entreprises dans un même programme d'enquête principal. L'instrument d'enquête respecte la présentation, la structure et le contenu communs des enquêtes-entreprises dans ce programme intégré.
Période de référence : La date de fin de l'exercice financier qui se situe entre le 1er avril de l'année de référence et le 31 mars de l'année précédant l'année de référence.
Période de collecte : Décembre à avril suivant la période de référence.
Sujets
- Recherche et développement
- Sciences et technologie
Sources de données et méthodologie
Population cible
La population cible comprend toutes les entreprises et organismes industriels sans but lucratif qui effectuent ou qui financent des activités de recherche et développement (R-D) ou qui ont déjà engagé des dépenses de R-D et qui continuent de verser ou de recevoir des paiements liés à la technologie pendant la période de référence. Il s'agit d'une enquête qui vise tous les secteurs économiques, y compris tous les codes du Système de classification des industries de l'Amérique du Nord, à l'exception des codes 61131 - Universités et 91 - Administrations publiques.
Élaboration de l'instrument
Deux questionnaires sont utilisés dans le cadre de l'Enquête annuelle sur la recherche et le développement dans l'industrie canadienne : un premier pour les entreprises et un second pour les organismes industriels sans but lucratif. Ces questionnaires ont été conçus afin qu'ils soient conformes aux normes internationales en ce qui a trait aux concepts de recherche et développement (Organisation de coopération et de développement économiques, Manuel de Frascati, 2015). Le questionnaire électronique est le principal mode de collecte.
Échantillonnage
Il s'agit d'une enquête transversale par échantillon.
L'Enquête annuelle sur la recherche et le développement dans l'industrie canadienne est un échantillon d'entreprises stratifié selon 57 groupes d'industries uniques, la taille de recherche et développement et la région géographique.
Sources des données
Collecte des données pour cette période de référence : 2019-08-27 à 2020-06-30
Il s'agit d'une enquête à participation obligatoire.
Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.
Questionnaire électronique avec suivi des cas de non-réponse et suivi des questionnaires rejétés au contrôle.
Les données administratives sont celles qui ont été obtenues à des fins administratives (par exemple, pour administrer, réglementer ou imposer des activités des entreprises ou des particuliers) et non à des fins statistiques. L'utilisation de données administratives permet de réduire les coûts de la collecte de données et le fardeau de réponse. Les concepts ou les définitions des variables des données administratives diffèrent de ceux indiqués dans la conception de l'enquête. La source de données administratives ne couvre pas l'ensemble de la population cible et, par conséquent, donnera lieu à des erreurs d'échantillonnage. La portion non couverte par les données fiscales a été déterminée avec des unités à tirage obligatoire afin de corriger les problèmes éventuels d'erreurs d'échantillonnage. Les erreurs non dues à l'échantillonnage et les biais peuvent être présents en raison de la méthode de collecte de données.
Les données administratives sont utilisées à diverses fins statistiques : remplacer ou compléter la collecte de données directe pour réduire les coûts et le fardeau de réponse; réaliser des gains d'efficience dans les activités statistiques, par exemple, suite à leur utilisation pour la création de bases de sondage, la conception de plans de sondage, l'imputation, l'estimation. En collaboration avec les fournisseurs de données, Statistique Canada utilise son mandat en vertu de la Loi sur la statistique pour accéder à des données administratives à des fins statistiques.
La confidentialité des données administratives portant sur des particuliers, des entreprises ou des organismes (désignées sous le nom de données administratives identifiables) doit être strictement maintenue comme l'exige le paragraphe 17(1) de la Loi sur la statistique.
Les données du programme d'encouragements fiscaux pour la recherche scientifique et le développement expérimental (RS&DE) sont utilisées pour le remplacement des données des unités à tirage nul. Toutefois, la RS&DE ne tient pas compte des dépenses en immobilisations et des coûts de location en recherche et développement (R-D), des dépenses en R-D dans les sciences sociales et les sciences humaines ou des paiements au titre de la R-D réalisée par des organismes de l'extérieur du Canada.
Les données sur les déclarations de revenus des sociétés (déclaration T2) fournies par l'Agence du revenu du Canada (ARC) renferment des renseignements sur le revenu recueillis précédemment dans le cadre de l'enquête.
Les données du Relevé de compte de retenues à la source courantes (PD7A) fournies par l'ARC servent à générer des catégories de taille d'effectifs (selon la variable du nombre d'employés) à des fins de diffusion.
Outre les données recueillies dans le cadre de l'enquête, les données administratives approuvées du programme d'encouragements fiscaux pour la RS&DE provenant de l'ARC sont utilisées pour le remplacement des données des unités à tirage nul. Ces données sont utilisées pour l'imputation des unités de non-réponse et pour réduire le fardeau de réponse des plus petites unités.
Les enregistrements sont appariés en fonction de la racine du numéro d'entreprise. La définition de R-D de Statistiques Canada est différente de celle de l'ARC, car elle ne tient pas compte de toutes les dépenses en immobilisations liées à la R-D, des coûts de location des biens d'équipement et des dépenses en R-D dans les sciences sociales et les sciences humaines.
Voir le(s) Questionnaire(s) et guide(s) de déclaration.
Détection des erreurs
La détection des erreurs fait partie intégrante des activités de collecte et de traitement des données. Des vérifications automatisées sont appliquées aux enregistrements de données durant la collecte afin de repérer les erreurs de déclaration et de saisie. Ces vérifications permettent de détecter les erreurs potentielles d'après les variations d'une année à l'autre des variables, des totaux et des ratios clés qui dépassent les seuils de tolérance, ainsi que les problèmes de cohérence des données recueillies (p. ex. le total d'une variable n'est pas égal à la somme de ses parties). D'autres vérifications sont utilisées pendant le traitement des données afin de détecter automatiquement les erreurs ou les incohérences qui subsistent après la collecte. Ces vérifications comprennent les contrôles de valeurs (p. ex. Valeur > 0, Valeur > -500, Valeur = 0), les contrôles d'égalité linéaire (p. ex. Valeur1 + Valeur2 = Valeur Totale), les contrôles d'inégalité linéaire (p. ex. Valeur1 >= Valeur2) et les contrôles d'équivalence (p. ex. Valeur1 = Valeur2). Les erreurs repérées peuvent être corrigées en utilisant le processus de suivi des questionnaires rejetés au contrôle durant la collecte ou par imputation. Les valeurs extrêmes sont aussi signalées comme étant des valeurs aberrantes, au moyen de méthodes automatisées fondées sur la distribution des renseignements recueillis. Les valeurs détectées font ensuite l'objet d'un examen visant à en évaluer la fiabilité. L'examen manuel d'autres unités peut entraîner la détection d'autres valeurs aberrantes. Celles-ci sont exclues du calcul des ratios et des tendances utilisés pour l'imputation et pendant l'imputation par donneur. En général, tous les efforts sont déployés pour réduire les erreurs non dues à l'échantillonnage, à savoir les erreurs d'omission, de duplication, de classification erronée, de déclaration et de traitement.
Imputation
En cas de non-réponse ou de réponses incomplètes au questionnaire, ou lorsque les données déclarées sont considérées comme incorrectes aux étapes de détection des erreurs, la méthode de l'imputation est utilisée pour compléter ou corriger les renseignements. De nombreuses méthodes d'imputation peuvent être utilisées pour remplir un questionnaire, y compris les modifications manuelles apportées par un analyste. Les techniques statistiques automatisées qui sont employées pour imputer les données manquantes comprennent :
- l'imputation déterministe (p. ex. l'ajout d'éléments pour créer un total);
- le remplacement par des valeurs prévues déclarées antérieurement pour les valeurs de la période en cours (on demande d'indiquer les valeurs de l'année de référence [AR] ainsi que de l'AR+1 et de l'AR+2 pour les variables clés);
- le remplacement par des données historiques (avec calcul de tendance, s'il y a lieu);
- le remplacement par des renseignements auxiliaires obtenus auprès d'autres sources;
- le remplacement fondé sur les relations connues entre les données pour l'unité d'échantillonnage;
- le remplacement par des données tirées d'une unité semblable de l'échantillon (connu aussi sous le nom d'imputation par donneur).
Pour les enquêtes sur la recherche et développement (R-D), la principale question sur les dépenses intra-muros de R-D est d'abord vérifiée ou imputée; ces valeurs sont ensuite utilisées comme points d'ancrage aux étapes subséquentes pour imputer d'autres variables connexes.
L'imputation permet de produire un fichier de microdonnées complet et cohérent qui couvre toutes les variables d'enquête.
Estimation
L'échantillon utilisé pour l'estimation résulte d'un processus d'échantillonnage à une phase. Un poids d'échantillonnage initial (le poids déterminé par le plan d'échantillonnage) est calculé pour chaque unité de l'enquête et correspond simplement à l'inverse de la probabilité de sélection. Il est ensuite ajusté pour tenir compte des valeurs aberrantes qui auraient pu être mal classées.
Le poids calculé pour chaque unité d'échantillonnage indique combien d'autres unités elle représente. Les poids finaux sont habituellement égaux ou supérieurs à un. Les unités d'échantillonnage qui sont choisies avec certitude (unités à tirage obligatoire) ont un poids d'échantillonnage de un et ne représentent qu'elles-mêmes; les unités à valeur aberrante sont considérées comme étant mal classées et leur poids est généralement ajusté de sorte qu'elles ne représentent qu'elles-mêmes.
L'unité d'échantillonnage étant l'entreprise, elle est considérée comme une unité d'estimation. Les caractéristiques des unités d'estimation sont utilisées pour calculer des estimations agrégées, y compris la classification des industries. L'estimation pour la partie enquêtée de la population se fait par simple agrégation des valeurs pondérées de toutes les entreprises échantillonnées qui se trouvent dans le domaine d'estimation. Les estimations sont calculées pour plusieurs domaines d'estimation, comme les groupes d'industries, le pays de contrôle ou la taille de l'entreprise, en se fondant sur les données de classification les plus récentes disponibles pour l'entreprise et la période de référence de l'enquête.
Dans le cas de la partie inadmissible à l'échantillonnage (partie à tirage nul) de la population cible, une estimation de modèle est produite en utilisant deux ajustements : le premier est dérivé à partir de la relation entre deux variables étroitement liées, à savoir les dépenses intra-muros courantes provenant du questionnaire et les dépenses intra-muros courantes provenant des données fiscales; le second est utilisé pour modéliser toutes les autres variables selon les dépenses de recherche et développement (R-D) intra-muros courantes ou les dépenses de R-D exécutées en sous-traitance au Canada. L'estimation globale représente les estimations de la partie enquêtée et de la partie à tirage nulle.
Le processus d'ajustement tabulaire aléatoire (ATA) applique des modifications aléatoires et ajoute un degré d'incertitude à la précision des estimations afin de prévenir la divulgation de valeurs individuelles. Ainsi, les estimations qui pourraient donner lieu à la divulgation de la réponse d'un répondant ne seront pas diffusées. (Il convient de noter que si les estimations ajustées font partie d'un tableau comprenant des totaux ou des sous-totaux, les estimations des totaux ou des sous totaux en question seront aussi ajustées.)
Évaluation de la qualité
Avant la diffusion des données, les résultats combinés de l'enquête sont analysés afin d'en évaluer la comparabilité. Cette analyse comprend un examen détaillé des éléments suivants :
- les réponses individuelles (particulièrement pour les organismes les plus importants);
- les annonces et initiatives de financement du grand public;
- la cohérence avec les résultats d'autres enquêtes sur la recherche et développement;
- les perspectives des périodes précédentes;
- les renseignements provenant d'autres sources externes (p. ex. rapports annuels et articles de journaux).
Les estimations de l'enquête sont aussi analysées en fonction des tendances observées dans les données des cycles de collecte précédents et des reportages dans les médias.
Contrôle de la divulgation
La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent aux données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.
Le processus d'ajustement tabulaire aléatoire (ATA) applique des modifications aléatoires et ajoute un degré d'incertitude à la précision des estimations afin de prévenir la divulgation de valeurs individuelles. Ainsi, les estimations qui pourraient donner lieu à la divulgation de la réponse d'un répondant ne seront pas diffusées. (Il convient de noter que si les estimations ajustées font partie d'un tableau comprenant des totaux ou des sous-totaux, les estimations des totaux ou des sous totaux en question seront aussi ajustées.)
Révisions et désaisonnalisation
Les données pour la période de référence de l'AR-1 sont révisées de la manière suivante :
- Ajout des nouvelles unités déterminées au moyen des données fiscales pour les entreprises qui ne sont pas dans la base de sondage au moment de la sélection de l'échantillon.
- Utilisation de nouvelles données fiscales relativement à la partie de l'échantillon formée des cas de non-réponse afin de réviser les valeurs imputées dans certains cas. Les données révisées de l'AR-1 seront diffusées avec les données provisoires de l'AR.
Exactitude des données
Les données d'enquête peuvent être sujettes à deux types d'erreurs : les erreurs d'échantillonnage et celles non dues à l'échantillonnage. Puisque cette enquête est menée en tant que recensement, aucune erreur d'échantillonnage ne peut se produire. Les erreurs non dues à l'échantillonnage ne sont pas liées à l'échantillonnage et peuvent survenir pour différentes raisons au cours de la collecte et du traitement des données.
Les erreurs non dues à l'échantillonnage comprennent :
- la non-réponse (totale et partielle);
- le sous-dénombrement ou le surdénombrement de la population;
- les écarts dans l'interprétation des questions ainsi que les erreurs de consignation;
- les erreurs de codage et de traitement des données.
Dans la mesure du possible, ces erreurs sont réduites au minimum par la conception minutieuse du questionnaire d'enquête, la vérification des données de l'enquête et le suivi auprès des répondants, le cas échéant, afin de maximiser les taux de réponse.
Les taux d'imputation peuvent être estimés pour générer un indicateur de la qualité. Le taux d'imputation est calculé en fonction de la contribution des valeurs imputées pour l'estimation totale. Les codes d'indicateurs de la qualité utilisent les lettres de A à F, où A signifie que la qualité des données est jugée excellente et F, que les données sont trop peu fiables pour être publiées.
Documentation
- Changements apportés à l'enquête pour l'année de référence 2014
- Date de modification :