Enquête annuelle sur la recherche et le développement dans l'industrie canadienne (RDIC)

Information détaillée pour 2018

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

4201

L'enquête annuelle sur la Recherche et développement dans l'industrie canadienne vise à recueillir des données sur les dépenses et le personnel affectés à la recherche et développement (R-D) qui sont utilisées pour suivre les activités scientifiques et technologiques des entreprises et des organismes industriels sans but lucratif au Canada.

Date de la parution - Prévue pour le 10 juillet 2020

Aperçu

L'enquête Recherche et développement dans l'industrie canadienne (RDIC) porte sur l'ensemble des secteurs économiques des entreprises et des organismes industriels sans but lucratif au Canada qui 1) effectuent ou financent des activités de R-D ou qui 2) ont déjà déclaré des dépenses de R-D et qui ont récemment versé ou reçu des paiements liés à la technologie. L'enquête comprend des entreprises et des organismes industriels sans but lucratif dans tous les secteurs du Système de classification des industries de l'Amérique du Nord (SCIAN), à l'exception des universités (SCIAN 61131) et de tous les niveaux de l'administration publique (SCIAN 91 ¿ Administrations publiques).

Les définitions et les concepts employés pour recueillir et diffuser les données sur la R-D sont présentés dans le Manuel de Frascati de 2015 (Organisation de coopération et de développement économiques [OCDE], 2015). Par conséquent, la R-D pourrait être définie ainsi :

« La recherche et développement expérimental (R-D) englobent les activités créatives et systématiques entreprises en vue d'accroître la somme des connaissances - y compris la connaissance de l'humanité, de la culture et la société - et de concevoir de nouvelles applications à partir des connaissances disponibles. »

L'enquête RDIC permet de recueillir des données sur les dépenses intra-muros (internes) de R-D et le personnel affecté à la R-D, les dépenses associées aux activités de R-D exécutée en sous-traitance ainsi que les paiements versés et reçus liés à la technologie.

Les dépenses intra-muros de R-D comprennent les dépenses courantes (c.-à-d., les salaires et traitements des employés permanents, temporaires et occasionnels, les services appuyant la R-D, les ressources de R-D et toutes les autres dépenses courantes) et les dépenses en immobilisations (c.-à-d., les logiciels, les terrains, les bâtiments et les structures, le matériel, les machines et toutes les autres dépenses en immobilisations). Les dépenses intra-muros de R-D se caractérisent selon leur répartition géographique (provinces et territoires), leurs sources de financement (secteur d'origine au Canada ou à l'étranger), les domaines de R-D et la nature de l'activité de R-D (recherche fondamentale, recherche appliquée et développement expérimental).

Le personnel affecté à la R-D est composé des chercheurs et des gestionnaires de la recherche, du personnel technique, administratif et de soutien de la R-D et d'autres personnes qui occupent des postes liés à la R-D. Les données sur le personnel sont disponibles selon la répartition géographique (provinces et territoires).

Les dépenses associées aux activités de R-D imparties comprennent les paiements versés à d'autres organismes afin qu'ils effectuent des travaux de R-D et peuvent être destinés à d'autres organismes (comme des entreprises, des organismes sans but lucratif du secteur privé, des instituts ou des organismes de recherche industrielle, des hôpitaux, des universités, des ministères ou des organismes fédéraux, provinciaux ou territoriaux, des organismes provinciaux ou territoriaux de recherche ou d'autres organisations ou particuliers) qui se situent au Canada ou à l'étranger.

Les paiements liés à la technologie comprennent les paiements versés ou reçus pour des brevets, des droits d'auteur, des marques de commerce, des dessins industriels et de topographie de circuits intégrés, des logiciels originaux, des logiciels de série, des bases de données dont la durée de vie est supérieure à un an, de l'assistance technique, des procédés industriels et du savoir-faire. Ces paiements peuvent être reçus d'organisations affiliées ou non, ou leur être versés.

Activité statistique

L'enquête est menée dans le cadre du Programme intégré de la statistique des entreprises (PISE). Le PISE a été conçu pour intégrer les quelque 200 enquêtes auprès des entreprises dans un même programme d'enquête principal. L'instrument d'enquête respecte la présentation, la structure et le contenu communs des enquêtes-entreprises dans ce programme.

Période de référence : La date de fin de l'exercice financier qui se situe entre le 1er avril de l'année de référence et le 31 mars de l'année précédant l'année de référence

Période de collecte : décembre à avril suivant la période de référence

Sujets

  • Recherche et développement
  • Science et technologie

Sources de données et méthodologie

Population cible

La population cible de l'enquête RDIC comprend toutes les entreprises et organismes industriels sans but lucratif qui effectuent et/ou qui financent des activités de R-D ou qui ont déjà engagé des dépenses de R-D et qui continuent de verser ou de recevoir des paiements liés à la technologie pendant la période de référence. Il s'agit d'une enquête qui vise tous les secteurs économiques et inclut tous les codes du SCIAN, à l'exception des codes 61131 (universités) et 91 (administrations publiques).

Élaboration de l'instrument

On utilise deux questionnaires dans le cadre de l'enquête RDIC : un premier pour les compagnies et un second pour les organismes industriels sans but lucratif. On a élaboré leur contenu afin qu'ils soient conformes aux normes internationales en ce qui a trait aux concepts de R-D (OCDE, Manuel de Frascati, 2015). Le questionnaire électronique (QE) est le principal mode de collecte.

Échantillonnage

Il s'agit d'une enquête transversale par échantillon.

L'enquête RDIC est un échantillon de entreprises stratifié par : 57 groupes d'industries uniques, taille de R-D et géographie.

Sources des données

Collecte des données pour cette période de référence : 2019-08-27 à 2020-06-30

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

Questionnaire électronique avec suivi des cas de non-réponse et suivi des questionnaires rejétés au contrôle.

Les données administratives sont celles qui ont été obtenues à des fins administratives (par exemple, pour administrer, réglementer ou imposer des activités de la compagnie ou de particuliers) et non à des fins statistiques. L'utilisation de données administratives réduit le coût de la collecte de données et le fardeau de réponse. Les concepts ou les définitions des variables des données administratives diffèrent de ceux indiqués dans la conception de l'enquête. La source de données administratives ne couvre pas l'ensemble de la population cible et, par conséquent, donnera lieu à des erreurs d'échantillonnage. La portion non couverte par les données fiscales a été déterminée avec des unités à tirage obligatoire afin de corriger les problèmes éventuels d'erreurs d'échantillonnage. Les erreurs non dues à l'échantillonnage et les biais peuvent être présents en raison de la méthode de collecte de données.

Les données administratives sont utilisées à diverses fins statistiques : remplacer ou compléter la collecte de données directe pour réduire les coûts et le fardeau de réponse; réaliser des gains d'efficience dans les activités statistiques, par exemple, suite à leur utilisation pour la création de bases de sondage, la conception de plans de sondage, l'imputation, l'estimation. En collaboration avec les fournisseurs de données, Statistique Canada utilise son mandat en vertu de l'article 13 de la Loi sur la statistique pour accéder à des données administratives à des fins statistiques.

La confidentialité des données administratives portant sur des particuliers, des compagnies ou des organisations (désignées sous le nom de données administratives identifiables) doit être strictement maintenue comme l'exige le paragraphe 17(1) de la Loi sur la statistique.

Les données du programme d'encouragements fiscaux relatifs à la RS-DE servent pour le remplacement des données des unités à tirage nul. Toutefois la RS-DE ne tient pas compte des dépenses en immobilisations et des coûts de location, des dépenses en R-D dans les sciences sociales et les sciences humaines, ou des paiements au titre de la R D réalisée par des organismes de l'extérieur du Canada.

Les données sur les déclarations de revenus des sociétés (déclaration T2) fournies par l'Agence du revenu du Canada (ARC) renferment des renseignements sur le revenu recueillis précédemment dans le cadre de l'enquête.

Les données fiscales sur les retenues sur la paye (PD7) fournies par l'Agence du revenu du Canada (ARC) servent à générer des catégories de taille d'effectifs (selon la variable du nombre d'employés) à des fins de diffusion.

Les données du programme d'encouragements fiscaux relatifs à la RS-DE provenant de l'agence revenue du Canada (ARC) servent pour le remplacement des données des unités à tirage nul. Ces données sont utilisées pour l'imputation des unités de non-réponse et pour réduire le fardeau de réponse de plus petites unités.

La définition de R-D de Statistiques Canada et différente que celle de l'ARC. Toutefois la RS-DE ne tient pas compte des dépenses en immobilisations et des coûts de location, des dépenses en R-D dans les sciences sociales et les sciences humaines, ou des paiements au titre de la R-D réalisée par des organismes de l'extérieur du Canada.

Voir le(s) Questionnaire(s) et guide(s) de déclaration.

Détection des erreurs

La détection des erreurs fait partie intégrante des activités de collecte et de traitement des données. Des vérifications automatisées sont appliquées aux enregistrements de données durant la collecte afin de repérer les erreurs de déclaration et de saisie. Ces vérifications permettent de détecter les erreurs potentielles d'après les variations d'une année à l'autre des variables, des totaux et des ratios clés qui dépassent les seuils de tolérance, ainsi que les problèmes de cohérence des données recueillies (p. ex. le total d'une variable n'est pas égal à la somme de ses parties). D'autres vérifications sont utilisées pendant le traitement des données afin de détecter automatiquement les erreurs ou les incohérences qui subsistent après la collecte. Ces vérifications comprennent les contrôles de valeurs (p. ex. Valeur > 0, Valeur > -500, Valeur = 0), les contrôles d'égalité linéaire (p. ex. Valeur1 + Valeur2 = ValeurTotale), les contrôles d'inégalité linéaire (p. ex. Valeur1 >= Valeur2) et les contrôles d'équivalence (p. ex. Valeur1 = Valeur2). Les erreurs repérées peuvent être corrigées en utilisant le processus de suivi des questionnaires rejetés au contrôle durant la collecte ou par imputation. Les valeurs extrêmes sont aussi signalées comme étant des valeurs aberrantes, à l'aide de méthodes automatisées fondées sur la distribution des renseignements recueillis. Les valeurs détectées font ensuite l'objet d'un examen visant à en évaluer la fiabilité. L'examen manuel d'autres unités peut entraîner la détection d'autres valeurs aberrantes. Celles-ci sont exclues du calcul des ratios et des tendances utilisés pour l'imputation et pendant l'imputation par donneur. En général, tous les efforts sont déployés pour réduire les erreurs non dues à l'échantillonnage, à savoir les erreurs d'omission, de duplication, de classification erronée, de déclaration et de traitement.

Imputation

En cas de non-réponse ou de réponses incomplètes au questionnaire ou lorsque les données déclarées sont considérées comme incorrectes aux étapes de détection des erreurs, nous utilisons l'imputation pour compléter ou corriger les renseignements. De nombreuses méthodes d'imputation peuvent être utilisées pour remplir un questionnaire, y compris les modifications manuelles apportées par un analyste. Les techniques statistiques automatisées qui sont employées pour imputer les données manquantes comprennent :

- l'imputation déterministe (p. ex. l'ajout d'éléments pour créer un total);
- le remplacement par des valeurs prévues déclarées antérieurement pour les valeurs de la période en cours (l'enquête demande d'indiquer les valeurs de l'année de référence [AR] ainsi que de l'AR +1 et de l'AR +2 pour les variables clés);
- le remplacement par des données historiques (avec calcul de tendance, s'il y a lieu);
- le remplacement par des renseignements auxiliaires obtenus auprès d'autres sources;
- le remplacement fondé sur les relations connues entre les données pour l'unité d'échantillonnage;
- le remplacement par des données tirées d'une unité semblable de l'échantillon (connu aussi sous le nom d'imputation par donneur).

Pour les enquêtes sur la R-D dans le secteur privé, la principale question sur les dépenses intra-muros de R-D énergétique est d'abord vérifiée ou imputée, puis ces valeurs sont utilisées comme points d'ancrage aux étapes subséquentes pour imputer d'autres variables connexes.

L'imputation permet de produire un fichier de microdonnées complet et cohérent qui couvre toutes les variables d'enquête.

Estimation

L'échantillon utilisé pour l'estimation résulte d'un processus d'échantillonnage en une phase. Un poids d'échantillonnage initial (le poids déterminé par le plan d'échantillonnage) est calculé pour chaque unité de l'enquête et correspond simplement à l'inverse de la probabilité de sélection. Il est ensuite ajusté pour tenir compte des valeurs aberrantes qui auraient pu être mal classées.

Le poids calculé pour chaque unité d'échantillonnage indique combien d'autres unités elle représente. Les poids finaux sont habituellement égaux ou supérieurs à un. Les unités d'échantillonnage qui sont choisies avec certitude (unités à tirage obligatoire) ont un poids d'échantillonnage de un et ne représentent qu'elles-mêmes; les unités à valeur aberrante sont considérées comme étant mal classées et leur poids est généralement ajusté de sorte qu'elles ne représentent qu'elles-mêmes.

L'unité d'échantillonnage étant la compagnie, elle est considérée comme une unité d'estimation. On utilise les caractéristiques des unités d'estimation pour calculer des estimations agrégées, y compris la classification des industries. L'estimation pour la partie enquêtée de la population se fait par simple agrégation des valeurs pondérées de tous les compagnies échantillonnés qui se trouvent dans le domaine d'estimation. On calcule les estimations pour plusieurs domaines d'estimation tels que les groupes d'industries, le pays de contrôle, la taille de la compagnie, en se fondant sur les données de classification les plus récentes disponibles pour la compagnie et la période de référence de l'enquête.

Dans le cas de la partie inéligible à l'échantillonnage (partie à tirage nul) de la population définie, une estimation de modèle est produite en utilisant deux ajustements : le premier est dérivé à partir de la relation entre deux variables étroitement liées, à savoir les dépenses internes courantes provenant de l'enquête et les dépenses internes courantes provenant des données fiscales; le second est utilisé pour modeler toutes les autres variables selon soit les dépenses de R-D selon les dépenses internes courantes ou les dépenses totales de R-D exécutée en sous-traitance au Canada. L'estimation globale représente les estimations de la partie enquêtée et de la partie à tirage nulle.

Évaluation de la qualité

Avant la diffusion des données, on analyse les résultats combinés de l'enquête afin d'en évaluer la comparabilité. Cette analyse comprend un examen détaillé des éléments suivants :

- les réponses individuelles (particulièrement pour les organismes les plus importants);
- les annonces et initiatives de financement du grand public;
- la cohérence avec les résultats d'autres enquêtes sur la R-D;
- les perspectives des périodes précédentes;
- les renseignements d'autres sources externes (p. ex. rapports annuels et articles de journaux).

Les estimations de l'enquête sont aussi analysées en fonction des tendances observées dans les données des cycles de collecte précédents et des reportages dans les médias.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la Loi sur la statistique. Diverses règles de confidentialité s'appliquent aux données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Afin de prévenir toute divulgation de données, une analyse de confidentialité est faite à l'aide du Système de contrôle de la divulgation et de la diffusion des données économiques (SCDDDE) de Statistique Canada. Le SCDDDE est utilisé pour la suppression primaire (divulgation directe) ainsi que pour la suppression secondaire (divulgation résiduelle). Il y a divulgation directe lorsque la valeur dans une cellule de totalisation se compose de peu de déclarants ou est dominée par quelques entreprises. Il y a divulgation résiduelle lorsque des renseignements confidentiels peuvent être extraits indirectement en rassemblant des renseignements provenant de différentes sources ou séries de données.

Révisions et désaisonnalisation

Les données pour la période de référence de l'AR - 1 sont révisées de la manière suivante :
- Ajout des nouvelles unités identifiées à l'aide des données fiscales pour les compagnies qui ne sont pas dans la base de sondage au moment de la sélection de l'échantillon.
- Utilisation de nouvelles données fiscales relativement à la partie de l'échantillon formée des cas de non-réponse afin de réviser les valeurs imputées dans certains cas. Les données révisées de l'AR-1 seront diffusés avec les données préliminaires de l'AR.

Exactitude des données

Les données d'enquête peuvent être sujettes à deux types d'erreurs : les erreurs d'échantillonnage et celles non dues à l'échantillonnage. Puisque cette enquête est réalisée en tant que recensement, aucune erreur d'échantillonnage ne peut se produire. Les erreurs non dues à l'échantillonnage ne sont pas liées à l'échantillonnage et peuvent survenir pour différentes raisons au cours de la collecte et du traitement des données.
Les erreurs non dues à l'échantillonnage comprennent :

- la non-réponse (totale et partielle);
- le sous-dénombrement ou le surdénombrement de la population;
- les écarts dans l'interprétation des questions ainsi que les erreurs de consignation;
- les erreurs de codage et de traitement des données.

Dans la mesure du possible, ces erreurs sont réduites au minimum par la conception minutieuse du questionnaire d'enquête, la vérification des données de l'enquête et le suivi auprès des répondants, le cas échéant, afin de maximiser les taux de réponse.

Les taux d'imputation peuvent être estimés pour générer un indicateur de la qualité. Le taux d'imputation est calculé baser sur la contribution des valeurs imputées pour l'estimation total. Le code d'évaluation de la qualité utilise les lettres de A à F, où A signifie que la qualité des données est jugée excellente et F, que les données sont trop peu fiables pour être publiées.

Documentation

Date de modification :