Enquête annuelle sur le développement de logiciels et les services informatiques

Information détaillée pour 2000

Statut :

Active

Fréquence :

Annuelle

Numéro d'enregistrement :

2410

Cette enquête sert à réunir les données nécessaires à une analyse statistique de l'industrie du développement de logiciels et des services informatiques.

Date de la parution - 22 juillet 2002

Aperçu

L'objectif de cette enquête est de recueillir et de publier des données auprès des établissements dont l'activité principale est la prestation de services informatiques, de services de traitement de données, de services Internet, ou des services d'éditeurs de logiciels au Canada.

Ces renseignements peuvent être utilisés par les entreprises comme une analyse de marché; par les associations de marchands pour étudier le rendement et les autres caractéristiques de leur industrie; par l'administration publique pour élaborer des politiques nationales et régionales; par d'autres utilisateurs impliqué dans la recherche ou les prises de décision.

Activité statistique

Cette enquête fait partie du Programme des industries de service. Les données recueillies permettent de compiler des statistiques agrégées pour plus de trente groupes d'industries de services. Il existe des statistiques financières portant notamment sur les revenus, les dépenses et les profits pour toutes les enquêtes faisant partie de ce programme. En outre, plusieurs enquêtes permettent de compiler et de diffuser des données propres à une industrie.

Période de référence : année civile

Sujets

  • États financiers et rendement
  • Information et culture
  • Rendement des entreprises et propriété
  • Services aux entreprises, aux consommateurs et liés à la propriété
  • Services professionnels, scientifiques et techniques

Sources de données et méthodologie

Population cible

La population cible est constituée de tous les établissements statistiques (parfois appelés entreprises ou unités) considérés comme conception de systèmes informatiques et services connexes (SCIAN 541510), éditeurs de logiciels (SCIAN 511210) et services de traitement de données, hébergement de données et services connexes (SCIAN 514210) dans le Système de classification de 1997 des industries de l'Amérique du Nord (SCIAN) au cours de l'année de référence.

Élaboration de l'instrument

Le questionnaire de 1999 de l'Enquête annuelle sur le développement de logiciels et les services informatiques a été soumis à des test sur le terrain en octobre 1999 par Statistique Canada. Suite à des contacts avec les répondants et les utilisateurs, quelques modifications ont été incorporées dans le questionnaire depuis 1999 afin de tenir compte de la nature changeante de l'industrie enquêtée.

Échantillonnage

Il s'agit d'une enquête par échantillon.

Le plan d'enquête reposait sur un échantillonnage probabiliste et d'appliquait uniquement à la partie du plan admissible à la collecte directe de données.

Avant le tirage d'un échantillon aléatoire, les établissements sont classés en groupes homogènes (c.-à-d. des groupes portant les mêmes codes SCIAN, se trouvant dans la même province ou le même territoire et comptant le même type d'entreprise (constituée/non constituée). Des exigences de qualité sont établies puis chaque groupe est réparti en sous-groupes appelés strates : tirage complet, tirage obligatoire et tirage partiel.

La strate à tirage complet englobe les principales sociétés sur le plan du rendement sectoriel (selon les revenus). Chaque entreprise est incluse dans l'échantillon, ce qui signifie que chacune se représente elle-même et reçoit un poids de un. La strate à tirage obligatoire est aussi constituée d'unités autoreprésentatives, mais celles-ci sont prélevées en fonction des caractéristiques d'une structure complexe (entreprises à plusieurs établissements, à plusieurs entités juridiques, ayant plusieurs codes SCIAN ou se trouvant dans plusieurs provinces). Les unités appartenant aux strates à tirage partiel font l'objet d'un tirage aléatoire simple.

Enfin, la taille de l'échantillon est augmentée, surtout pour compenser pour les entreprises qui n'appartiennent plus à ce secteur : c'est-à-dire celles qui ont fermé leurs portes, celles dont l'activité principale a changé, celles qui sont inactives ou celles qui figurent en double dans la base de sondage. Une fois que ces entreprises ont été supprimées, la taille de l'échantillon de 2000 s'est établie à 1479 entités de collecte.

Sources des données

Collecte des données pour cette période de référence : De janvier 2001 à avril 2001

Il s'agit d'une enquête à participation obligatoire.

Les données sont obtenues directement auprès des répondants et sont tirées de fichiers administratifs.

Les données sont recueillies par envoi et retour par la poste, mais les répondants ont la possibilité de répondre par téléphone ou d'utiliser d'autres méthodes de déclaration électronique.

Des procédures de suivi sont mises en place lorsqu'un questionnaire n'a pas été reçu à la fin d'une période prédéfinie.

Voir le(s) Questionnaire(s) et guide(s) de déclaration .

Détection des erreurs

Au moyen de vérifications automatisées et d'un examen analytique, les données sont examinées afin d'y déceler tout manque de cohérence ou erreur. Quand c'est possible, les données sont vérifiées en utilisant d'autres sources.

Imputation

On a complété les enregistrements partiels par imputation. Les données pour les non-répondants ont été imputées soit par enregistrements donneurs, soit à l'aide de données administratives ou de données historiques.

Estimation

Dans le cadre du processus de l'estimation, les données de l'enquête ont été pondérées et combinées avec les données administratives pour produire les estimations finales de l'industrie.

Évaluation de la qualité

Avant d'être diffusés, les résultats combinés de l'enquête sont analysés pour la qualité globale; en général, cette opération consiste à examiner en détail les réponses individuelles (surtout celles des grandes sociétés), à revoir la conjoncture générale et les tendances historiques et enfin à comparer ces résultats à d'autres sources de données.

Contrôle de la divulgation

La loi interdit à Statistique Canada de divulguer toute information recueillie qui pourrait dévoiler l'identité d'une personne, d'une entreprise ou d'un organisme sans leur permission ou sans en être autorisé par la loi. Diverses règles de confidentialité s'appliquent à toutes les données diffusées ou publiées afin d'empêcher la publication ou la divulgation de toute information jugée confidentielle. Au besoin, des données sont supprimées pour empêcher la divulgation directe ou par recoupement de données reconnaissables.

Exactitude des données

Malgré les efforts déployés pour que les opérations de collecte et de dépouillement se déroulent en fonction de normes rigoureuses, les estimations qui en résultent comportent inévitablement des erreurs. Celles-ci sont classées en deux grandes catégories : les erreurs d'échantillonnage et les erreurs non dues à l'échantillonnage.

Les erreurs non dues à l'échantillonnage ne sont pas liées à l'échantillonnage et peuvent survenir pour de nombreuses raisons. Par exemple, la non-réponse est une source importante d'erreurs non dues à l'échantillonnage. La couverture de la population, les écarts dans l'interprétation des questions, les mauvaises réponses des répondants et les erreurs de consignation, de codage et de traitement des données représentent d'autres exemples d'erreurs non liées à l'échantillonnage.

Le taux de réponse pour cette enquête a été de 60 % dans l'année de référence 2000, après avoir tenu compte des firmes ne faisant plus partie de l'industrie, c'est à dire qui ont fait faillite, qui ont changé la nature de leurs activités, qui sont inactives ou encore qui ont été rentrées deux fois dans le fichier informatique.

Les erreurs d'échantillonnage se produisent parce que les estimations proviennent d'un échantillon de la population plutôt que de la population entière. Ces erreurs dépendent de divers facteurs, notamment la taille de l'échantillon, le plan d'échantillonnage et la méthode d'estimation. Une des propriétés importantes de l'échantillonnage probabiliste tient au fait que les erreurs d'échantillonnage peuvent être calculées à partir de l'échantillon à l'aide d'une mesure statistique appelée coefficient de variation (CV). Pour des enquêtes menées à plusieurs reprises, l'écart relatif entre l'estimation d'un échantillon et l'estimation qu'on aurait obtenue d'un dénombrement de toutes les unités serait inférieur à deux fois le coefficient de variation, 95 fois sur 100. L'éventail des données acceptables d'un échantillon s'appelle l'intervalle de confiance. Les intervalles de confiance peuvent êtres calculés autour des estimations en utilisant les CV. Premièrement, nous calculons l'erreur type en multipliant l'estimation d'un échantillon par le CV. L'estimation d'un échantillon plus ou moins deux fois l'erreur type est ce qu'on appelle l'intervalle de confiance de 95 %.

Pour l'enquête annuelle sur le développement de logiciels et les services informatiques les CV ont été calculés pour chaque estimation produite. De façon générale, les variables déclarées plus fréquemment ont résulté en de très bons CV (10 % ou moins), tandis que les variables déclarées moins souvent ont été associées à des CV plus élevés mais néanmoins acceptables (moins de 25 %). On peut obtenir ces CV sur demande.

Date de modification :