Programme de la statistique du logement canadien (PSLC)

Information détaillée pour 2020

Statut :

Active

Fréquence :

Multiple

Numéro d'enregistrement :

5257

Le Programme de la statistique du logement canadien est un projet de données novateur qui tire avantage de sources de données existantes et les transforme en nouveaux indicateurs actuels du logement canadien.

Date de la parution - 17 septembre 2021 (données de la Nouvelle-Écosse, du Nouveau-Brunswick, de l'Ontario et de la Colombie-Britannique)

Aperçu

Statistique Canada a reçu le mandat de créer une base de données sur les propriétés résidentielles, qui constitue un répertoire complet de statistiques sur de nombreux aspects du secteur du logement. La base de données, qui est sous la responsabilité du Programme de la statistique du logement canadien (PSLC), renfermera des renseignements sur toutes les propriétés résidentielles du Canada, de même que sur leurs propriétaires.

La base de données a été créée à partir de données tirées de sources multiples (p. ex. rôles d'évaluation foncière, titres fonciers, Recensement de la population, etc.), et elle fournit des renseignements détaillés sur les propriétés ainsi que sur leurs propriétaires.

La base de données des propriétés résidentielles du PSLC, lancée en 2017, continue de s'élargir grâce à l'ajout de nouvelles régions et de nouvelles variables, et elle devrait contenir des renseignements sur toutes les propriétés de presque toutes les subdivisions de recensement (SDR) à l'échelle du pays d'ici décembre 2022.

Période de collecte : En cours

Sujets

  • Familles, ménages et logement
  • Logement et caractéristiques du logement
  • Services aux entreprises, aux consommateurs et liés à la propriété
  • Services immobiliers et services de location et de location à bail

Sources de données et méthodologie

Population cible

Pour le moment, le fichier de données du PSLC comprend l'ensemble des propriétés résidentielles et leurs propriétaires pour les provinces suivantes : la Nouvelle-Écosse, le Nouveau-Brunswick, l'Ontario et la Colombie-Britannique. Ce fichier contient différentes séries de données, car les données ont été transmises par plusieurs fournisseurs de données.

À l'heure actuelle, la base de données du PSLC ne contient pas de renseignements sur les propriétés résidentielles situées dans les réserves indiennes ni sur les logements collectifs (p. ex. établissements de soins infirmiers, prisons ou résidences du personnel). Les propriétés commerciales, industrielles et institutionnelles sont hors de portée pour le PSLC, car il se concentre exclusivement sur les propriétés résidentielles. Les propriétés mixtes, utilisées à des fins résidentielles et à des fins non résidentielles, sont incluses dans la base de données, mais les caractéristiques de ces propriétés incluses dans le PSLC ne reflètent que la composante résidentielle.

Élaboration de l'instrument

Ce type de méthodologie ne s'applique pas à ce programme statistique.

Échantillonnage

Ce type de méthodologie ne s'applique pas à ce programme statistique.

Sources des données

Les données sont tirées de fichiers administratifs.

Le PSLC repose sur des données existantes provenant des registres fonciers provinciaux et territoriaux, des programmes d'évaluation foncière ainsi que d'autres fichiers de données administratives pour créer une base de données de toutes les propriétés résidentielles au Canada.

Les données sur les propriétés sont tirées des registres fonciers et des programmes d'évaluation foncière. Les renseignements sur les propriétaires sont également tirés des registres fonciers et des programmes d'évaluation foncière, et diverses caractéristiques des propriétaires sont obtenues par couplage avec des données fiscales et avec celles tirées du Registre des entreprises, du Recensement de la population et de la Base de données longitudinales sur l'immigration. Ces renseignements sur les propriétaires sont complétés par des indicateurs de résidence sur le territoire économique du Canada, qui sont obtenus par couplage avec diverses sources de données, y compris les données fiscales et celles du Recensement de la population.

Les municipalités comprises dans les sources de données sont assignées aux SDR, mises à jour chaque année dans le système de classification géographique type de Statistique Canada. Certaines SDR, telles que les réserves indiennes, se situent hors de portée et ne font donc pas partie des estimations.

Le processus de couplage d'enregistrements a été mis en oeuvre au moyen de logiciels développés à Statistique Canada. Le système G-Coup, qui fait partie des systèmes généralisés de Statistique Canada, a été utilisé pour réaliser le couplage d'enregistrements probabiliste, tandis que SAS et le logiciel Mix-Match ont été utilisés pour réaliser le couplage déterministe.

Différentes sources de données sont utilisées afin de déterminer si un propriétaire est résident du Canada ou non. L'un des facteurs clés permettant de déterminer si le propriétaire est un résident canadien est le couplage de ses renseignements aux données fiscales récentes. Lorsque les renseignements du propriétaire sont couplés avec succès aux données fiscales récentes, il est très probable qu'il soit considéré comme un résident canadien. Cependant, le propriétaire pourrait être considéré comme un non-résident après avoir pris en compte d'autres critères, comme une indication d'émigration du Canada vers un pays étranger, ou l'absence du propriétaire lors du dernier Recensement de la population.

Les données diffusées font état de la liste des propriétés inscrites au rôle d'évaluation foncière de chaque province ou territoire figurant dans l'ensemble de données pour l'année de référence. Chaque organisme d'évaluation utilise sa propre date de référence pour créer les rôles d'évaluation municipaux.

La « valeur de l'évaluation foncière » réfère à la valeur de l'évaluation foncière de la propriété aux fins du calcul de l'impôt foncier. Il importe de souligner que la valeur de l'évaluation foncière ne représente pas nécessairement la valeur marchande.

Les concepts et la terminologie utilisés pour décrire les propriétés sont propres à chaque province et territoire. Dans la mesure du possible, le PSLC harmonise les différences entre les provinces et territoires.

Détection des erreurs

Tous les enregistrements de microdonnées contenus dans le PSLC sont vérifiés afin de repérer les erreurs possibles (p. ex. valeurs aberrantes, valeurs imprévues, problèmes de formatage). Des contrôles de validation sont effectués pour s'assurer que les valeurs de chaque champ se situent dans la fourchette admissible de l'élément de donnée en question. Des contrôles de corrélation sont effectués pour vérifier la compatibilité des différents éléments de donnée d'un enregistrement.

Les anomalies repérées dans les données sont corrigées avec l'aide des fournisseurs de données, et grâce à la comparaison des valeurs agrégées disponibles avec celles d'autres sources, dont le Recensement de la population et les données fiscales.

Les estimations du PSLC font l'objet de divers niveaux de détection des erreurs, allant de vérifications internes durant la production des données, à l'échantillonnage après la production des données pour détecter les erreurs de couplage. Des consultations exhaustives ont lieu avec les fournisseurs de données, relativement aux concepts et à toute anomalie repérée dans les données provenant des fichiers externes.

Imputation

Des procédures d'imputation ont été appliquées sur un sous-ensemble des données afin de combler les valeurs manquantes de la superficie habitable de certaines propriétés de la Nouvelle-Écosse, l'Ontario et la Colombie-Britannique.

Estimation

Les méthodes d'estimation ne sont actuellement pas requises.

Évaluation de la qualité

Un certain nombre de stratégies ont été élaborées et mises en place pour évaluer la qualité des données et réduire au minimum les erreurs.

Les bases de données administratives contenant des renseignements sur les propriétés font l'objet de comparaisons entre les versions, ce qui permet d'assurer la cohérence au fil du temps.

Des mesures ont été prises pour consolider et normaliser les variables ainsi que les enregistrements provenant de différentes sources de données, afin d'assurer la meilleure correspondance possible entre les enregistrements.

Les résultats du couplage font l'objet d'un examen approfondi pendant le processus de couplage afin de s'assurer que les méthodes utilisées sont adéquates. De plus, des échantillons d'enregistrements couplés sont examinés manuellement, et les estimations des taux d'erreur de couplage sont calculées pour s'assurer que les couplages sont de haute qualité.

La qualité du couplage varie d'une province et d'un territoire à l'autre en raison de la prévalence des noms communs et de la présence d'adresses non municipales, comme les boîtes postales, dans les données sources. L'écart observé dans la qualité du couplage peut avoir une incidence sur certains indicateurs tirés de ces ensembles de données couplées, comme la résidence du propriétaire et l'usage de la propriété.

D'autres problèmes mineurs liés à la qualité des données peuvent également avoir une incidence sur la qualité du couplage, laquelle a une influence plus marquée sur certaines variables, comparativement à d'autres. Bien que les estimations de la qualité soient très fiables pour la plupart des variables, l'estimation du taux de propriétés appartenant à des non-résidents est particulièrement touchée par la variation de la qualité du couplage.

L'indicateur relatif à l'usage de la propriété est également influencé par la variation de la qualité du couplage. L'indicateur est déterminé au moyen d'une méthodologie qui s'appuie sur un éventail de données, plus précisément les données sur les adresses municipales utilisées dans un algorithme pour procéder au couplage de l'adresse de la propriété à celle de résidence du propriétaire indiquée. Cet indicateur n'est pas disponible dans certaines régions où les adresses municipales se font plus rares.

Indicateurs de qualité
Un indicateur composite de qualité est disponible pour chaque estimation dans les tableaux 46-10-0027-01, 46-10-0053-01 et 46-10-0054-01. L'indicateur composite de qualité est créé en combinant de nombreux indicateurs de qualité individuels, chacun représentant les cotes de qualité de différentes étapes du traitement des données (c.-à-d. le codage, le géocodage, le couplage et l'imputation). L'indicateur composite de qualité peut prendre des valeurs de A à F, où A indique un excellent niveau de qualité, et F une qualité trop peu fiable pour être publiée. Bien que chaque lettre représente un certain niveau de qualité, chaque lettre a une définition plus détaillée, spécifique au tableau produit, qui est disponible dans les notes de bas de page de chaque tableau.

Les utilisateurs doivent prêter une attention particulière à ces définitions afin de déterminer leur propre adéquation pour l'utilisation de leurs estimations d'intérêt.

Veuillez vous référer aux notes de bas de page de chaque tableau pour obtenir la description des valeurs de l'indicateur composite de qualité liées aux estimations du tableau.

Contrôle de la divulgation

La loi interdit à Statistique Canada de rendre publique toute donnée susceptible de révéler des renseignements obtenus en vertu de la Loi sur la statistique et se rapportant à toute personne, entreprise ou organisation reconnaissable, sans que cette personne, entreprise ou organisation le sache et y consente par écrit. Diverses mesures de protection de la confidentialité sont prises à l'égard de toutes les données diffusées pour empêcher la divulgation de tout renseignement jugé confidentiel. Au besoin, des données sont supprimées ou arrondies pour empêcher la divulgation directe ou par recoupements de renseignements identificatoires.

L'utilisation du PSLC est assujettie aux contraintes de Statistique Canada en matière de confidentialité et de protection des renseignements personnels pour prévenir la divulgation de renseignements personnels.

Révisions et désaisonnalisation

Comme le PSLC est en cours d'élaboration, les données publiées peuvent faire l'objet d'une révision. Lorsque les données portant sur une juridiction donnée sont publiées pour une première fois, les données sont considérées comme expérimentales pour cette année de référence. Des corrections portant sur la cohérence des données peuvent être mises en place lors de publications subséquentes pour ces nouvelles juridictions.

Exactitude des données

L'exactitude des données peut être affectée par différents types d'erreurs : les erreurs d'échantillonnage et les erreurs non dues à l'échantillonnage. Dans le contexte du PSLC, la qualité des estimations est essentiellement définie par les erreurs non dues à l'échantillonnage, car la base de données du PSLC est un recensement de toutes les propriétés résidentielles au Canada fondé sur des fichiers administratifs. Les différents aspects de la qualité affectés par les erreurs non dues à l'échantillonnage sont énumérés ci-dessous :

Intégralité

Puisque chaque municipalité, province ou territoire canadien est tenu, en vertu de la loi, de veiller à la surveillance et à l'évaluation des propriétés, le degré d'intégralité des données administratives fournies par des sources externes est considéré comme étant relativement bon.

La base de données du PSLC reflète le contenu actuel du registre des propriétés résidentielles du fournisseur de données externe à la date d'extraction, laquelle varie selon la province ou le territoire.

Dans le cadre du PSLC, les propriétés se voient assigner un emplacement géographique à l'aide des données tirées des rôles d'évaluation foncière.

Doublons

Des analyses initiales sont menées afin de s'assurer que toutes les propriétés figurant dans les fichiers de données sont uniques. Si des propriétaires sont énumérés deux fois pour la même propriété, les enregistrements en double sont repérés au moyen de couplages internes et sont ensuite supprimés.

Sous-dénombrement

Le sous-dénombrement des propriétés résidentielles peut se produire pour diverses raisons. Par exemple, les propriétés qui subissent des changements non enregistrés entre les périodes d'évaluation (p. ex. nouvelles constructions, démolitions ou améliorations apportées sans permis de construire) ne sont pas comprises dans les valeurs de l'évaluation foncière.


Actualité

Le PSLC est un projet de données novateur dans le cadre duquel on utilise de nouvelles techniques de couplage et de traitement qui peuvent être affinées au fil du temps, afin d'améliorer l'exactitude et la précision des données diffusées. Les données recueillies au cours de la première année de collecte dans chaque province et territoire doivent être considérées comme des résultats provisoires et peuvent contenir une erreur de précocité qu'il sera possible de corriger lors des prochaines publications de données.

Les données du PSLC sont utilisées pour produire des estimations annuelles.

Erreurs de traitement des données

Les fichiers administratifs sont traités par différents processus du PSLC dans le but de produire des estimations. Chacune des étapes de traitement présente des risques d'erreur inhérents qui peuvent affecter la qualité des estimations résultantes. L'indicateur composite de qualité mentionné précédemment combine des niveaux relatifs d'erreur introduite dans les processus de codage, de géocodage, de couplage et d'imputation. Les valeurs de l'indicateur composite A à F indiquent comment ces étapes de traitement ont affecté la qualité des estimations du PSLC.

Documentation

Signaler un problème sur cette page

Quelque chose ne fonctionne pas? L'information n'est plus à jour? Vous ne trouvez pas ce que vous cherchez?

S'il vous plaît contactez-nous et nous informer comment nous pouvons vous aider.

Avis de confidentialité

Date de modification :