Vérification et imputation

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 0 facets selected.

Enquête ou programme statistique

2 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (14)

Tout (14) (0 à 10 de 14 résultats)

  • Articles et rapports : 12-001-X202100100004
    Description :

    À l’ère des mégadonnées, on dispose d’un nombre croissant de sources de données pour les analyses statistiques. Comme exemple important d’inférence de population finie, nous examinons une approche d’imputation pour la combinaison de données tirées d’une enquête probabiliste et de mégadonnées. Nous nous concentrons sur une situation où la variable à l’étude est observée dans les mégadonnées seulement, mais les autres variables auxiliaires sont couramment observées dans les deux sources de données. Contrairement à l’imputation habituellement utilisée pour l’analyse des données manquantes, nous créons des valeurs imputées pour toutes les unités de l’échantillon probabiliste. Une imputation massive de ce type est intéressante dans le contexte de l’intégration des données d’enquête (Kim et Rao, 2012). Nous étendons l’imputation massive comme outil d’intégration des données d’enquête et des mégadonnées ne provenant pas d’enquêtes. Nous présentons les méthodes d’imputation massive et leurs propriétés statistiques. De plus, l’estimateur d’appariement de Rivers (2007) est traité comme cas particulier. L’estimation de la variance au moyen de données obtenues par imputation massive est abordée. Les résultats de la simulation montrent que les estimateurs proposés donnent de meilleurs résultats que les estimateurs concurrents en matière de robustesse et d’efficacité.

    Date de diffusion : 2021-06-24

  • Articles et rapports : 12-001-X202100100009
    Description :

    L’imputation par appariement selon la moyenne prédictive est couramment utilisée pour régler les cas de non-réponse dans le cadre d’enquêtes. L’approche habituelle consiste à spécifier un modèle de régression unique. Dans la présente note, nous proposons une nouvelle procédure par appariement selon la moyenne prédictive permettant à l’utilisateur de spécifier plusieurs modèles de régression. L’estimateur obtenu est multirobuste en ce sens qu’il demeure convergent si l’un des modèles de régression spécifié est défini correctement. Les résultats d’une étude de simulation indiquent que la méthode proposée fonctionne bien en termes de biais et d’efficacité.

    Date de diffusion : 2021-06-24

  • Articles et rapports : 12-001-X201900100009
    Description :

    La demande d’estimations sur petits domaines de la part des utilisateurs des données de Statistique Canada augmente constamment depuis quelques années. Dans le présent document, nous résumons les procédures qui ont été intégrées dans un système de production en SAS permettant d’obtenir des estimations sur petits domaines officielles à Statistique Canada. Ce système comprend : des procédures fondées sur des modèles au niveau de l’unité ou du domaine; l’intégration du plan d’échantillonnage; la capacité de lisser la variance sous le plan pour chaque petit domaine si un modèle au niveau du domaine est utilisé; la capacité de vérifier que les estimations sur petits domaines équivalent à des estimations fiables de niveau plus élevé; et l’élaboration d’outils de diagnostic pour tester la pertinence du modèle. Le système de production a servi à produire des estimations sur petits domaines à titre expérimental pour plusieurs enquêtes de Statistique Canada, notamment : l’estimation des caractéristiques de la santé, l’estimation du sous-dénombrement au recensement, l’estimation des ventes des fabricants et l’estimation des taux de chômage et des chiffres d’emploi pour l’Enquête sur la population active. Certains des diagnostics instaurés dans le système sont illustrés à l’aide des données de l’Enquête sur la population active ainsi que des données administratives auxiliaires.

    Date de diffusion : 2019-05-07

  • Articles et rapports : 12-001-X200700210493
    Description :

    Dans le présent article, nous étudions le problème de l'estimation de la variance pour un ratio de deux totaux quand l'imputation hot deck aléatoire marginale est utilisée pour remplacer les données manquantes. Nous considérons deux approches d'inférence. Dans la première, l'établissement de la validité d'un modèle d'imputation est nécessaire. Dans la seconde, la validité d'un modèle d'imputation n'est pas nécessaire, mais il faut estimer les probabilités de réponse, auquel cas il est nécessaire d'établir la validité d'un modèle de non réponse. Nous obtenons les estimateurs de la variance sous deux cadres distincts, à savoir le cadre à deux phases habituel et le cadre inversé.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 11-522-X20050019458
    Description :

    La communication proposée présente une méthodologie alternative laissant aux données le soin de définir des classes homogènes, déterminées par une classification ascendante hiérachique sur les valeurs des détails observées. Le problème est ensuite d'affecter une entreprise non répondante à l'une de ces classes. Plusieurs procédures d'affectation, basées sur des variables explicatives disponibles dans la déclaration fiscales, sont comparées, sur données brutes ou discrétisées : analyses discriminantes paramétrique et non-paramétrique, modèles log-linéaires etc.

    Date de diffusion : 2007-03-02

  • Articles et rapports : 75F0002M2005010
    Description :

    Depuis un certain temps, la Société canadienne d'hypothèques et de logement (SCHL) utilise les données du Recensement de la population sur les caractéristiques du logement et les dépenses liées au logement. Bien que la source de données que constitue le recensement réponde dans une large mesure aux besoins de la SCHL, cet organisme du gouvernement fédéral a exploité les enquêtes-ménages annuelles de Statistique Canada pour obtenir des renseignements plus fréquents. Cela devait lui permettre d'avoir une image plus fidèle des tendances annuelles, et peut-être d'avoir un plus grand choix d'autres caractéristiques pour le recoupement des données sur le logement des ménages canadiens. En 2001, la SCHL a commencé à commanditer des questions supplémentaires à la fois dans l'Enquête sur la dynamique du travail et du revenu (EDTR) et dans l'Enquête sur les dépenses des ménages (EDM), à compter de l'année de référence 2002.

    Date de diffusion : 2005-07-22

  • Articles et rapports : 11-522-X20030017722
    Description :

    Dans ce document, on montre comment adapter les cadres de travail basés sur le plan de sondage et basés sur un modèle dans le cas de l'échantillonnage à deux degrés

    Date de diffusion : 2005-01-26

  • Articles et rapports : 12-001-X20030016610
    Description :

    En présence de non-réponse partielle, en pratique, on recourt souvent à des méthodes d'imputation non pondérée, mais celles-ci produisent généralement des estimateurs biaisés sous l'hypothèse d'une réponse uniforme à l'intérieur des classes d'imputation. En nous inspirant de Skinner et Rao (2002), nous proposons un estimateur corrigé pour le biais d'une moyenne de population sous imputation par le ratio non pondérée et sous imputation aléatoire hot-deck, et nous calculons des estimateurs de la variance par linéarisation. Nous réalisons une petite étude en simulation pour évaluer les propriétés de biais et d'erreur quadratique moyenne des estimateurs obtenus. Nous étudions aussi le biais relatif et la stabilité relative des estimateurs de la variance.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 11-522-X20010016303
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    Dans les enquêtes à grande échelle, il est inévitable de retrouver un certain taux de non-réponse. En général, les organismes statistiques recourent à l'imputation pour corriger la non-réponse. Une étape préalable courante consiste en la création de cellules d'imputation. Dans cet article, il est question de la création de ces cellules selon deux méthodes. La première s'inspire d'Eltinge et Yansaneh (1997) pour ce qui est des cellules de pondération, et la deuxième renvoie à la méthode actuelle de l'Enquête sur la population active au Canada. À l'aide des données sur la population active, nous testons - par simulation - l'effet du taux de réponse, le mécanisme de réponse et les contraintes de qualité de l'estimation ponctuelle pour les deux méthodes.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 12-001-X198600214450
    Description :

    À partir d’un échantillon annuel de déclarations d’impôt présentées par des sociétés américaines, le fisc américain (IRS) prépare des estimations de totaux de plusieurs centaines d’éléments financiers pour des ensembles et des sous-ensembles. Le plan d’échantillonnage de base est hautement stratifié et relativement complexe. Ce plan a été modifié lors de l’échantillonnage des déclarations de 1981 et 1982; on y a ajouté une procédure d’échantillonnage à deux degrés. Ce changement répondait à la nécessité d’une meilleure répartition des ressources dans un contexte de budgets en décroissance. Les éléments qu’on ne peut observer dans le sous-échantillon font l’objet d’une prédiction par imputation « hot deck » modifiée. Le présent document décrit la conception de cette nouvelle procédure de même que l’estimation et l’évaluation de ses effets.

    Date de diffusion : 1986-12-15
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (14)

Analyses (14) (0 à 10 de 14 résultats)

  • Articles et rapports : 12-001-X202100100004
    Description :

    À l’ère des mégadonnées, on dispose d’un nombre croissant de sources de données pour les analyses statistiques. Comme exemple important d’inférence de population finie, nous examinons une approche d’imputation pour la combinaison de données tirées d’une enquête probabiliste et de mégadonnées. Nous nous concentrons sur une situation où la variable à l’étude est observée dans les mégadonnées seulement, mais les autres variables auxiliaires sont couramment observées dans les deux sources de données. Contrairement à l’imputation habituellement utilisée pour l’analyse des données manquantes, nous créons des valeurs imputées pour toutes les unités de l’échantillon probabiliste. Une imputation massive de ce type est intéressante dans le contexte de l’intégration des données d’enquête (Kim et Rao, 2012). Nous étendons l’imputation massive comme outil d’intégration des données d’enquête et des mégadonnées ne provenant pas d’enquêtes. Nous présentons les méthodes d’imputation massive et leurs propriétés statistiques. De plus, l’estimateur d’appariement de Rivers (2007) est traité comme cas particulier. L’estimation de la variance au moyen de données obtenues par imputation massive est abordée. Les résultats de la simulation montrent que les estimateurs proposés donnent de meilleurs résultats que les estimateurs concurrents en matière de robustesse et d’efficacité.

    Date de diffusion : 2021-06-24

  • Articles et rapports : 12-001-X202100100009
    Description :

    L’imputation par appariement selon la moyenne prédictive est couramment utilisée pour régler les cas de non-réponse dans le cadre d’enquêtes. L’approche habituelle consiste à spécifier un modèle de régression unique. Dans la présente note, nous proposons une nouvelle procédure par appariement selon la moyenne prédictive permettant à l’utilisateur de spécifier plusieurs modèles de régression. L’estimateur obtenu est multirobuste en ce sens qu’il demeure convergent si l’un des modèles de régression spécifié est défini correctement. Les résultats d’une étude de simulation indiquent que la méthode proposée fonctionne bien en termes de biais et d’efficacité.

    Date de diffusion : 2021-06-24

  • Articles et rapports : 12-001-X201900100009
    Description :

    La demande d’estimations sur petits domaines de la part des utilisateurs des données de Statistique Canada augmente constamment depuis quelques années. Dans le présent document, nous résumons les procédures qui ont été intégrées dans un système de production en SAS permettant d’obtenir des estimations sur petits domaines officielles à Statistique Canada. Ce système comprend : des procédures fondées sur des modèles au niveau de l’unité ou du domaine; l’intégration du plan d’échantillonnage; la capacité de lisser la variance sous le plan pour chaque petit domaine si un modèle au niveau du domaine est utilisé; la capacité de vérifier que les estimations sur petits domaines équivalent à des estimations fiables de niveau plus élevé; et l’élaboration d’outils de diagnostic pour tester la pertinence du modèle. Le système de production a servi à produire des estimations sur petits domaines à titre expérimental pour plusieurs enquêtes de Statistique Canada, notamment : l’estimation des caractéristiques de la santé, l’estimation du sous-dénombrement au recensement, l’estimation des ventes des fabricants et l’estimation des taux de chômage et des chiffres d’emploi pour l’Enquête sur la population active. Certains des diagnostics instaurés dans le système sont illustrés à l’aide des données de l’Enquête sur la population active ainsi que des données administratives auxiliaires.

    Date de diffusion : 2019-05-07

  • Articles et rapports : 12-001-X200700210493
    Description :

    Dans le présent article, nous étudions le problème de l'estimation de la variance pour un ratio de deux totaux quand l'imputation hot deck aléatoire marginale est utilisée pour remplacer les données manquantes. Nous considérons deux approches d'inférence. Dans la première, l'établissement de la validité d'un modèle d'imputation est nécessaire. Dans la seconde, la validité d'un modèle d'imputation n'est pas nécessaire, mais il faut estimer les probabilités de réponse, auquel cas il est nécessaire d'établir la validité d'un modèle de non réponse. Nous obtenons les estimateurs de la variance sous deux cadres distincts, à savoir le cadre à deux phases habituel et le cadre inversé.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 11-522-X20050019458
    Description :

    La communication proposée présente une méthodologie alternative laissant aux données le soin de définir des classes homogènes, déterminées par une classification ascendante hiérachique sur les valeurs des détails observées. Le problème est ensuite d'affecter une entreprise non répondante à l'une de ces classes. Plusieurs procédures d'affectation, basées sur des variables explicatives disponibles dans la déclaration fiscales, sont comparées, sur données brutes ou discrétisées : analyses discriminantes paramétrique et non-paramétrique, modèles log-linéaires etc.

    Date de diffusion : 2007-03-02

  • Articles et rapports : 75F0002M2005010
    Description :

    Depuis un certain temps, la Société canadienne d'hypothèques et de logement (SCHL) utilise les données du Recensement de la population sur les caractéristiques du logement et les dépenses liées au logement. Bien que la source de données que constitue le recensement réponde dans une large mesure aux besoins de la SCHL, cet organisme du gouvernement fédéral a exploité les enquêtes-ménages annuelles de Statistique Canada pour obtenir des renseignements plus fréquents. Cela devait lui permettre d'avoir une image plus fidèle des tendances annuelles, et peut-être d'avoir un plus grand choix d'autres caractéristiques pour le recoupement des données sur le logement des ménages canadiens. En 2001, la SCHL a commencé à commanditer des questions supplémentaires à la fois dans l'Enquête sur la dynamique du travail et du revenu (EDTR) et dans l'Enquête sur les dépenses des ménages (EDM), à compter de l'année de référence 2002.

    Date de diffusion : 2005-07-22

  • Articles et rapports : 11-522-X20030017722
    Description :

    Dans ce document, on montre comment adapter les cadres de travail basés sur le plan de sondage et basés sur un modèle dans le cas de l'échantillonnage à deux degrés

    Date de diffusion : 2005-01-26

  • Articles et rapports : 12-001-X20030016610
    Description :

    En présence de non-réponse partielle, en pratique, on recourt souvent à des méthodes d'imputation non pondérée, mais celles-ci produisent généralement des estimateurs biaisés sous l'hypothèse d'une réponse uniforme à l'intérieur des classes d'imputation. En nous inspirant de Skinner et Rao (2002), nous proposons un estimateur corrigé pour le biais d'une moyenne de population sous imputation par le ratio non pondérée et sous imputation aléatoire hot-deck, et nous calculons des estimateurs de la variance par linéarisation. Nous réalisons une petite étude en simulation pour évaluer les propriétés de biais et d'erreur quadratique moyenne des estimateurs obtenus. Nous étudions aussi le biais relatif et la stabilité relative des estimateurs de la variance.

    Date de diffusion : 2003-07-31

  • Articles et rapports : 11-522-X20010016303
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes et s'adresse surtout à des méthodologistes.

    Dans les enquêtes à grande échelle, il est inévitable de retrouver un certain taux de non-réponse. En général, les organismes statistiques recourent à l'imputation pour corriger la non-réponse. Une étape préalable courante consiste en la création de cellules d'imputation. Dans cet article, il est question de la création de ces cellules selon deux méthodes. La première s'inspire d'Eltinge et Yansaneh (1997) pour ce qui est des cellules de pondération, et la deuxième renvoie à la méthode actuelle de l'Enquête sur la population active au Canada. À l'aide des données sur la population active, nous testons - par simulation - l'effet du taux de réponse, le mécanisme de réponse et les contraintes de qualité de l'estimation ponctuelle pour les deux méthodes.

    Date de diffusion : 2002-09-12

  • Articles et rapports : 12-001-X198600214450
    Description :

    À partir d’un échantillon annuel de déclarations d’impôt présentées par des sociétés américaines, le fisc américain (IRS) prépare des estimations de totaux de plusieurs centaines d’éléments financiers pour des ensembles et des sous-ensembles. Le plan d’échantillonnage de base est hautement stratifié et relativement complexe. Ce plan a été modifié lors de l’échantillonnage des déclarations de 1981 et 1982; on y a ajouté une procédure d’échantillonnage à deux degrés. Ce changement répondait à la nécessité d’une meilleure répartition des ressources dans un contexte de budgets en décroissance. Les éléments qu’on ne peut observer dans le sous-échantillon font l’objet d’une prédiction par imputation « hot deck » modifiée. Le présent document décrit la conception de cette nouvelle procédure de même que l’estimation et l’évaluation de ses effets.

    Date de diffusion : 1986-12-15
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :