Pondération et estimation

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (12)

Tout (12) (0 à 10 de 12 résultats)

  • Articles et rapports : 75F0002M1993018
    Description :

    Dans ce document, on examine les solutions possibles pour la pondération des personnes qui se joignent à un ménage après la sélection d'un panel.

    Date de diffusion : 1995-12-30

  • Articles et rapports : 12-001-X199500214397
    Description :

    L’estimation par régression et sa généralisation, l’estimation par calage introduite par Deville et Särndal en 1993 permet de réduire a posteriori la variance des estimateur, grâce à l’utilisation de l’information auxiliaire. Dans les enquêtes réalisées par sondage, on dispose souvent d’information additionnelle exploitable répartie selon un schéma complexe notamment lorsque le sondage est réalisé en plusieurs phases. Une adaptation de l’estimation par régression a été proposée avec ses variantes dans le cadre du sondage à deux phases par Särndal et Swensson en 1987. Cet article propose d’étudier les stratégies d’estimation alternatives selon deux configurations alternatives pour l’information auxiliaire, en reliant les deux approches possibles pour aborder le problème : modèle de régression et estimation par calage.

    Date de diffusion : 1995-12-15

  • Articles et rapports : 12-001-X199500214399
    Description :

    Nous examinons l’utilité de la moyenne winsorisée comme estimateur de la moyenne d’une distribution à asymétrie positive. On obtient la moyenne winsorisée en remplaçant toutes les observations supérieures à une valeur limite donnée R par cette même valeur R, avant le calcul de la moyenne. La valeur limite optimale, telle qu’elle est définie par Searls (1966), minimise l’erreur quadratique moyenne (mean square error, ou MSE) de l’estimateur winsorisé. Nous proposons des méthodes d’évaluation de cette valeur limite optimale avec divers plans d’échantillonnage, y compris l’échantillonnage aléatoire simple, l’échantillonnage stratifié et l’échantillonnage avec probabilité proportionnelle à la taille (ppt). Pour la plupart des distributions asymétriques, la stratégie de winsorisation optimale aura généralement pour effet de modifier la valeur d’environ une observation dans l’échantillon. On dérive des approximations directes (qui ne fait pas appel à un processus itératif) de l’efficacité de la moyenne winsorisée de Searls en utilisant la théorie des statistiques d’ordre extrême. Une expérience de Monte Carlo nous sert à comparer divers estimateurs réduisant l’impact des valeurs extrêmes.

    Date de diffusion : 1995-12-15

  • Articles et rapports : 12-001-X199500214405
    Description :

    Le présent article étudie les effets de la variabilité de l’intervieweur sur la précision des écarts estimés entre les moyennes de domaines. La première partie est consacrée à l’élaboration d’un modèle des éléments corrélés de la variance, permettant d’identifier les facteurs qui déterminent l’ampleur des effets, aspect qui influe sur le plan d’échantillonnage et la formation de l’intervieweur. Dans la deuxième partie, on trouvera une analyse empirique des données provenant d’une vaste enquête à plusieurs degrés sur l’hygiène dentaire. On s’est servi du sexe et de la race du répondant pour créer les deux jeux de domaines servant à la comparaison. Les effets globaux dus à l’intervieweur et au groupement de l’échantillon n’ont guère d’incidence sur la variance des comparaisons entre sexes masculin et féminin, mais la variance augmente pour certains écarts entre les deux groupes ethniques retenus. De fait, les effets de l’intervieweur sont deux ou trois fois plus élevés pour la comparaison des groupes ethniques que pour celle des deux sexes. Ces constatations présentent une certaine utilité pour les enquêtes dans le secteur de la santé où il est courant de recourir à un petit nombre d’intervieweurs ayant subi une formation poussée.

    Date de diffusion : 1995-12-15

  • Articles et rapports : 12-001-X199500114407
    Description :

    L’estimateur Horvitz-Thompson (estimateur HT) résiste mal aux valeurs aberrantes. La présence de valeurs aberrantes dans une population peut accroître sa variance, même si elle demeure non biaisée. Nous exprimons l’estimateur HT sous forme d’une fonctionnelle de moindres carrés afin d’en accroître la robustesse par l’intermédiaire d’estimateurs M. Nous dérivons une variance approximative de l’estimateur HT à robustesse accrue en utilisant un type de fonction d’influence pour l’échantillonnage, et nous élaborons un estimateur de cette variance. Une méthode adaptée de sélection d’un estimateur M conduit à des estimateurs à risque estimé minimum. Ces estimateurs et les estimateurs HT à robustesse accrue sont souvent plus efficaces que les estimateurs HT classiques, lorsque nous sommes en présence de valeurs aberrantes.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114408
    Description :

    On étudie le problème de l’estimation de la médiane d’une population finie quand une variable auxiliaire est présente. On propose des estimateurs ponctuels et des estimateurs par intervalle fondés sur une approche bayesienne non informative. L’estimateur ponctuel est comparé à d’autres estimateurs possibles et l’on constate qu’il donne de bons résultats dans diverses situations.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114410
    Description :

    Dans le cadre de la décision relative au redressement des chiffres du recensement décennal de 1990, le U.S. Census Bureau a étudié l’hétérogénéité possible des taux de sous-dénombrement parmi des parties de différents États se trouvant dans la même case de rajustement ou strate formée a posteriori. Cinq « variables de remplacement » que l’on croyait associées au sous-dénombrement ont été analysées à l’aide d’une grande partie des données du recensement, et l’on a constaté une hétérogénéité significative. L’analyse de l’enquête post-censitaire sur les taux de sous-dénombrement a montré que les variables de stratification a posteriori expliquaient une plus grande partie de la variance que l’État, d’où le choix de la strate a posteriori comme case de rajustement. On a observé une hétérogénéité significative parmi les États dans 19 des 99 groupes de strates a posteriori (surtout dans les régions non urbaines), mais, après avoir regroupé des strates a posteriori, on n’a pratiquement rien observé qui donne à penser que l’estimateur de stratification a posteriori était biaisé de façon à défavoriser certains États. Néanmoins, de futures études sur l’évaluation de la couverture devraient permettre de résoudre cette question.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114411
    Description :

    En 1991, Statistique Canada a, pour la première fois, redressé les données du Programme des estimations démographiques pour tenir compte du sous-dénombrement dans le recensement de 1991. Les études sur le champ d’observation du recensement fournissaient de bonnes estimations du sous-dénombrement pour les provinces et pour des groupes d’âge-sexe largement définis à l’échelle nationale. Or, pour redresser les séries d’estimations démographiques, il fallait connaître les estimations du sous-dénombrement pour des groupes d’âge-sexe définis à l’intérieur des provinces ou des territoires. Comme les estimations directes d’enquête pour quelques-uns de ces petits domaines avaient une erreur type élevée à cause du trop petit nombre d’unités de l’échantillon contenues dans ces domaines, il a fallu recourir à des méthodes de modélisation pour petite région. Afin de tenir compte de la plage de variabilité des estimations directes d’enquête, on s’est servi d’un modèle de régression fondé sur une méthode empirique de Bayes pour estimer le sous-dénombrement dans les petits domaines. On a ensuite appliqué la méthode itérative du quotient aux estimations du sous-dénombrement pour qu’il y ait concordance avec les estimations directes marginales. Cet article donne les résultats de la modélisation et la réduction estimée de l’erreur type.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114412
    Description :

    Il est fréquent, dans les enquêtes par panel menées auprès des ménages, de prélever d’abord un échantillon de ménages et de tenter par la suite de suivre tous les membres de ces ménages pendant la durée du panel. Aux vagues subséquentes, les données sont recueillies pour les membres de l’échantillon initial et pour toutes les personnes qui vivent avec les membres de l’échantillon à ce moment. Il est souhaitable, en effet, d’inclure les données recueillies aussi bien auprès des membres de l’échantillon initial que des personnes qui vivent avec elles lorsqu’on fait des estimations transversales au niveau des personnes pour une vague particulière. De même, il est souhaitable d’inclure les données de tous les ménages pour lesquels des données sont recueillies à une vague particulière lorsqu’on fait des estimations transversales au niveau des ménages pour cette vague. Le présent article examine des méthodes de pondération qui peuvent être utilisées à cette fin. Ces méthodes de pondération peuvent aussi servir dans d’autres contextes, lorsqu’il existe plusieurs voies par lesquelles les unités peuvent être prélevées dans l’échantillon.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114413
    Description :

    Les organismes de statistiques effectuent de plus en plus d’enquêtes longitudinales. Or, même si ces enquêtes produisent surtout des données longitudinales, on s’attend dans la plupart des cas qu’elles donnent également des estimations transversales fiables. Les enquêtes menées auprès des individus et des ménages doivent pouvoir tenir compte de la dynamique des populations, c’est-à-dire des changements sensibles qui peuvent survenir, avec le temps, dans la composition des ménages. Ainsi, il convient d’adapter les méthodes d’estimation transversale à la nature longitudinale de l’échantillon. Dans le présent document, nous présentons un aperçu général de la méthode du partage des poids, laquelle peut servir entre autres à attribuer un poids de base aux membres d’un ménage. Nous nous penchons également sur l’estimateur de variance associé à cette méthode. Nous examinons finalement le problème que pose la pondération d’un échantillon longitudinal dans les cas où un échantillon supplémentaire est sélectionné pour améliorer la représentativité transversale de l’échantillon. Nous examinons, en guise d’application, l’Enquête sur la dynamique du travail et du revenu (EDTR) mise en œuvre par Statistique Canada en 1994. Cette enquête longitudinale s’intéresse à l’expérience pratique des individus, à l’évolution de leurs revenus et aux changements dans la composition des ménages.

    Date de diffusion : 1995-06-15
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (12)

Analyses (12) (0 à 10 de 12 résultats)

  • Articles et rapports : 75F0002M1993018
    Description :

    Dans ce document, on examine les solutions possibles pour la pondération des personnes qui se joignent à un ménage après la sélection d'un panel.

    Date de diffusion : 1995-12-30

  • Articles et rapports : 12-001-X199500214397
    Description :

    L’estimation par régression et sa généralisation, l’estimation par calage introduite par Deville et Särndal en 1993 permet de réduire a posteriori la variance des estimateur, grâce à l’utilisation de l’information auxiliaire. Dans les enquêtes réalisées par sondage, on dispose souvent d’information additionnelle exploitable répartie selon un schéma complexe notamment lorsque le sondage est réalisé en plusieurs phases. Une adaptation de l’estimation par régression a été proposée avec ses variantes dans le cadre du sondage à deux phases par Särndal et Swensson en 1987. Cet article propose d’étudier les stratégies d’estimation alternatives selon deux configurations alternatives pour l’information auxiliaire, en reliant les deux approches possibles pour aborder le problème : modèle de régression et estimation par calage.

    Date de diffusion : 1995-12-15

  • Articles et rapports : 12-001-X199500214399
    Description :

    Nous examinons l’utilité de la moyenne winsorisée comme estimateur de la moyenne d’une distribution à asymétrie positive. On obtient la moyenne winsorisée en remplaçant toutes les observations supérieures à une valeur limite donnée R par cette même valeur R, avant le calcul de la moyenne. La valeur limite optimale, telle qu’elle est définie par Searls (1966), minimise l’erreur quadratique moyenne (mean square error, ou MSE) de l’estimateur winsorisé. Nous proposons des méthodes d’évaluation de cette valeur limite optimale avec divers plans d’échantillonnage, y compris l’échantillonnage aléatoire simple, l’échantillonnage stratifié et l’échantillonnage avec probabilité proportionnelle à la taille (ppt). Pour la plupart des distributions asymétriques, la stratégie de winsorisation optimale aura généralement pour effet de modifier la valeur d’environ une observation dans l’échantillon. On dérive des approximations directes (qui ne fait pas appel à un processus itératif) de l’efficacité de la moyenne winsorisée de Searls en utilisant la théorie des statistiques d’ordre extrême. Une expérience de Monte Carlo nous sert à comparer divers estimateurs réduisant l’impact des valeurs extrêmes.

    Date de diffusion : 1995-12-15

  • Articles et rapports : 12-001-X199500214405
    Description :

    Le présent article étudie les effets de la variabilité de l’intervieweur sur la précision des écarts estimés entre les moyennes de domaines. La première partie est consacrée à l’élaboration d’un modèle des éléments corrélés de la variance, permettant d’identifier les facteurs qui déterminent l’ampleur des effets, aspect qui influe sur le plan d’échantillonnage et la formation de l’intervieweur. Dans la deuxième partie, on trouvera une analyse empirique des données provenant d’une vaste enquête à plusieurs degrés sur l’hygiène dentaire. On s’est servi du sexe et de la race du répondant pour créer les deux jeux de domaines servant à la comparaison. Les effets globaux dus à l’intervieweur et au groupement de l’échantillon n’ont guère d’incidence sur la variance des comparaisons entre sexes masculin et féminin, mais la variance augmente pour certains écarts entre les deux groupes ethniques retenus. De fait, les effets de l’intervieweur sont deux ou trois fois plus élevés pour la comparaison des groupes ethniques que pour celle des deux sexes. Ces constatations présentent une certaine utilité pour les enquêtes dans le secteur de la santé où il est courant de recourir à un petit nombre d’intervieweurs ayant subi une formation poussée.

    Date de diffusion : 1995-12-15

  • Articles et rapports : 12-001-X199500114407
    Description :

    L’estimateur Horvitz-Thompson (estimateur HT) résiste mal aux valeurs aberrantes. La présence de valeurs aberrantes dans une population peut accroître sa variance, même si elle demeure non biaisée. Nous exprimons l’estimateur HT sous forme d’une fonctionnelle de moindres carrés afin d’en accroître la robustesse par l’intermédiaire d’estimateurs M. Nous dérivons une variance approximative de l’estimateur HT à robustesse accrue en utilisant un type de fonction d’influence pour l’échantillonnage, et nous élaborons un estimateur de cette variance. Une méthode adaptée de sélection d’un estimateur M conduit à des estimateurs à risque estimé minimum. Ces estimateurs et les estimateurs HT à robustesse accrue sont souvent plus efficaces que les estimateurs HT classiques, lorsque nous sommes en présence de valeurs aberrantes.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114408
    Description :

    On étudie le problème de l’estimation de la médiane d’une population finie quand une variable auxiliaire est présente. On propose des estimateurs ponctuels et des estimateurs par intervalle fondés sur une approche bayesienne non informative. L’estimateur ponctuel est comparé à d’autres estimateurs possibles et l’on constate qu’il donne de bons résultats dans diverses situations.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114410
    Description :

    Dans le cadre de la décision relative au redressement des chiffres du recensement décennal de 1990, le U.S. Census Bureau a étudié l’hétérogénéité possible des taux de sous-dénombrement parmi des parties de différents États se trouvant dans la même case de rajustement ou strate formée a posteriori. Cinq « variables de remplacement » que l’on croyait associées au sous-dénombrement ont été analysées à l’aide d’une grande partie des données du recensement, et l’on a constaté une hétérogénéité significative. L’analyse de l’enquête post-censitaire sur les taux de sous-dénombrement a montré que les variables de stratification a posteriori expliquaient une plus grande partie de la variance que l’État, d’où le choix de la strate a posteriori comme case de rajustement. On a observé une hétérogénéité significative parmi les États dans 19 des 99 groupes de strates a posteriori (surtout dans les régions non urbaines), mais, après avoir regroupé des strates a posteriori, on n’a pratiquement rien observé qui donne à penser que l’estimateur de stratification a posteriori était biaisé de façon à défavoriser certains États. Néanmoins, de futures études sur l’évaluation de la couverture devraient permettre de résoudre cette question.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114411
    Description :

    En 1991, Statistique Canada a, pour la première fois, redressé les données du Programme des estimations démographiques pour tenir compte du sous-dénombrement dans le recensement de 1991. Les études sur le champ d’observation du recensement fournissaient de bonnes estimations du sous-dénombrement pour les provinces et pour des groupes d’âge-sexe largement définis à l’échelle nationale. Or, pour redresser les séries d’estimations démographiques, il fallait connaître les estimations du sous-dénombrement pour des groupes d’âge-sexe définis à l’intérieur des provinces ou des territoires. Comme les estimations directes d’enquête pour quelques-uns de ces petits domaines avaient une erreur type élevée à cause du trop petit nombre d’unités de l’échantillon contenues dans ces domaines, il a fallu recourir à des méthodes de modélisation pour petite région. Afin de tenir compte de la plage de variabilité des estimations directes d’enquête, on s’est servi d’un modèle de régression fondé sur une méthode empirique de Bayes pour estimer le sous-dénombrement dans les petits domaines. On a ensuite appliqué la méthode itérative du quotient aux estimations du sous-dénombrement pour qu’il y ait concordance avec les estimations directes marginales. Cet article donne les résultats de la modélisation et la réduction estimée de l’erreur type.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114412
    Description :

    Il est fréquent, dans les enquêtes par panel menées auprès des ménages, de prélever d’abord un échantillon de ménages et de tenter par la suite de suivre tous les membres de ces ménages pendant la durée du panel. Aux vagues subséquentes, les données sont recueillies pour les membres de l’échantillon initial et pour toutes les personnes qui vivent avec les membres de l’échantillon à ce moment. Il est souhaitable, en effet, d’inclure les données recueillies aussi bien auprès des membres de l’échantillon initial que des personnes qui vivent avec elles lorsqu’on fait des estimations transversales au niveau des personnes pour une vague particulière. De même, il est souhaitable d’inclure les données de tous les ménages pour lesquels des données sont recueillies à une vague particulière lorsqu’on fait des estimations transversales au niveau des ménages pour cette vague. Le présent article examine des méthodes de pondération qui peuvent être utilisées à cette fin. Ces méthodes de pondération peuvent aussi servir dans d’autres contextes, lorsqu’il existe plusieurs voies par lesquelles les unités peuvent être prélevées dans l’échantillon.

    Date de diffusion : 1995-06-15

  • Articles et rapports : 12-001-X199500114413
    Description :

    Les organismes de statistiques effectuent de plus en plus d’enquêtes longitudinales. Or, même si ces enquêtes produisent surtout des données longitudinales, on s’attend dans la plupart des cas qu’elles donnent également des estimations transversales fiables. Les enquêtes menées auprès des individus et des ménages doivent pouvoir tenir compte de la dynamique des populations, c’est-à-dire des changements sensibles qui peuvent survenir, avec le temps, dans la composition des ménages. Ainsi, il convient d’adapter les méthodes d’estimation transversale à la nature longitudinale de l’échantillon. Dans le présent document, nous présentons un aperçu général de la méthode du partage des poids, laquelle peut servir entre autres à attribuer un poids de base aux membres d’un ménage. Nous nous penchons également sur l’estimateur de variance associé à cette méthode. Nous examinons finalement le problème que pose la pondération d’un échantillon longitudinal dans les cas où un échantillon supplémentaire est sélectionné pour améliorer la représentativité transversale de l’échantillon. Nous examinons, en guise d’application, l’Enquête sur la dynamique du travail et du revenu (EDTR) mise en œuvre par Statistique Canada en 1994. Cette enquête longitudinale s’intéresse à l’expérience pratique des individus, à l’évolution de leurs revenus et aux changements dans la composition des ménages.

    Date de diffusion : 1995-06-15
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :