Pondération et estimation

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Enquête ou programme statistique

1 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (23)

Tout (23) (0 à 10 de 23 résultats)

  • Articles et rapports : 11-522-X202200100013
    Description : Les répondants des enquêtes auprès des ménages usuelles tendent à fortement sous-déclarer leur éventuel recours à l'aide alimentaire distribuée par les associations. Cette sous-déclaration est très vraisemblablement liée au stigmate social ressenti par les personnes dans une situation de très grandes difficultés financières. Les estimations du nombre de bénéficiaires de cette aide issues des enquêtes sont ainsi très inférieures aux décomptes directs des associations. Ces décomptes, eux, tendent à la surestimation en raison de doubles comptes. L'enquête Aide alimentaire (EAA) collectée fin 2021 en France dans un échantillon de sites d'associations distribuant de l'aide alimentaire permet, par son protocole adapté, de contrôler les biais qui affectent les autres sources et de clarifier l'ampleur du recours à cette aide.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 12-001-X201900300006
    Description :

    Un taux de non-réponse élevé est un problème très courant dans les enquêtes-échantillons de nos jours. Du point de vue statistique, nous entretenons des inquiétudes au sujet du biais et de la variance accrus des estimateurs de chiffres de population comme les totaux ou les moyennes. Diverses méthodes ont été proposées pour compenser ce phénomène. En gros, nous pouvons les diviser en imputation et calage, et c’est sur la dernière méthode que nous nous concentrons ici. La catégorie des estimateurs par calage offre un large éventail de possibilités. Nous examinons le calage linéaire, pour lequel nous suggérons d’utiliser une version de non-réponse de l’estimateur de régression optimal fondé sur le plan. Nous faisons des comparaisons entre cet estimateur et un estimateur de type GREG. Les mesures de la distance jouent un rôle très important dans l’élaboration des estimateurs par calage. Nous démontrons qu’un estimateur de la propension moyenne à répondre (probabilité) peut être inclus dans la mesure de la distance « optimale » dans les cas de non-réponse, ce qui aide à réduire le biais de l’estimateur ainsi obtenu. Une étude en simulation a été réalisée pour illustrer de manière empirique les résultats obtenus de façon théorique pour les estimateurs proposés. La population se nomme KYBOK et se compose de municipalités administratives de la Suède, pour lesquelles les variables comprennent des mesures financières et de la taille. Les résultats sont encourageants pour l’estimateur « optimal » combiné à la propension estimative moyenne à répondre, où le biais a été réduit pour la plupart des cas d’échantillonnage de Poisson faisant partie de l’étude.

    Date de diffusion : 2019-12-17

  • Articles et rapports : 12-001-X201400114029
    Description :

    Fay et Train (1995) présentent une méthode qu’ils nomment successive difference replication, c.-à-d. répliques des différences successives, qui peut être utilisée pour estimer la variance d’un total estimé au moyen d’un échantillon aléatoire systématique tiré d’une liste ordonnée. L’estimateur prend la forme générale d’un estimateur de variance par rééchantillonnage, où les facteurs de rééchantillonnage sont construits de manière à imiter l’estimateur par différences successives. Cet estimateur est une modification de celui présenté dans Wolter (1985). Le présent article étend la méthodologie en expliquant l’effet de l’attribution des lignes de matrice sur l’estimateur de variance, en montrant comment un jeu réduit de répliques mène à un estimateur raisonnable et en établissant les conditions pour que la méthode des répliques des différences successives soit équivalente à l’estimateur par différences successives.

    Date de diffusion : 2014-06-27

  • Articles et rapports : 12-001-X201300111831
    Description :

    Nous considérons une estimation prudente de la variance pour l'estimateur de Horvitz-Thompson d'un total de population sous des plans d'échantillonnage avec probabilités d'inclusion par paire nulles, appelés plans « non mesurables ». Nous décomposons l'estimateur de variance de Horvitz-Thompson classique sous ce genre de plan et caractérisons le biais de manière précise. Nous élaborons une correction du biais qui est garantie d'être faiblement prudente (non biaisée négativement) quelle que soit la nature de la non-mesurabilité. L'analyse jette de la lumière sur les conditions sous lesquelles l'estimateur de variance de Horvitz-Thompson classique donne de bons résultats malgré la non-mesurabilité et où la correction du biais prudente peut être meilleure que les approximations utilisées habituellement.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X200700210490
    Description :

    L'Enquête européenne sur le revenu et les conditions de vie (Statistics on Income and Living Conditions, SILC) a remplacé le Panel européen à partir de 2004. Elle permet de produire des statistiques annuelles sur la répartition des revenus, ainsi que sur la pauvreté et l'exclusion sociale. Cette enquête longitudinale, dont la collecte a eu lieu pour la première fois en France en mai 2004, touche tous les individus de plus de 15 ans occupant les 16 000 logements tirés dans l'échantillon-maître et la base de sondage des logements neufs. Tous ces individus sont suivis au cours du temps, même lorsqu'ils changent de logement. L'enquête doit aussi fournir des estimations transversales de qualité.

    Afin de limiter la charge des enquêtés, le plan de sondage préconisé pour SILC par Eurostat est un schéma rotatif basé sur quatre panels d'une durée de quatre ans chacun avec remplacement d'un panel tous les ans. La France a néanmoins choisi de porter la durée de ses panels à neuf années. Le plan de sondage rotatif permet de répondre aux besoins longitudinaux et transversaux de l'enquête. Cependant, il pose des défis en matière de pondération.

    Après un rappel du contexte de l'inférence lorsqu'on pratique une enquête longitudinale, l'article traite des pondérations longitudinales et transversales, qui sont conçues de manière à produire des estimateurs approximativement sans biais.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 11-522-X20040018733
    Description :

    Une enquête auprès d'utilisateurs de drogues injectables exploite l'information obtenue des centres d'échange de seringues de même que des utilisateurs échantillonnés. Le cadre méthodologique permet d'en tirer divers estimés.

    Date de diffusion : 2005-10-27

  • Articles et rapports : 12-001-X20050018092
    Description :

    En échantillonnage, quand on dispose d'information auxiliaire, il est bien connu que l'« estimateur (par la régression) optimal » fondé sur le plan de sondage d'un total ou d'une moyenne de population finie est (du moins asymptotiquement) plus efficace que l'estimateur GREG correspondant. Nous illustrerons ce fait au moyen de simulations avec échantillonnage stratifié à partir de populations à distribution asymétrique. Au départ, l'estimateur GREG a été construit au moyen d'un modèle linéaire de superpopulation auxiliaire. Il peut aussi être considéré comme un estimateur par calage, c'est à dire un estimateur linéaire pondéré, où les poids obéissent à l'équation de calage et, sous cette contrainte, sont aussi proches que possible des « poids d'Horvitz Thompson » originaux (d'après une mesure de distance appropriée). Nous montrons que l'estimateur optimal peut aussi être considéré comme un estimateur par calage à cet égard avec une mesure quadratique de distance étroitement liée à celle générant l'estimateur GREG. Nous donnons aussi des exemples simples révélant qu'il n'est pas toujours facile d'obtenir cette nouvelle mesure.

    Date de diffusion : 2005-07-21

  • Articles et rapports : 12-001-X20040027752
    Description :

    Le meilleur estimateur (ou prédicteur) linéaire sans biais (BLU) d'un total de population est fondé sur les deux hypothèses suivantes : i) le modèle d'estimation qui sous tend l'estimateur BLU est spécifié correctement et ii) le plan de sondage est ignorable en ce qui concerne le modèle d'estimation. Dans ce contexte, un estimateur est robuste si sa distribution demeure proche de celle de l'estimateur BLU lorsque les deux hypothèses tiennent et s'il retient de bonnes propriétés lorsque l'une des hypothèses ou les deux ne sont pas entièrement satisfaites. La robustesse aux écarts par rapport à l'hypothèse (i) est appelée robustesse au modèle, tandis que la robustesse aux écarts par rapport à l'hypothèse (ii) est appelée robustesse au plan de sondage. On considère souvent que l'estimateur par la régression généralisée (GREG) est robuste, puisque sa propriété d'être asymptotiquement sans biais par rapport au plan (ASBP) ne dépend ni de l'hypothèse (i) ni de l'hypothèse (ii). Toutefois, si ces deux hypothèses tiennent, l'estimateur GREG est parfois nettement moins efficace que l'estimateur BLU et, en ce sens, n'est pas robuste. L'inefficacité relative de l'estimateur GREG comparativement à l'estimateur BLU est due à la grande dispersion des poids de sondage. Afin d'obtenir un estimateur robuste au plan de sondage, nous proposons donc un compromis entre ces deux estimateurs. Cette approche offre aussi une certaine protection contre les écarts par rapport à l'hypothèse (i). Toutefois, elle ne protège pas contre les données aberrantes, qui peuvent être considérées comme la conséquence d'une erreur de spécification du modèle. Pour traiter les données aberrantes, nous utilisons la technique de l'estimation M généralisée pondérée pour réduire l'influence des unités pour lesquelles les résidus pondérés de population sont importants. Nous proposons deux moyens pratiques de mettre en oeuvre les estimateurs M dans le cas d'enquêtes polyvalentes; soit nous modifions le poids des unités influentes et adoptons une approche par calage pour obtenir un ensemble unique de poids d'estimation robustes soit nous modifions les valeurs des unités influentes. Nous évaluons certaines propriétés de l'approche proposée au moyen d'une étude en simulation portant sur une population finie asymétrique créée à partir de données d'enquête réelles.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 11-522-X20030017704
    Description :

    Dans ce document, on décrit la méthode utilisée pour effectuer la pondération de l'enquête « Construction des identités » menée en France. Le système de pondération pose certains problèmes en raison du chevauchement des bases de sondage et du tirage au hasard de certaines personnes.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 12-001-X20030016612
    Description :

    Dans cette étude, on présente de nouvelles équations de calage dans lesquelles on utilise des moments de deuxième ordre de la variable auxiliaire pour évaluer la moyenne de population sous échantillonnage aléatoire simple stratifié. On présente aussi différentes façons d'évaluer la variance de l'estimateur proposé. Le nouvel estimateur résultant peut être plus efficace que l'estimateur par la régression combiné sous échantillonnage stratifié. Ainsi, on étend l'idée à l'échantillonnage double d'une population stratifiée et on étudie certains résultats de simulation.

    Date de diffusion : 2003-07-31
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (22)

Analyses (22) (0 à 10 de 22 résultats)

  • Articles et rapports : 11-522-X202200100013
    Description : Les répondants des enquêtes auprès des ménages usuelles tendent à fortement sous-déclarer leur éventuel recours à l'aide alimentaire distribuée par les associations. Cette sous-déclaration est très vraisemblablement liée au stigmate social ressenti par les personnes dans une situation de très grandes difficultés financières. Les estimations du nombre de bénéficiaires de cette aide issues des enquêtes sont ainsi très inférieures aux décomptes directs des associations. Ces décomptes, eux, tendent à la surestimation en raison de doubles comptes. L'enquête Aide alimentaire (EAA) collectée fin 2021 en France dans un échantillon de sites d'associations distribuant de l'aide alimentaire permet, par son protocole adapté, de contrôler les biais qui affectent les autres sources et de clarifier l'ampleur du recours à cette aide.
    Date de diffusion : 2024-03-25

  • Articles et rapports : 12-001-X201900300006
    Description :

    Un taux de non-réponse élevé est un problème très courant dans les enquêtes-échantillons de nos jours. Du point de vue statistique, nous entretenons des inquiétudes au sujet du biais et de la variance accrus des estimateurs de chiffres de population comme les totaux ou les moyennes. Diverses méthodes ont été proposées pour compenser ce phénomène. En gros, nous pouvons les diviser en imputation et calage, et c’est sur la dernière méthode que nous nous concentrons ici. La catégorie des estimateurs par calage offre un large éventail de possibilités. Nous examinons le calage linéaire, pour lequel nous suggérons d’utiliser une version de non-réponse de l’estimateur de régression optimal fondé sur le plan. Nous faisons des comparaisons entre cet estimateur et un estimateur de type GREG. Les mesures de la distance jouent un rôle très important dans l’élaboration des estimateurs par calage. Nous démontrons qu’un estimateur de la propension moyenne à répondre (probabilité) peut être inclus dans la mesure de la distance « optimale » dans les cas de non-réponse, ce qui aide à réduire le biais de l’estimateur ainsi obtenu. Une étude en simulation a été réalisée pour illustrer de manière empirique les résultats obtenus de façon théorique pour les estimateurs proposés. La population se nomme KYBOK et se compose de municipalités administratives de la Suède, pour lesquelles les variables comprennent des mesures financières et de la taille. Les résultats sont encourageants pour l’estimateur « optimal » combiné à la propension estimative moyenne à répondre, où le biais a été réduit pour la plupart des cas d’échantillonnage de Poisson faisant partie de l’étude.

    Date de diffusion : 2019-12-17

  • Articles et rapports : 12-001-X201400114029
    Description :

    Fay et Train (1995) présentent une méthode qu’ils nomment successive difference replication, c.-à-d. répliques des différences successives, qui peut être utilisée pour estimer la variance d’un total estimé au moyen d’un échantillon aléatoire systématique tiré d’une liste ordonnée. L’estimateur prend la forme générale d’un estimateur de variance par rééchantillonnage, où les facteurs de rééchantillonnage sont construits de manière à imiter l’estimateur par différences successives. Cet estimateur est une modification de celui présenté dans Wolter (1985). Le présent article étend la méthodologie en expliquant l’effet de l’attribution des lignes de matrice sur l’estimateur de variance, en montrant comment un jeu réduit de répliques mène à un estimateur raisonnable et en établissant les conditions pour que la méthode des répliques des différences successives soit équivalente à l’estimateur par différences successives.

    Date de diffusion : 2014-06-27

  • Articles et rapports : 12-001-X201300111831
    Description :

    Nous considérons une estimation prudente de la variance pour l'estimateur de Horvitz-Thompson d'un total de population sous des plans d'échantillonnage avec probabilités d'inclusion par paire nulles, appelés plans « non mesurables ». Nous décomposons l'estimateur de variance de Horvitz-Thompson classique sous ce genre de plan et caractérisons le biais de manière précise. Nous élaborons une correction du biais qui est garantie d'être faiblement prudente (non biaisée négativement) quelle que soit la nature de la non-mesurabilité. L'analyse jette de la lumière sur les conditions sous lesquelles l'estimateur de variance de Horvitz-Thompson classique donne de bons résultats malgré la non-mesurabilité et où la correction du biais prudente peut être meilleure que les approximations utilisées habituellement.

    Date de diffusion : 2013-06-28

  • Articles et rapports : 12-001-X200700210490
    Description :

    L'Enquête européenne sur le revenu et les conditions de vie (Statistics on Income and Living Conditions, SILC) a remplacé le Panel européen à partir de 2004. Elle permet de produire des statistiques annuelles sur la répartition des revenus, ainsi que sur la pauvreté et l'exclusion sociale. Cette enquête longitudinale, dont la collecte a eu lieu pour la première fois en France en mai 2004, touche tous les individus de plus de 15 ans occupant les 16 000 logements tirés dans l'échantillon-maître et la base de sondage des logements neufs. Tous ces individus sont suivis au cours du temps, même lorsqu'ils changent de logement. L'enquête doit aussi fournir des estimations transversales de qualité.

    Afin de limiter la charge des enquêtés, le plan de sondage préconisé pour SILC par Eurostat est un schéma rotatif basé sur quatre panels d'une durée de quatre ans chacun avec remplacement d'un panel tous les ans. La France a néanmoins choisi de porter la durée de ses panels à neuf années. Le plan de sondage rotatif permet de répondre aux besoins longitudinaux et transversaux de l'enquête. Cependant, il pose des défis en matière de pondération.

    Après un rappel du contexte de l'inférence lorsqu'on pratique une enquête longitudinale, l'article traite des pondérations longitudinales et transversales, qui sont conçues de manière à produire des estimateurs approximativement sans biais.

    Date de diffusion : 2008-01-03

  • Articles et rapports : 11-522-X20040018733
    Description :

    Une enquête auprès d'utilisateurs de drogues injectables exploite l'information obtenue des centres d'échange de seringues de même que des utilisateurs échantillonnés. Le cadre méthodologique permet d'en tirer divers estimés.

    Date de diffusion : 2005-10-27

  • Articles et rapports : 12-001-X20050018092
    Description :

    En échantillonnage, quand on dispose d'information auxiliaire, il est bien connu que l'« estimateur (par la régression) optimal » fondé sur le plan de sondage d'un total ou d'une moyenne de population finie est (du moins asymptotiquement) plus efficace que l'estimateur GREG correspondant. Nous illustrerons ce fait au moyen de simulations avec échantillonnage stratifié à partir de populations à distribution asymétrique. Au départ, l'estimateur GREG a été construit au moyen d'un modèle linéaire de superpopulation auxiliaire. Il peut aussi être considéré comme un estimateur par calage, c'est à dire un estimateur linéaire pondéré, où les poids obéissent à l'équation de calage et, sous cette contrainte, sont aussi proches que possible des « poids d'Horvitz Thompson » originaux (d'après une mesure de distance appropriée). Nous montrons que l'estimateur optimal peut aussi être considéré comme un estimateur par calage à cet égard avec une mesure quadratique de distance étroitement liée à celle générant l'estimateur GREG. Nous donnons aussi des exemples simples révélant qu'il n'est pas toujours facile d'obtenir cette nouvelle mesure.

    Date de diffusion : 2005-07-21

  • Articles et rapports : 12-001-X20040027752
    Description :

    Le meilleur estimateur (ou prédicteur) linéaire sans biais (BLU) d'un total de population est fondé sur les deux hypothèses suivantes : i) le modèle d'estimation qui sous tend l'estimateur BLU est spécifié correctement et ii) le plan de sondage est ignorable en ce qui concerne le modèle d'estimation. Dans ce contexte, un estimateur est robuste si sa distribution demeure proche de celle de l'estimateur BLU lorsque les deux hypothèses tiennent et s'il retient de bonnes propriétés lorsque l'une des hypothèses ou les deux ne sont pas entièrement satisfaites. La robustesse aux écarts par rapport à l'hypothèse (i) est appelée robustesse au modèle, tandis que la robustesse aux écarts par rapport à l'hypothèse (ii) est appelée robustesse au plan de sondage. On considère souvent que l'estimateur par la régression généralisée (GREG) est robuste, puisque sa propriété d'être asymptotiquement sans biais par rapport au plan (ASBP) ne dépend ni de l'hypothèse (i) ni de l'hypothèse (ii). Toutefois, si ces deux hypothèses tiennent, l'estimateur GREG est parfois nettement moins efficace que l'estimateur BLU et, en ce sens, n'est pas robuste. L'inefficacité relative de l'estimateur GREG comparativement à l'estimateur BLU est due à la grande dispersion des poids de sondage. Afin d'obtenir un estimateur robuste au plan de sondage, nous proposons donc un compromis entre ces deux estimateurs. Cette approche offre aussi une certaine protection contre les écarts par rapport à l'hypothèse (i). Toutefois, elle ne protège pas contre les données aberrantes, qui peuvent être considérées comme la conséquence d'une erreur de spécification du modèle. Pour traiter les données aberrantes, nous utilisons la technique de l'estimation M généralisée pondérée pour réduire l'influence des unités pour lesquelles les résidus pondérés de population sont importants. Nous proposons deux moyens pratiques de mettre en oeuvre les estimateurs M dans le cas d'enquêtes polyvalentes; soit nous modifions le poids des unités influentes et adoptons une approche par calage pour obtenir un ensemble unique de poids d'estimation robustes soit nous modifions les valeurs des unités influentes. Nous évaluons certaines propriétés de l'approche proposée au moyen d'une étude en simulation portant sur une population finie asymétrique créée à partir de données d'enquête réelles.

    Date de diffusion : 2005-02-03

  • Articles et rapports : 11-522-X20030017704
    Description :

    Dans ce document, on décrit la méthode utilisée pour effectuer la pondération de l'enquête « Construction des identités » menée en France. Le système de pondération pose certains problèmes en raison du chevauchement des bases de sondage et du tirage au hasard de certaines personnes.

    Date de diffusion : 2005-01-26

  • Articles et rapports : 12-001-X20030016612
    Description :

    Dans cette étude, on présente de nouvelles équations de calage dans lesquelles on utilise des moments de deuxième ordre de la variable auxiliaire pour évaluer la moyenne de population sous échantillonnage aléatoire simple stratifié. On présente aussi différentes façons d'évaluer la variance de l'estimateur proposé. Le nouvel estimateur résultant peut être plus efficace que l'estimateur par la régression combiné sous échantillonnage stratifié. Ainsi, on étend l'idée à l'échantillonnage double d'une population stratifiée et on étudie certains résultats de simulation.

    Date de diffusion : 2003-07-31
Références (1)

Références (1) ((1 résultat))

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19990015674
    Description :

    L'influence de l'environnement sur la santé est un sujet de préoccupation croissante, plus particulièrement les effets de l'émission de polluants industriels dans l'atmosphère, le sol et l'eau. L'évaluation des risques que comporte une source de pollution donnée pour la santé publique est souvent effectuée à l'aide de données démographiques, environementales et relatives à la santé qui sont recueillies couramment par des organismes gouvernementaux. Ces ensembles de données présentent des différences d'échantillonnage notables sur les plans géographique et temporel; ces différences se répercutent sur les analyses épidémiologiques qui utilisent conjointement de tels ensembles. Au Royaumi-Uni, les problèmes de santé sont enregistrés individuellement pour chaque personne. Sont également indiqués le code de cause de maladie, la date du diagnostic ou du décès, et en utilisant le code postal de l'unité comme référence géographique. Par contre, les données démographiques relatives aux petites régions sont enregistrées uniquement lors du recensement décennal et sont diffusés comme données de niveau régional dans des zones qui ne correspondent pas à celles des codes postaux. Des données relatives à l'exposition ambiante sont pourtant disponibles à un autre niveau, selon le type d'exposition et la source des mesures.

    Date de diffusion : 2000-03-02
Date de modification :