Pondération et estimation

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (16)

Tout (16) (0 à 10 de 16 résultats)

  • Articles et rapports : 75F0002M2007007
    Description :

    L'Enquête sur la Dynamique du travail et du revenu (EDTR), introduite à l'année de référence 1993, est une enquête longitudinale par panel menée auprès des individus. Elle vise à mesurer les changements au niveau du bien-être économique des individus et les facteurs qui peuvent influencer ces changements. L'échantillon de l'EDTR est divisé en deux panels qui se chevauchent, d'une durée de six ans chacun. Les enquêtes longitudinales, comme l'EDTR, sont particulières de par la nature dynamique de la composition de leur échantillon, engendrée directement par la dynamique des familles et des ménages au fil des ans. À chaque année de référence, l'EDTR produit deux ensembles de poids : un ensemble de poids qui est représentatif de la population initiale d'un panel (l'aspect longitudinal) et un autre qui est représentatif de la population actuelle (l'aspect transversal). Depuis 2002, un troisième ensemble de poids combinant deux panels se chevauchant pour former un nouvel échantillon longitudinal est aussi produit (appelé pondération longitudinale combinée).

    Pour la production de poids transversaux, l'EDTR combine deux échantillons indépendants et assigne un poids aux individus qui se sont joints à l'échantillon après la sélection de l'échantillon initial. Les poids longitudinaux tout comme les poids transversaux sont ajustés pour la non-réponse et les valeurs influentes. De plus, un redressement de l'échantillon est effectué pour représenter la population cible. Le but de ce document est donc de décrire la méthodologie employée à l'EDTR pour pondérer les échantillons longitudinal et transversal, et de présenter les développements importants à venir. Afin de mieux illustrer la stratégie de pondération, les résultats de l'année de référence 2003 sont utilisés. Il est à noter que la méthodologie employée pour la pondération longitudinale combinée ne sera pas présentée dans ce document puisqu'elle est décrite de façon exhaustive dans Naud (2004).

    Date de diffusion : 2007-10-18

  • Articles et rapports : 12-001-X20070019847
    Description :

    Nous étudions l'effet de l'échantillonnage en grappes sur les erreurs-types dans l'analyse des données d'enquête longitudinale. Nous considérons une classe de modèles de régression pour données longitudinales d'usage très répandu et une classe standard d'estimateurs ponctuels de type moindres carrés généralisés. Nous soutenons théoriquement que l'effet de la non prise en compte de la mise en grappes dans l'estimation de l'erreur type a tendance à augmenter avec le nombre de vagues de l'enquête incluses dans l'analyse, sous certains scénarios de mise en grappes raisonnables pour de nombreuses enquêtes sociales. La conséquence est qu'en général, il est au moins aussi important de tenir compte de la mise en grappes dans le calcul des erreurs types dans le cas des analyses longitudinales que dans celui des analyses transversales. Nous illustrons cet argument théorique à l'aide des résultats empiriques d'une analyse par régression de données longitudinales sur les attitudes à l'égard des rôles de l'homme et de la femme provenant de l'enquête par panel menée auprès des ménages au Royaume-Uni (British Household Panel Survey). Nous comparons aussi deux approches d'estimation de la variance dans l'analyse des données d'enquête longitudinale, à savoir une approche par plan de sondage basée sur la linéarisation et une approche par modélisation multiniveaux. Nous concluons que l'effet de la mise en grappes peut être sérieusement sous estimé si l'on se contente, en vue d'en tenir compte, d'inclure un effet aléatoire additif pour représenter la mise en grappes dans un modèle multiniveaux.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019849
    Description :

    Dans les sondages où les unités ont des probabilités inégales d'inclusion dans l'échantillon, les associations entre la probabilité d'inclusion et la statistique d'intérêt peuvent causer un biais. Des poids égaux à l'inverse de la probabilité d'inclusion sont souvent utilisés pour neutraliser ce biais. Les plans de sondage fortement disproportionnels comportent des poids de valeur élevée qui peuvent introduire une variabilité indésirable dans les statistiques telles que l'estimateur de la moyenne de population ou l'estimateur de la pente de la régression de population. La réduction des poids consiste à modifier ceux dont la valeur est élevée à une valeur seuil fixe et à ajuster ceux inférieurs à cette valeur de façon à ce que la somme de ces poids réduits demeure égale à la somme des poids non réduits, ce qui réduit la variabilité au prix de l'introduction d'un certain biais. La plupart des approches ordinaires sont ponctuelles en ce sens qu'elles n'utilisent pas les données en vue d'optimiser le compromis entre le biais et la variance. Les approches dictées par les données qui sont décrites dans la littérature sont un peu plus efficaces que les estimateurs entièrement pondérés. Dans le présent article, nous élaborons des méthodes bayésiennes de réduction des poids d'estimateurs par la régression linéaire et par la régression linéaire généralisée sous des plans de sondage avec probabilités d'inclusion inégales. Nous décrivons une application à l'estimation du risque de blessure chez les enfants installés sur le siège arrière dans les camionnettes compactes à cabine allongée à l'aide des données de la Partners for Child Passenger Safety surveillance survey.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019850
    Description :

    De l'information auxiliaire est souvent utilisée pour améliorer la précision des estimateurs des moyennes et des totaux de population finie grâce à des techniques d'estimation par le ratio ou par la régression linéaire. Les estimateurs résultants ont de bonnes propriétés théoriques et pratiques, dont l'invariance, le calage et la convergence par rapport au plan de sondage. Cependant, il n'est pas toujours certain que les modèles de ratio et les modèles linéaires sont de bonnes approximations de la relation réelle entre les variables auxiliaires et la variable d'intérêt, ce qui cause une perte d'efficacité si le modèle n'est pas approprié. Dans le présent article, nous expliquons comment on peut étendre l'estimation par la régression afin d'intégrer des modèles de régression semi­paramétriques dans le cas de plans de sondage simples ainsi que plus complexes. Tout en retenant les bonnes propriétés théoriques et pratiques des modèles linéaires, les modèles semi­paramétriques reflètent mieux les relations complexes entre les variables, ce qui se traduit souvent par des gains importants d'efficacité. Nous illustrerons l'applicabilité de l'approche à des plans de sondage complexes comportant de nombreux types de variables auxiliaires en estimant plusieurs caractéristiques liées à l'acidification dans le cas d'une enquête sur les lacs du Nord­Est des États­Unis.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019851
    Description :

    Pour modéliser la dépréciation économique, on utilise une base de données qui contient des informations sur les actifs dont des entreprises se départissent. On connaît les prix d'acquisition et de revente ainsi que les durées d'utilisation de ces actifs. Cependant, les actifs dont on observe les prix sont uniquement ceux qui ont fait l'objet d'une transaction. Bien que la dépréciation d'un actif soit présente de façon continue au cours de sa vie, on ne connaît donc cette valeur que lorsqu'il y a eu transaction. La présente note propose une pondération ex post afin d'atténuer, au moins en partie, cet effet dans la détermination des modèles économétriques.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019852
    Description :

    Une classe courante de plans de sondage comprend la sélection de toutes les personnes dans les ménages échantillonnés. Des estimateurs par la régression généralisée peuvent être calculés au niveau de la personne ou du ménage. L'utilisation de l'estimateur au niveau du ménage est commode parce que la même pondération d'estimation est appliquée à tous les membres du ménage. Dans le présent article, nous comparons théoriquement et empiriquement les deux approches dans le cas de l'échantillonnage aléatoire simple de ménages et la sélection de toutes les personnes présentes dans chaque ménage échantillonné. Nous constatons que l'approche au niveau du ménage est théoriquement plus efficace dans le cas de grands échantillons et que toute inefficacité empirique dans les petits échantillons est limitée.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019853
    Description :

    L'échantillonnage à deux phases est un plan utile lorsque l'on ne dispose pas de variables auxiliaires a priori. L'estimation de la variance sous ce plan est toutefois compliquée, particulièrement si les fractions d'échantillonnage sont grandes. Le présent article décrit une méthode bootstrap simple pour l'échantillonnage aléatoire simple à deux phases sans remise à chaque phase avec fraction d'échantillonnage élevée. Elle est applicable à l'estimation des fonctions de répartition et des quantiles, puisqu'aucune remise à l'échelle n'est effectuée. La méthode peut être étendue à l'échantillonnage à deux phases stratifié en répétant indépendamment la procédure proposée dans diverses strates. L'estimation de la variance de certains estimateurs classiques, comme les estimateurs par le ratio et par la régression, est étudiée à titre d'exemple. Une étude par simulation est réalisée pour comparer la méthode proposée aux estimateurs de la variance existants pour l'estimation des fonctions de répartition et des quantiles.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019854
    Description :

    Nous dérivons un estimateur de l'erreur quadratique moyenne (EQM) de l'estimateur de Bayes empirique et composite de la moyenne locale dans les conditions standard de petits domaines. L'estimateur de l'EQM est un composite de l'estimateur établi, fondé sur l'espérance conditionnelle de l'écart aléatoire associé au domaine, et d'un estimateur naïf de l'EQM fondé sur le plan de sondage. Nous évaluons ses propriétés par simulation. Enfin, nous examinons des variantes de cet estimateur de l'EQM et décrivons certaines extensions.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019855
    Description :

    Dans les sondages en grappes, la non réponse concernant une variable dépend souvent d'un effet aléatoire au niveau de la grappe et n'est donc pas ignorable. Les estimateurs de la moyenne de population obtenus par imputation par la moyenne ou par repondération sous l'hypothèse de non réponse ignorable sont alors biaisés. Nous proposons un estimateur sans biais de la moyenne de population obtenu par imputation ou par repondération dans chaque grappe échantillonnée ou dans un groupe de grappes échantillonnées ayant une caractéristique commune. Nous présentons certains résultats obtenus par simulation en vue d'étudier les propriétés de l'estimateur proposé.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 11-522-X20050019449
    Description :

    La littérature portant sur la théorie de l'estimation à base multiple se concentre sur les bases doubles et ne se préoccupe que rarement du problème pratique important de l'estimation de la variance. En utilisant une approche de multiplicité, nous proposons un estimateur à base simple et à pondération fixe pour les enquêtes à base multiple.

    Date de diffusion : 2007-03-02
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (16)

Analyses (16) (0 à 10 de 16 résultats)

  • Articles et rapports : 75F0002M2007007
    Description :

    L'Enquête sur la Dynamique du travail et du revenu (EDTR), introduite à l'année de référence 1993, est une enquête longitudinale par panel menée auprès des individus. Elle vise à mesurer les changements au niveau du bien-être économique des individus et les facteurs qui peuvent influencer ces changements. L'échantillon de l'EDTR est divisé en deux panels qui se chevauchent, d'une durée de six ans chacun. Les enquêtes longitudinales, comme l'EDTR, sont particulières de par la nature dynamique de la composition de leur échantillon, engendrée directement par la dynamique des familles et des ménages au fil des ans. À chaque année de référence, l'EDTR produit deux ensembles de poids : un ensemble de poids qui est représentatif de la population initiale d'un panel (l'aspect longitudinal) et un autre qui est représentatif de la population actuelle (l'aspect transversal). Depuis 2002, un troisième ensemble de poids combinant deux panels se chevauchant pour former un nouvel échantillon longitudinal est aussi produit (appelé pondération longitudinale combinée).

    Pour la production de poids transversaux, l'EDTR combine deux échantillons indépendants et assigne un poids aux individus qui se sont joints à l'échantillon après la sélection de l'échantillon initial. Les poids longitudinaux tout comme les poids transversaux sont ajustés pour la non-réponse et les valeurs influentes. De plus, un redressement de l'échantillon est effectué pour représenter la population cible. Le but de ce document est donc de décrire la méthodologie employée à l'EDTR pour pondérer les échantillons longitudinal et transversal, et de présenter les développements importants à venir. Afin de mieux illustrer la stratégie de pondération, les résultats de l'année de référence 2003 sont utilisés. Il est à noter que la méthodologie employée pour la pondération longitudinale combinée ne sera pas présentée dans ce document puisqu'elle est décrite de façon exhaustive dans Naud (2004).

    Date de diffusion : 2007-10-18

  • Articles et rapports : 12-001-X20070019847
    Description :

    Nous étudions l'effet de l'échantillonnage en grappes sur les erreurs-types dans l'analyse des données d'enquête longitudinale. Nous considérons une classe de modèles de régression pour données longitudinales d'usage très répandu et une classe standard d'estimateurs ponctuels de type moindres carrés généralisés. Nous soutenons théoriquement que l'effet de la non prise en compte de la mise en grappes dans l'estimation de l'erreur type a tendance à augmenter avec le nombre de vagues de l'enquête incluses dans l'analyse, sous certains scénarios de mise en grappes raisonnables pour de nombreuses enquêtes sociales. La conséquence est qu'en général, il est au moins aussi important de tenir compte de la mise en grappes dans le calcul des erreurs types dans le cas des analyses longitudinales que dans celui des analyses transversales. Nous illustrons cet argument théorique à l'aide des résultats empiriques d'une analyse par régression de données longitudinales sur les attitudes à l'égard des rôles de l'homme et de la femme provenant de l'enquête par panel menée auprès des ménages au Royaume-Uni (British Household Panel Survey). Nous comparons aussi deux approches d'estimation de la variance dans l'analyse des données d'enquête longitudinale, à savoir une approche par plan de sondage basée sur la linéarisation et une approche par modélisation multiniveaux. Nous concluons que l'effet de la mise en grappes peut être sérieusement sous estimé si l'on se contente, en vue d'en tenir compte, d'inclure un effet aléatoire additif pour représenter la mise en grappes dans un modèle multiniveaux.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019849
    Description :

    Dans les sondages où les unités ont des probabilités inégales d'inclusion dans l'échantillon, les associations entre la probabilité d'inclusion et la statistique d'intérêt peuvent causer un biais. Des poids égaux à l'inverse de la probabilité d'inclusion sont souvent utilisés pour neutraliser ce biais. Les plans de sondage fortement disproportionnels comportent des poids de valeur élevée qui peuvent introduire une variabilité indésirable dans les statistiques telles que l'estimateur de la moyenne de population ou l'estimateur de la pente de la régression de population. La réduction des poids consiste à modifier ceux dont la valeur est élevée à une valeur seuil fixe et à ajuster ceux inférieurs à cette valeur de façon à ce que la somme de ces poids réduits demeure égale à la somme des poids non réduits, ce qui réduit la variabilité au prix de l'introduction d'un certain biais. La plupart des approches ordinaires sont ponctuelles en ce sens qu'elles n'utilisent pas les données en vue d'optimiser le compromis entre le biais et la variance. Les approches dictées par les données qui sont décrites dans la littérature sont un peu plus efficaces que les estimateurs entièrement pondérés. Dans le présent article, nous élaborons des méthodes bayésiennes de réduction des poids d'estimateurs par la régression linéaire et par la régression linéaire généralisée sous des plans de sondage avec probabilités d'inclusion inégales. Nous décrivons une application à l'estimation du risque de blessure chez les enfants installés sur le siège arrière dans les camionnettes compactes à cabine allongée à l'aide des données de la Partners for Child Passenger Safety surveillance survey.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019850
    Description :

    De l'information auxiliaire est souvent utilisée pour améliorer la précision des estimateurs des moyennes et des totaux de population finie grâce à des techniques d'estimation par le ratio ou par la régression linéaire. Les estimateurs résultants ont de bonnes propriétés théoriques et pratiques, dont l'invariance, le calage et la convergence par rapport au plan de sondage. Cependant, il n'est pas toujours certain que les modèles de ratio et les modèles linéaires sont de bonnes approximations de la relation réelle entre les variables auxiliaires et la variable d'intérêt, ce qui cause une perte d'efficacité si le modèle n'est pas approprié. Dans le présent article, nous expliquons comment on peut étendre l'estimation par la régression afin d'intégrer des modèles de régression semi­paramétriques dans le cas de plans de sondage simples ainsi que plus complexes. Tout en retenant les bonnes propriétés théoriques et pratiques des modèles linéaires, les modèles semi­paramétriques reflètent mieux les relations complexes entre les variables, ce qui se traduit souvent par des gains importants d'efficacité. Nous illustrerons l'applicabilité de l'approche à des plans de sondage complexes comportant de nombreux types de variables auxiliaires en estimant plusieurs caractéristiques liées à l'acidification dans le cas d'une enquête sur les lacs du Nord­Est des États­Unis.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019851
    Description :

    Pour modéliser la dépréciation économique, on utilise une base de données qui contient des informations sur les actifs dont des entreprises se départissent. On connaît les prix d'acquisition et de revente ainsi que les durées d'utilisation de ces actifs. Cependant, les actifs dont on observe les prix sont uniquement ceux qui ont fait l'objet d'une transaction. Bien que la dépréciation d'un actif soit présente de façon continue au cours de sa vie, on ne connaît donc cette valeur que lorsqu'il y a eu transaction. La présente note propose une pondération ex post afin d'atténuer, au moins en partie, cet effet dans la détermination des modèles économétriques.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019852
    Description :

    Une classe courante de plans de sondage comprend la sélection de toutes les personnes dans les ménages échantillonnés. Des estimateurs par la régression généralisée peuvent être calculés au niveau de la personne ou du ménage. L'utilisation de l'estimateur au niveau du ménage est commode parce que la même pondération d'estimation est appliquée à tous les membres du ménage. Dans le présent article, nous comparons théoriquement et empiriquement les deux approches dans le cas de l'échantillonnage aléatoire simple de ménages et la sélection de toutes les personnes présentes dans chaque ménage échantillonné. Nous constatons que l'approche au niveau du ménage est théoriquement plus efficace dans le cas de grands échantillons et que toute inefficacité empirique dans les petits échantillons est limitée.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019853
    Description :

    L'échantillonnage à deux phases est un plan utile lorsque l'on ne dispose pas de variables auxiliaires a priori. L'estimation de la variance sous ce plan est toutefois compliquée, particulièrement si les fractions d'échantillonnage sont grandes. Le présent article décrit une méthode bootstrap simple pour l'échantillonnage aléatoire simple à deux phases sans remise à chaque phase avec fraction d'échantillonnage élevée. Elle est applicable à l'estimation des fonctions de répartition et des quantiles, puisqu'aucune remise à l'échelle n'est effectuée. La méthode peut être étendue à l'échantillonnage à deux phases stratifié en répétant indépendamment la procédure proposée dans diverses strates. L'estimation de la variance de certains estimateurs classiques, comme les estimateurs par le ratio et par la régression, est étudiée à titre d'exemple. Une étude par simulation est réalisée pour comparer la méthode proposée aux estimateurs de la variance existants pour l'estimation des fonctions de répartition et des quantiles.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019854
    Description :

    Nous dérivons un estimateur de l'erreur quadratique moyenne (EQM) de l'estimateur de Bayes empirique et composite de la moyenne locale dans les conditions standard de petits domaines. L'estimateur de l'EQM est un composite de l'estimateur établi, fondé sur l'espérance conditionnelle de l'écart aléatoire associé au domaine, et d'un estimateur naïf de l'EQM fondé sur le plan de sondage. Nous évaluons ses propriétés par simulation. Enfin, nous examinons des variantes de cet estimateur de l'EQM et décrivons certaines extensions.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 12-001-X20070019855
    Description :

    Dans les sondages en grappes, la non réponse concernant une variable dépend souvent d'un effet aléatoire au niveau de la grappe et n'est donc pas ignorable. Les estimateurs de la moyenne de population obtenus par imputation par la moyenne ou par repondération sous l'hypothèse de non réponse ignorable sont alors biaisés. Nous proposons un estimateur sans biais de la moyenne de population obtenu par imputation ou par repondération dans chaque grappe échantillonnée ou dans un groupe de grappes échantillonnées ayant une caractéristique commune. Nous présentons certains résultats obtenus par simulation en vue d'étudier les propriétés de l'estimateur proposé.

    Date de diffusion : 2007-06-28

  • Articles et rapports : 11-522-X20050019449
    Description :

    La littérature portant sur la théorie de l'estimation à base multiple se concentre sur les bases doubles et ne se préoccupe que rarement du problème pratique important de l'estimation de la variance. En utilisant une approche de multiplicité, nous proposons un estimateur à base simple et à pondération fixe pour les enquêtes à base multiple.

    Date de diffusion : 2007-03-02
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :