Pondération et estimation

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (15)

Tout (15) (0 à 10 de 15 résultats)

  • Articles et rapports : 88F0006X1997013
    Description :

    Statistique Canada est engagé dans un Projet de système d'information sur la science et la technologie qui a pour but de développer des indicateurs d'activité utiles réunis dans un cadre conceptuel permettant de dresser un portrait cohérent de la science et de la technologie au Canada. La Série des documents de travail sert à publier les résultats des différentes initiatives conduites dans le cadre de ce Projet. Les données produites ont trait aux activités, interrelations et résultats de la S-T. Plusieurs grands thèmes sont couverts parmi lesquels on retrouve l'innovation, la diffusion des technologies, les ressources humaines en S-T et les interrelations entre les différents acteurs qui oeuvrent en S-T. Cette série propose aussi d'importantes tabulations de données tirées des enquêtes régulières sur la R-D et S-T et rendues possibles du fait de l'existence du Projet.

    Date de diffusion : 1998-09-25

  • Articles et rapports : 12-001-X19980013904
    Description :

    Un grand nombre des enquêtes économiques et agricoles visent des objectifs multiples. Il serait donc pratique de pouvoir stratifier la population-cible de ces enquêtes de différentes manières - et ainsi répondre à un certain nombre d'objectifs - puis de combiner les échantillons pour le dénombrement. Nous examinons dans ce document quatre méthodes d'échantillonnage distinctes qui prélèvent des échantillons similaires, toutes stratifications confondues, ce qui permet de réduire la taille globale de l'échantillon. L'efficacité de ces stratégies d'échantillonnage est évaluée à la lumière des données extraites d'une enquête sur l'agriculture. Nous indiquons ensuite comment un estimateur par calage (c.-à-d. pondéré de nouveau) peut accroître l'efficacité statistique, en reproduisant dans l'estimation ce que l'on sait de la taille de la strate initiale. La méthode itérative du quotient, qui a été proposée dans certains ouvrages, n'est en fait qu'une méthode de calage.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013905
    Description :

    Les plans d'échantillonnage à deux phases permettent d'utiliser les données auxiliaires de diverses façons. Les auteurs débutent en passant en revue les différents aspects que peuvent prendre ces données dans les enquêtes à deux phases. Ils établissent ensuite la méthode en vertu de laquelle elles sont converties en poids calés dont on se sert pour créer de bons estimateurs d'un total d'une population. Le calage s'effectue en deux étapes: i) au niveau de la population et ii) à celui de l'échantillon de la première phase. Les auteurs montrent qu'on peut aussi dériver les estimateurs issus de calage par régression, également en deux temps. Ils examinent ces estimateurs dans un cas particulier, en l'occurrence quand les données auxiliaires portent sur quelques sous-ensembles de la population baptisés "groupes de calage". Les strates a posteriori en constituent l'illustration la plus simple. Suit une discussion sur l'estimation des domaines d'intérêt et de la variance. Enfin, les résultats sont appliqués à deux importants plans d'échantillonnage à deux phases en usage à Statistique Canada. La théorie générale concernant l'emploi des données auxiliaires dans l'échantillonnage à deux phases sera intégrée au Système généralisé d'estimation de Statistique Canada.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013906
    Description :

    Pour les sondages, il doit idéalement y avoir correspondance de un à un entre les unités de la base de sondage et les élements de la population-cible à l'étude. Dans bien des cas, toutefois, la base de sondage a une structure plusieurs à plusieurs, c'est-à-dire qu'une unité de la base de sondage peut être associée à de multiples éléments de la population-cible et, vice-versa, un élément de la population-cible peut être associé à de multiples unités de la base de sondage. C'est ce qui s'est produit dans le cadre d'une enquête sur les caractéristiques des immeubles, pour laquelle la base de sondage était constituée des adresses de voirie et les immeubles commerciaux formaient la population-cible. La base de sondage était complexe, car une même adresse pouvait correspondre à un seul immeuble, à plusieurs immeubles ou à une partie d'un immeuble. Nous présentons ici des estimateurs et des formules pour en calculer la variance, selon des plans d'échantillonnage aléatoire simple et stratifié, lorsque la base de sondage est de structure plusieurs à plusieurs.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013907
    Description :

    Les amateurs évaluent la méthode d'estimation par les moindres carrés pour les enquêtes répétitives. Ils proposent plusieurs estimateurs pour le niveau courant, le changement de niveau et le niveau moyen applicables à des périodes multiples. Suit la présentation de l'estimateur de régression récursif, méthode récursive permettant de calculer le meilleur estimateur linéaire sans biais d'après l'ensemble des périodes couvertes par l'enquête. On constate qu'il y a convergence de la régression récursive et que le nombre de dimensions de l'estimation est plafonné lorsque le nombre de périodes tend vers l'infini. La méthode récursive apporte une solution au problème de la complexité des calculs que suscite l'estimation non biaisée de la variance minimale dans les enquêtes répétitives. Les auteurs recourent aux données de la U.S. Current Population Survey pour comparer les différents estimateurs, avec deux genres de plan d'échantillonnage: le plan à renouvellement intermittent de la Current Population Survey et deux plans à renouvellement continu.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013908
    Description :

    L'analyse qui suit porte sur le problème qui consiste à estimer la variance de l'estimateur général de régresison linéaire. On a montré que l'approche de calage à bas niveau adoptée par Sändal (1996) est moins ou aussi efficace que celle d'une catégorie d'estimateurs avancée par Deng et Wu (1987). On a aussi proposé une approche par calage à un niveau plus élevé. Les auteurs montrent que cette dernière constitue une amélioration par rapport à l'originale. Plusieurs estimateurs correspondent à des cas particuliers de la nouvelle approche. On a notamment émis l'idée d'obtenir une estimation non négative de la variance de l'estimateur GREG. Les résultats ont été appliqués à un plan d'échantillonnage aléatoire stratifié. On a aussi entrepris une étude empirique afin de jauger l'efficacité des stratégies envisagées. Le logiciel de statistique SGE bien connu, élaboré par Statistique Canada, peut être perfectionné en vue de fournir une estimation plus précise de la variance de l'estimateur GREG par calage à niveau élevé, dans certaines circonstances examinées plus bas.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013909
    Description :

    Dans cet article, les auteurs examinent comment estimer la fréquence des classes d'une variable discrète associée aux réponses par le biais d'un modèle. L'estimation fait appel à une nouvelle méthode d'estimation des données d'enquête, étroitement liée à l'estimation par régression généralisée. Dans cette dernière, les données sur les variables auxiliaires sont intégrées à la méthode d'estimation par ajustement au moyen d'un modèle linéaire. Au lieu de recourir à un modèle linéaire pour les indicateurs de classe, nous décrivons la distribution combinée des indicateurs de classe par un modèle logistique multinominal. Les auteurs présentent des estimateurs de régression généralisés logistiques pour la fréquence des classes au sein d'une population et de divers domaines. Ils ont entrepris des essais de Monte Carlo sur des données simulées et les données réelles issues de l'Enquête sur la population active menée chaque mois par Statistics Finland. L'estimation de régression généralisée logistique donne de meilleurs résultats que l'estimation de régression ordinaire pour les petits domaines, en particulier les classes à faible fréquence.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013910
    Description :

    Soit A, le domaine de la population auquel on s’intéresse. Supposons qu’il est impossible d’identifier les éléments de A dans la base de sondage et qu’on ignore le nombre d’éléments que contient A. Supposons en outre qu’on prélève un échantillon de taille fixe (n par exemple) de la base de sondage et que la taille de l’échantillon du domaine résultant (appelons-la n_A) soit aléatoire. Le problème consiste à bâtir un intervalle de confiance pour un paramètre du domaine tel que 1’agrégat du domaine T_A = \sum_{i \in A} x_i. Habituellement, la solution consiste à redéfinir x_i en établissant x_i = 0 si i \notin A. Au lieu de construire un intervalle de confiance pour le total du domaine, on en construit donc un pour un total de la population, ce que permet de satisfaire la théorie de la distribution normale (de façon asymptotique pour n). Une autre solution consisterait à imposer des conditions à n_A et à bâtir des intervalles de confiance à couverture presque nominale, avec certaines hypothèses se rapportant à la population du domaine. Les auteurs évaluent la nouvelle approche de manière empirique au moyen de populations artificielles et des données de l’Occupational Compensation Survey du Bureau of Labor Statistics (BLS).

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013911
    Description :

    Dans cet article, l'auteur se penche sur les grandes propriétés de l'estimateur de régression généralisé de la moyenne d'une population finie et de l'estimateur de régression dérivé de l'estimateur de la différence optimale. Comme le second s'avère plus efficace que le premier, on cerne les conditions à l'origine de la situation et présente un critère qui facilitera le choix entre les deux estimateurs. Une étude de simulation illustre la performance des estimateurs avec un échantillon fini.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013912
    Description :

    Le présent article traite de méthodes efficaces d'estimation de la taille et des chiffres de la population, à partir de données extraites de listes multiplis et d'une base aréolaire indépendante. Ces travaux constituent un prolongement de la méthode proposée par Hartley (1962), qui porte sur deux bases de sondage générales. Un des principaux inconvénients des listes vient de ce que celles-ci sont habituellement incomplètes. Nous proposons dans cet article plusieurs méthodes pour pallier ces lacunes. Un plan d'échantillonnage mixte alliant l'utilisation d'une liste et d'une base aréolaire permet d'inclure des bases de sondage multiples et de couvrir entièrement la population-cible. Pour chaque combinaison de bases de sondage qui est proposée, nous indiquons les notations qui s'y rapportent, la fonction de vraisemblance et les estimateurs de paramètres. Nous présentons également les résultats d'une étude de simulation qui compare les diverses caractéristiques des estimateurs proposés.

    Date de diffusion : 1998-07-31
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (15)

Analyses (15) (0 à 10 de 15 résultats)

  • Articles et rapports : 88F0006X1997013
    Description :

    Statistique Canada est engagé dans un Projet de système d'information sur la science et la technologie qui a pour but de développer des indicateurs d'activité utiles réunis dans un cadre conceptuel permettant de dresser un portrait cohérent de la science et de la technologie au Canada. La Série des documents de travail sert à publier les résultats des différentes initiatives conduites dans le cadre de ce Projet. Les données produites ont trait aux activités, interrelations et résultats de la S-T. Plusieurs grands thèmes sont couverts parmi lesquels on retrouve l'innovation, la diffusion des technologies, les ressources humaines en S-T et les interrelations entre les différents acteurs qui oeuvrent en S-T. Cette série propose aussi d'importantes tabulations de données tirées des enquêtes régulières sur la R-D et S-T et rendues possibles du fait de l'existence du Projet.

    Date de diffusion : 1998-09-25

  • Articles et rapports : 12-001-X19980013904
    Description :

    Un grand nombre des enquêtes économiques et agricoles visent des objectifs multiples. Il serait donc pratique de pouvoir stratifier la population-cible de ces enquêtes de différentes manières - et ainsi répondre à un certain nombre d'objectifs - puis de combiner les échantillons pour le dénombrement. Nous examinons dans ce document quatre méthodes d'échantillonnage distinctes qui prélèvent des échantillons similaires, toutes stratifications confondues, ce qui permet de réduire la taille globale de l'échantillon. L'efficacité de ces stratégies d'échantillonnage est évaluée à la lumière des données extraites d'une enquête sur l'agriculture. Nous indiquons ensuite comment un estimateur par calage (c.-à-d. pondéré de nouveau) peut accroître l'efficacité statistique, en reproduisant dans l'estimation ce que l'on sait de la taille de la strate initiale. La méthode itérative du quotient, qui a été proposée dans certains ouvrages, n'est en fait qu'une méthode de calage.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013905
    Description :

    Les plans d'échantillonnage à deux phases permettent d'utiliser les données auxiliaires de diverses façons. Les auteurs débutent en passant en revue les différents aspects que peuvent prendre ces données dans les enquêtes à deux phases. Ils établissent ensuite la méthode en vertu de laquelle elles sont converties en poids calés dont on se sert pour créer de bons estimateurs d'un total d'une population. Le calage s'effectue en deux étapes: i) au niveau de la population et ii) à celui de l'échantillon de la première phase. Les auteurs montrent qu'on peut aussi dériver les estimateurs issus de calage par régression, également en deux temps. Ils examinent ces estimateurs dans un cas particulier, en l'occurrence quand les données auxiliaires portent sur quelques sous-ensembles de la population baptisés "groupes de calage". Les strates a posteriori en constituent l'illustration la plus simple. Suit une discussion sur l'estimation des domaines d'intérêt et de la variance. Enfin, les résultats sont appliqués à deux importants plans d'échantillonnage à deux phases en usage à Statistique Canada. La théorie générale concernant l'emploi des données auxiliaires dans l'échantillonnage à deux phases sera intégrée au Système généralisé d'estimation de Statistique Canada.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013906
    Description :

    Pour les sondages, il doit idéalement y avoir correspondance de un à un entre les unités de la base de sondage et les élements de la population-cible à l'étude. Dans bien des cas, toutefois, la base de sondage a une structure plusieurs à plusieurs, c'est-à-dire qu'une unité de la base de sondage peut être associée à de multiples éléments de la population-cible et, vice-versa, un élément de la population-cible peut être associé à de multiples unités de la base de sondage. C'est ce qui s'est produit dans le cadre d'une enquête sur les caractéristiques des immeubles, pour laquelle la base de sondage était constituée des adresses de voirie et les immeubles commerciaux formaient la population-cible. La base de sondage était complexe, car une même adresse pouvait correspondre à un seul immeuble, à plusieurs immeubles ou à une partie d'un immeuble. Nous présentons ici des estimateurs et des formules pour en calculer la variance, selon des plans d'échantillonnage aléatoire simple et stratifié, lorsque la base de sondage est de structure plusieurs à plusieurs.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013907
    Description :

    Les amateurs évaluent la méthode d'estimation par les moindres carrés pour les enquêtes répétitives. Ils proposent plusieurs estimateurs pour le niveau courant, le changement de niveau et le niveau moyen applicables à des périodes multiples. Suit la présentation de l'estimateur de régression récursif, méthode récursive permettant de calculer le meilleur estimateur linéaire sans biais d'après l'ensemble des périodes couvertes par l'enquête. On constate qu'il y a convergence de la régression récursive et que le nombre de dimensions de l'estimation est plafonné lorsque le nombre de périodes tend vers l'infini. La méthode récursive apporte une solution au problème de la complexité des calculs que suscite l'estimation non biaisée de la variance minimale dans les enquêtes répétitives. Les auteurs recourent aux données de la U.S. Current Population Survey pour comparer les différents estimateurs, avec deux genres de plan d'échantillonnage: le plan à renouvellement intermittent de la Current Population Survey et deux plans à renouvellement continu.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013908
    Description :

    L'analyse qui suit porte sur le problème qui consiste à estimer la variance de l'estimateur général de régresison linéaire. On a montré que l'approche de calage à bas niveau adoptée par Sändal (1996) est moins ou aussi efficace que celle d'une catégorie d'estimateurs avancée par Deng et Wu (1987). On a aussi proposé une approche par calage à un niveau plus élevé. Les auteurs montrent que cette dernière constitue une amélioration par rapport à l'originale. Plusieurs estimateurs correspondent à des cas particuliers de la nouvelle approche. On a notamment émis l'idée d'obtenir une estimation non négative de la variance de l'estimateur GREG. Les résultats ont été appliqués à un plan d'échantillonnage aléatoire stratifié. On a aussi entrepris une étude empirique afin de jauger l'efficacité des stratégies envisagées. Le logiciel de statistique SGE bien connu, élaboré par Statistique Canada, peut être perfectionné en vue de fournir une estimation plus précise de la variance de l'estimateur GREG par calage à niveau élevé, dans certaines circonstances examinées plus bas.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013909
    Description :

    Dans cet article, les auteurs examinent comment estimer la fréquence des classes d'une variable discrète associée aux réponses par le biais d'un modèle. L'estimation fait appel à une nouvelle méthode d'estimation des données d'enquête, étroitement liée à l'estimation par régression généralisée. Dans cette dernière, les données sur les variables auxiliaires sont intégrées à la méthode d'estimation par ajustement au moyen d'un modèle linéaire. Au lieu de recourir à un modèle linéaire pour les indicateurs de classe, nous décrivons la distribution combinée des indicateurs de classe par un modèle logistique multinominal. Les auteurs présentent des estimateurs de régression généralisés logistiques pour la fréquence des classes au sein d'une population et de divers domaines. Ils ont entrepris des essais de Monte Carlo sur des données simulées et les données réelles issues de l'Enquête sur la population active menée chaque mois par Statistics Finland. L'estimation de régression généralisée logistique donne de meilleurs résultats que l'estimation de régression ordinaire pour les petits domaines, en particulier les classes à faible fréquence.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013910
    Description :

    Soit A, le domaine de la population auquel on s’intéresse. Supposons qu’il est impossible d’identifier les éléments de A dans la base de sondage et qu’on ignore le nombre d’éléments que contient A. Supposons en outre qu’on prélève un échantillon de taille fixe (n par exemple) de la base de sondage et que la taille de l’échantillon du domaine résultant (appelons-la n_A) soit aléatoire. Le problème consiste à bâtir un intervalle de confiance pour un paramètre du domaine tel que 1’agrégat du domaine T_A = \sum_{i \in A} x_i. Habituellement, la solution consiste à redéfinir x_i en établissant x_i = 0 si i \notin A. Au lieu de construire un intervalle de confiance pour le total du domaine, on en construit donc un pour un total de la population, ce que permet de satisfaire la théorie de la distribution normale (de façon asymptotique pour n). Une autre solution consisterait à imposer des conditions à n_A et à bâtir des intervalles de confiance à couverture presque nominale, avec certaines hypothèses se rapportant à la population du domaine. Les auteurs évaluent la nouvelle approche de manière empirique au moyen de populations artificielles et des données de l’Occupational Compensation Survey du Bureau of Labor Statistics (BLS).

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013911
    Description :

    Dans cet article, l'auteur se penche sur les grandes propriétés de l'estimateur de régression généralisé de la moyenne d'une population finie et de l'estimateur de régression dérivé de l'estimateur de la différence optimale. Comme le second s'avère plus efficace que le premier, on cerne les conditions à l'origine de la situation et présente un critère qui facilitera le choix entre les deux estimateurs. Une étude de simulation illustre la performance des estimateurs avec un échantillon fini.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013912
    Description :

    Le présent article traite de méthodes efficaces d'estimation de la taille et des chiffres de la population, à partir de données extraites de listes multiplis et d'une base aréolaire indépendante. Ces travaux constituent un prolongement de la méthode proposée par Hartley (1962), qui porte sur deux bases de sondage générales. Un des principaux inconvénients des listes vient de ce que celles-ci sont habituellement incomplètes. Nous proposons dans cet article plusieurs méthodes pour pallier ces lacunes. Un plan d'échantillonnage mixte alliant l'utilisation d'une liste et d'une base aréolaire permet d'inclure des bases de sondage multiples et de couvrir entièrement la population-cible. Pour chaque combinaison de bases de sondage qui est proposée, nous indiquons les notations qui s'y rapportent, la fonction de vraisemblance et les estimateurs de paramètres. Nous présentons également les résultats d'une étude de simulation qui compare les diverses caractéristiques des estimateurs proposés.

    Date de diffusion : 1998-07-31
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :