Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (5)

Tout (5) ((5 résultats))

  • Articles et rapports : 12-001-X202300200011
    Description : Le présent article permet d’examiner des plans d’échantillonnage pour les populations qui peuvent être représentées sous forme de matrice N × M. Par exemple, pour l’étude des activités touristiques, les lignes peuvent représenter les endroits visités par les touristes et les colonnes, les jours pendant la saison touristique. L’objectif est d’échantillonner les cellules (i, j) de la matrice lorsque le nombre de sélections dans chaque ligne et chaque colonne est a priori fixe. La taille d’échantillon de la ie ligne représente le nombre de cellules sélectionnées dans la ligne i, tandis que la taille d’échantillon de la je colonne correspond au nombre de cellules sélectionnées dans la colonne j. Un plan d’échantillonnage matriciel donne une matrice d’indicateurs d’échantillon N × M, avec l’entrée 1 à la position (i, j) si la cellule (i, j) est échantillonnée, et 0 autrement. Le premier plan d’échantillonnage matriciel étudié comporte un niveau d’échantillonnage et les tailles d’échantillon des lignes et des colonnes sont établies à l’avance : les tailles d’échantillon des lignes peuvent varier, tandis que les tailles d’échantillon des colonnes sont toutes identiques. Nous pouvons considérer les marges fixes comme des contraintes d’équilibrage et nous examinons les algorithmes possibles pour la sélection de ces échantillons. Nous abordons ensuite un nouvel estimateur de variance de l’estimateur de Horvitz-Thompson pour la moyenne de la variable d’enquête y. Plusieurs niveaux d’échantillonnage peuvent être requis pour tenir compte de toutes les contraintes, ce qui nécessite des plans d’échantillonnage matriciel à plusieurs niveaux, que nous étudions également.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X199400214419
    Description :

    L’objet de cette étude était d’évaluer divers estimateurs pour petites régions dans le but de produire des estimations de niveau pour des domaines non planifiés tirés de l’Enquête sur la population active Italienne. Dans notre étude, les petites régions sont les régions des services de santé, qui sont des domaines territoriaux infrarégionaux non planifiés, qui n’ont pas été isolés au moment de l’établissement du plan d’échantillonnage et qui chevauchent donc les limites des strates du plan d’échantillonnage. Nous considérons les estimateurs suivants : l’estimateur par quotient de stratification a posteriori, l’estimateur synthétique, l’estimateur composite exprimé sous forme d’une combinaison linéaire de l’estimateur synthétique et de l’estimateur par quotient de stratification a posteriori et l’estimateur dépendant de la taille de l’échantillon. Pour tous les estimateurs considérés ici, les biais relatifs moyens en pourcentage et la moyenne des erreurs quadratiques moyennes relatives ont été obtenus par une étude de Monte Carlo dans laquelle le plan d’échantillonnage a été simulé à l’aide de données provenant du recensement de l’Italie de 1981.

    Date de diffusion : 1994-12-15

  • Articles et rapports : 12-001-X199400214423
    Description :

    La plupart des enquêtes souffrent du problème de données manquantes attribuable à la non-réponse. Pour traiter ce problème, on a souvent recours à l’imputation afin de créer un « ensemble de données complet », c’est-à-dire, un ensemble de données composé d’observations réelles (pour les répondants) et d’imputations (pour les non-répondants). Habituellement, on effectue l’imputation en supposant un mécanisme de réponse non-confondu. Quand cette hypothèse se révèle fausse, un biais est introduit dans l’estimateur ordinaire de la moyenne de population calculé à partir de l’ensemble de données complet. Dans le présent article, nous étudions l’idée d’employer des facteurs de correction simples pour régler le problème du biais dans le cas où l’on a recours à l’imputation par quotient. Nous évaluons l’efficacité des facteurs de correction à l’aide d’une simulation de Monte Carlo dans laquelle nous utilisons des ensembles de données produits artificiellement qui représentent divers taux de non-réponse et mécanismes de non-réponse et diverses superpopulations et corrélations entre la variable étudiée et la variable auxiliaire. Nous constatons que ces facteurs de correction sont efficaces, particulièrement lorsque la population suit le modèle sous-jacent l’imputation par quotient. Nous traitons aussi d’une option pour estimer la variance des estimations ponctuelles corrigées.

    Date de diffusion : 1994-12-15

  • Articles et rapports : 12-001-X199300114475
    Description :

    Lorsqu’on crée des bases de données de microsimulation, souvent utilisées dans la planification et l’analyse des politiques, on combine plusieurs fichiers de données par des techniques d’appariement statistique afin d’enrichir le fichier receveur. Or, pour effectuer cette opération, il faut poser l’hypothèse de l’indépendance conditionnelle (HIC), ce qui peut fausser sérieusement les relations conjointes entre les variables. On peut éviter de poser cette hypothèse en utilisant des informations supplémentaires appropriées. Dans cet article, nous examinons des méthodes d’appariement statistique qui correspondent à trois méthodes d’imputation - par régression, hot-deck et log-linéaire - appliquées suivant deux scénarios : avec et sans information supplémentaire. La méthode d’imputation log-linéaire consiste essentiellement à introduire des contraintes nominales dans la méthode par régression ou la méthode hot-deck. À partir d’une vaste étude de simulation faite avec des données fictives, nous exécutons des analyses de sensibilité lorsque l’on s’éloigne de l’HIC et nous étudions les gains qui peuvent découler de l’utilisation d’informations supplémentaires. À l’aide de données fictives, nous créons différents scénarios relatifs à la distribution et aux relations des variables pertinentes, par exemple distribution symétrique vs. distribution asymétrique et données supplémentaires substitutives vs. données supplémentaires non substitutives. Nous faisons aussi quelques recommandations sur l’utilisation des méthodes d’appariement statistique. Notre étude confirme particulièrement que l’HIC peut représenter une contrainte sérieuse, que l’on peut éliminer en utilisant des informations supplémentaires appropriées. L’étude montre aussi que les méthodes hot-deck sont généralement préférables aux méthodes de régression. De plus, lorsqu’on dispose d’informations supplémentaires, les contraintes nominales log-linéaires peuvent accroître l’efficacité des méthodes hot-deck. L’idée de cette étude est née des préoccupations que l’on avait sur l’utilisation de l’HIC dans la construction de la Base de données de simulation des politiques sociales à Statistique Canada.

    Date de diffusion : 1993-06-15

  • Articles et rapports : 12-001-X199100214501
    Description :

    Bien que les enquêtes agricoles du Département de l’agriculture des É.-U. (DAEU) servent à estimer la production végétale à l’échelle du pays et pour chaque État, les estimations par comté sont plus utiles aux décideurs locaux. Ce genre d’estimations sont aussi recherchées par les entreprises qui se spécialisent dans la vente d’engrais, de pesticides, d’assurance-récolte et de matériel agricole. Les États font souvent leurs propres enquêtes dans le but de produire des estimations de la production agricole par comté. En règle générale, ces enquêtes ne reposent pas sur des méthodes d’échantillonnage probabiliste. En outre, la somme des estimations pour chaque comté d’un État doit concorder avec l’estimation calculée par le DAEU pour l’ensemble de l’État. Les méthodes d’estimation classiques pour petites régions ne sont donc pas directement applicables dans les circonstances. Dans cet article, nous allons recourir à des modèles de régression pour estimer la production de blé par comté au Kansas. Nous allons décrire une étude de simulation par laquelle nous comparons les estimations obtenues par régression à celles calculées à l’aide de deux estimateurs classiques pour petites régions : l’estimateur synthétique et l’estimateur direct. Nous allons aussi comparer plusieurs méthodes par lesquelles nous pouvons pondérer les estimations initiales de manière qu’elles concordent avec l’estimation de la production totale de l’État calculée par le DAEU.

    Date de diffusion : 1991-12-16
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (5)

Analyses (5) ((5 résultats))

  • Articles et rapports : 12-001-X202300200011
    Description : Le présent article permet d’examiner des plans d’échantillonnage pour les populations qui peuvent être représentées sous forme de matrice N × M. Par exemple, pour l’étude des activités touristiques, les lignes peuvent représenter les endroits visités par les touristes et les colonnes, les jours pendant la saison touristique. L’objectif est d’échantillonner les cellules (i, j) de la matrice lorsque le nombre de sélections dans chaque ligne et chaque colonne est a priori fixe. La taille d’échantillon de la ie ligne représente le nombre de cellules sélectionnées dans la ligne i, tandis que la taille d’échantillon de la je colonne correspond au nombre de cellules sélectionnées dans la colonne j. Un plan d’échantillonnage matriciel donne une matrice d’indicateurs d’échantillon N × M, avec l’entrée 1 à la position (i, j) si la cellule (i, j) est échantillonnée, et 0 autrement. Le premier plan d’échantillonnage matriciel étudié comporte un niveau d’échantillonnage et les tailles d’échantillon des lignes et des colonnes sont établies à l’avance : les tailles d’échantillon des lignes peuvent varier, tandis que les tailles d’échantillon des colonnes sont toutes identiques. Nous pouvons considérer les marges fixes comme des contraintes d’équilibrage et nous examinons les algorithmes possibles pour la sélection de ces échantillons. Nous abordons ensuite un nouvel estimateur de variance de l’estimateur de Horvitz-Thompson pour la moyenne de la variable d’enquête y. Plusieurs niveaux d’échantillonnage peuvent être requis pour tenir compte de toutes les contraintes, ce qui nécessite des plans d’échantillonnage matriciel à plusieurs niveaux, que nous étudions également.
    Date de diffusion : 2024-01-03

  • Articles et rapports : 12-001-X199400214419
    Description :

    L’objet de cette étude était d’évaluer divers estimateurs pour petites régions dans le but de produire des estimations de niveau pour des domaines non planifiés tirés de l’Enquête sur la population active Italienne. Dans notre étude, les petites régions sont les régions des services de santé, qui sont des domaines territoriaux infrarégionaux non planifiés, qui n’ont pas été isolés au moment de l’établissement du plan d’échantillonnage et qui chevauchent donc les limites des strates du plan d’échantillonnage. Nous considérons les estimateurs suivants : l’estimateur par quotient de stratification a posteriori, l’estimateur synthétique, l’estimateur composite exprimé sous forme d’une combinaison linéaire de l’estimateur synthétique et de l’estimateur par quotient de stratification a posteriori et l’estimateur dépendant de la taille de l’échantillon. Pour tous les estimateurs considérés ici, les biais relatifs moyens en pourcentage et la moyenne des erreurs quadratiques moyennes relatives ont été obtenus par une étude de Monte Carlo dans laquelle le plan d’échantillonnage a été simulé à l’aide de données provenant du recensement de l’Italie de 1981.

    Date de diffusion : 1994-12-15

  • Articles et rapports : 12-001-X199400214423
    Description :

    La plupart des enquêtes souffrent du problème de données manquantes attribuable à la non-réponse. Pour traiter ce problème, on a souvent recours à l’imputation afin de créer un « ensemble de données complet », c’est-à-dire, un ensemble de données composé d’observations réelles (pour les répondants) et d’imputations (pour les non-répondants). Habituellement, on effectue l’imputation en supposant un mécanisme de réponse non-confondu. Quand cette hypothèse se révèle fausse, un biais est introduit dans l’estimateur ordinaire de la moyenne de population calculé à partir de l’ensemble de données complet. Dans le présent article, nous étudions l’idée d’employer des facteurs de correction simples pour régler le problème du biais dans le cas où l’on a recours à l’imputation par quotient. Nous évaluons l’efficacité des facteurs de correction à l’aide d’une simulation de Monte Carlo dans laquelle nous utilisons des ensembles de données produits artificiellement qui représentent divers taux de non-réponse et mécanismes de non-réponse et diverses superpopulations et corrélations entre la variable étudiée et la variable auxiliaire. Nous constatons que ces facteurs de correction sont efficaces, particulièrement lorsque la population suit le modèle sous-jacent l’imputation par quotient. Nous traitons aussi d’une option pour estimer la variance des estimations ponctuelles corrigées.

    Date de diffusion : 1994-12-15

  • Articles et rapports : 12-001-X199300114475
    Description :

    Lorsqu’on crée des bases de données de microsimulation, souvent utilisées dans la planification et l’analyse des politiques, on combine plusieurs fichiers de données par des techniques d’appariement statistique afin d’enrichir le fichier receveur. Or, pour effectuer cette opération, il faut poser l’hypothèse de l’indépendance conditionnelle (HIC), ce qui peut fausser sérieusement les relations conjointes entre les variables. On peut éviter de poser cette hypothèse en utilisant des informations supplémentaires appropriées. Dans cet article, nous examinons des méthodes d’appariement statistique qui correspondent à trois méthodes d’imputation - par régression, hot-deck et log-linéaire - appliquées suivant deux scénarios : avec et sans information supplémentaire. La méthode d’imputation log-linéaire consiste essentiellement à introduire des contraintes nominales dans la méthode par régression ou la méthode hot-deck. À partir d’une vaste étude de simulation faite avec des données fictives, nous exécutons des analyses de sensibilité lorsque l’on s’éloigne de l’HIC et nous étudions les gains qui peuvent découler de l’utilisation d’informations supplémentaires. À l’aide de données fictives, nous créons différents scénarios relatifs à la distribution et aux relations des variables pertinentes, par exemple distribution symétrique vs. distribution asymétrique et données supplémentaires substitutives vs. données supplémentaires non substitutives. Nous faisons aussi quelques recommandations sur l’utilisation des méthodes d’appariement statistique. Notre étude confirme particulièrement que l’HIC peut représenter une contrainte sérieuse, que l’on peut éliminer en utilisant des informations supplémentaires appropriées. L’étude montre aussi que les méthodes hot-deck sont généralement préférables aux méthodes de régression. De plus, lorsqu’on dispose d’informations supplémentaires, les contraintes nominales log-linéaires peuvent accroître l’efficacité des méthodes hot-deck. L’idée de cette étude est née des préoccupations que l’on avait sur l’utilisation de l’HIC dans la construction de la Base de données de simulation des politiques sociales à Statistique Canada.

    Date de diffusion : 1993-06-15

  • Articles et rapports : 12-001-X199100214501
    Description :

    Bien que les enquêtes agricoles du Département de l’agriculture des É.-U. (DAEU) servent à estimer la production végétale à l’échelle du pays et pour chaque État, les estimations par comté sont plus utiles aux décideurs locaux. Ce genre d’estimations sont aussi recherchées par les entreprises qui se spécialisent dans la vente d’engrais, de pesticides, d’assurance-récolte et de matériel agricole. Les États font souvent leurs propres enquêtes dans le but de produire des estimations de la production agricole par comté. En règle générale, ces enquêtes ne reposent pas sur des méthodes d’échantillonnage probabiliste. En outre, la somme des estimations pour chaque comté d’un État doit concorder avec l’estimation calculée par le DAEU pour l’ensemble de l’État. Les méthodes d’estimation classiques pour petites régions ne sont donc pas directement applicables dans les circonstances. Dans cet article, nous allons recourir à des modèles de régression pour estimer la production de blé par comté au Kansas. Nous allons décrire une étude de simulation par laquelle nous comparons les estimations obtenues par régression à celles calculées à l’aide de deux estimateurs classiques pour petites régions : l’estimateur synthétique et l’estimateur direct. Nous allons aussi comparer plusieurs méthodes par lesquelles nous pouvons pondérer les estimations initiales de manière qu’elles concordent avec l’estimation de la production totale de l’État calculée par le DAEU.

    Date de diffusion : 1991-12-16
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :