Techniques statistiques

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Type

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (2)

Tout (2) ((2 résultats))

  • Articles et rapports : 12-001-X19980013910
    Description :

    Soit A, le domaine de la population auquel on s’intéresse. Supposons qu’il est impossible d’identifier les éléments de A dans la base de sondage et qu’on ignore le nombre d’éléments que contient A. Supposons en outre qu’on prélève un échantillon de taille fixe (n par exemple) de la base de sondage et que la taille de l’échantillon du domaine résultant (appelons-la n_A) soit aléatoire. Le problème consiste à bâtir un intervalle de confiance pour un paramètre du domaine tel que 1’agrégat du domaine T_A = \sum_{i \in A} x_i. Habituellement, la solution consiste à redéfinir x_i en établissant x_i = 0 si i \notin A. Au lieu de construire un intervalle de confiance pour le total du domaine, on en construit donc un pour un total de la population, ce que permet de satisfaire la théorie de la distribution normale (de façon asymptotique pour n). Une autre solution consisterait à imposer des conditions à n_A et à bâtir des intervalles de confiance à couverture presque nominale, avec certaines hypothèses se rapportant à la population du domaine. Les auteurs évaluent la nouvelle approche de manière empirique au moyen de populations artificielles et des données de l’Occupational Compensation Survey du Bureau of Labor Statistics (BLS).

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19970023613
    Description :

    Dans bien des cas, les meilleures décisions en matière de politiques sont celles qui peuvent s'appuyer sur des données statistiques, elles-mêmes obtenues d'analyses de microdonnées pertinentes. Cependant, il arrive parfois que l'on dispose de toutes les données nécessaires mais que celles-ci soient réparties entre de multiples fichiers pour lesquels il n'existe pas d'identificateurs communs (p. ex. numéro d'assurance sociale, numéro d'identification de l'employeur ou numéro de sécurité sociale). Nous proposons ici une méthode pour analyser deux fichiers de ce genre: 1) lorsqu'il existe des informations communes non uniques, sujettes à de nombreuses erreurs et 2) lorsque chaque fichier de base contient des données quantitatives non communes qui peuvent être reliées au moyen de modèles appropriés. Une telle situation peut se produire lorsqu'on utilise des fichiers d'entreprises qui n'ont en commun que l'information - difficile à utiliser - sur le nom et l'adresse, par exemple un premier fichier portant sur les produits énergétiques consommés par les entreprises et l'autre fichier regroupant les données sur le type et la quantité de biens produits. Une autre situation similaire peut survenir avec des fichiers sur des particuliers, dont le premier contiendrait les données sur les gains, le deuxième, des renseignements sur les dépenses reliées à la santé et le troisième, des données sur les revenus complémentaires. Le but de la méthode présentée est de réaliser des analyses statistiques valables, avec production ou non de fichiers de microdonnées pertinentes.

    Date de diffusion : 1998-03-12
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (2)

Analyses (2) ((2 résultats))

  • Articles et rapports : 12-001-X19980013910
    Description :

    Soit A, le domaine de la population auquel on s’intéresse. Supposons qu’il est impossible d’identifier les éléments de A dans la base de sondage et qu’on ignore le nombre d’éléments que contient A. Supposons en outre qu’on prélève un échantillon de taille fixe (n par exemple) de la base de sondage et que la taille de l’échantillon du domaine résultant (appelons-la n_A) soit aléatoire. Le problème consiste à bâtir un intervalle de confiance pour un paramètre du domaine tel que 1’agrégat du domaine T_A = \sum_{i \in A} x_i. Habituellement, la solution consiste à redéfinir x_i en établissant x_i = 0 si i \notin A. Au lieu de construire un intervalle de confiance pour le total du domaine, on en construit donc un pour un total de la population, ce que permet de satisfaire la théorie de la distribution normale (de façon asymptotique pour n). Une autre solution consisterait à imposer des conditions à n_A et à bâtir des intervalles de confiance à couverture presque nominale, avec certaines hypothèses se rapportant à la population du domaine. Les auteurs évaluent la nouvelle approche de manière empirique au moyen de populations artificielles et des données de l’Occupational Compensation Survey du Bureau of Labor Statistics (BLS).

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19970023613
    Description :

    Dans bien des cas, les meilleures décisions en matière de politiques sont celles qui peuvent s'appuyer sur des données statistiques, elles-mêmes obtenues d'analyses de microdonnées pertinentes. Cependant, il arrive parfois que l'on dispose de toutes les données nécessaires mais que celles-ci soient réparties entre de multiples fichiers pour lesquels il n'existe pas d'identificateurs communs (p. ex. numéro d'assurance sociale, numéro d'identification de l'employeur ou numéro de sécurité sociale). Nous proposons ici une méthode pour analyser deux fichiers de ce genre: 1) lorsqu'il existe des informations communes non uniques, sujettes à de nombreuses erreurs et 2) lorsque chaque fichier de base contient des données quantitatives non communes qui peuvent être reliées au moyen de modèles appropriés. Une telle situation peut se produire lorsqu'on utilise des fichiers d'entreprises qui n'ont en commun que l'information - difficile à utiliser - sur le nom et l'adresse, par exemple un premier fichier portant sur les produits énergétiques consommés par les entreprises et l'autre fichier regroupant les données sur le type et la quantité de biens produits. Une autre situation similaire peut survenir avec des fichiers sur des particuliers, dont le premier contiendrait les données sur les gains, le deuxième, des renseignements sur les dépenses reliées à la santé et le troisième, des données sur les revenus complémentaires. Le but de la méthode présentée est de réaliser des analyses statistiques valables, avec production ou non de fichiers de microdonnées pertinentes.

    Date de diffusion : 1998-03-12
Références (0)

Références (0) (0 résultat)

Aucun contenu disponible actuellement

Date de modification :