Statistiques par sujet – Méthodes statistiques

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Année de publication

1 facettes affichées. 1 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Année de publication

1 facettes affichées. 1 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Année de publication

1 facettes affichées. 1 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Année de publication

1 facettes affichées. 1 facettes sélectionnées.

Autres ressources disponibles pour appuyer vos recherches.

Aide pour trier les résultats
Explorer notre base centrale des principaux concepts normalisés, définitions, sources de données et méthodes.
En cours de chargement
Chargement en cours, veuillez patienter...
Tout (27)

Tout (27) (25 of 27 results)

  • Articles et rapports : 89-553-X19980014027
    Description :

    Dans le cadre du présent document, j'examine trois questions : 1. L'état actuel des connaissances au sujet des transferts intergénérationnels, à la fois publics et privés, est-il suffisant pour nous permettre d'effectuer des choix politiques éclairés ? Quels éléments nous manque-t-il ? De quoi avons-nous besoin, en particulier au sein du système canadien de statistiques ? 2. En face d'une population vieillissante, d'un marché du travail en pleine mutation et de transferts sociaux qui diminent comme une peau de chagrin, sommes-nous les témoins de l'émergence d'un nouveau contrat social entre les générations ? 3. Quel rôle jouent les divers modèles de transferts intergénérationnels et, naturellement, quel rôle joue la génération en tant que concept démographique dans la définition du champ des options politiques qui s'offrent aux Canadiens à la fin des années 1990 ? Pour répondre à ces questions, je m'appuie sur les analyses et le cadre de travail présentés dans McDaniel (1997).

    Date de diffusion : 1998-11-05

  • Produits techniques : 88F0006X1998006
    Description :

    Les résultats obtenus du Survol des indicateurs statistiques de l'innovation dans les régions du Canada : comparaison des provinces servent à analyser les différences régionales dans les activités de sciences et technologie menées au Canada. Cette analyse s'inscrit dans le cadre du Projet de système d'information sur les sciences et la technologie de Statistique Canada. Ce document de travail présente des estimations des dépenses et du personnel consacrés à la R-D dans les universités, l'administration fédérale, l'industrie et les organismes de recherche provinciaux aussi bien que les statistiques générales provinciales. L'objectif de ce projet est de développer des indicateurs d'activité utiles réunis dans un cadre conceptuel permettant de dresser un portrait cohérent des sciences et de la technologie au Canada. Ces indicateurs peuvent être utilisés pour brosser un tableau au niveau national ou encore à un niveau provincial ou infraprovincial pour refléter les différences régionales. Un autre document de travail déjà publié, La fiscalité de la recherche et du développement au Canada : comparaison interprovinciale, présente une analyse basée sur une méthode mise au point par le Conference Board du Canada pour comparer les stimulants fiscaux à la R-D de chaque province. Six provinces sur dix offrent des programmes d'encouragement et des taux d'imposition qui leurs sont propres et qui diffèrent. L'analyse de l'Indice-B du Conference Board fournit un moyen pour comparer les stimulants fiscaux et propose un indicateur.

    Date de diffusion : 1998-10-30

  • Articles et rapports : 12-001-X19980013904
    Description :

    Un grand nombre des enquêtes économiques et agricoles visent des objectifs multiples. Il serait donc pratique de pouvoir stratifier la population-cible de ces enquêtes de différentes manières - et ainsi répondre à un certain nombre d'objectifs - puis de combiner les échantillons pour le dénombrement. Nous examinons dans ce document quatre méthodes d'échantillonnage distinctes qui prélèvent des échantillons similaires, toutes stratifications confondues, ce qui permet de réduire la taille globale de l'échantillon. L'efficacité de ces stratégies d'échantillonnage est évaluée à la lumière des données extraites d'une enquête sur l'agriculture. Nous indiquons ensuite comment un estimateur par calage (c.-à-d. pondéré de nouveau) peut accroître l'efficacité statistique, en reproduisant dans l'estimation ce que l'on sait de la taille de la strate initiale. La méthode itérative du quotient, qui a été proposée dans certains ouvrages, n'est en fait qu'une méthode de calage.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013907
    Description :

    Les amateurs évaluent la méthode d'estimation par les moindres carrés pour les enquêtes répétitives. Ils proposent plusieurs estimateurs pour le niveau courant, le changement de niveau et le niveau moyen applicables à des périodes multiples. Suit la présentation de l'estimateur de régression récursif, méthode récursive permettant de calculer le meilleur estimateur linéaire sans biais d'après l'ensemble des périodes couvertes par l'enquête. On constate qu'il y a convergence de la régression récursive et que le nombre de dimensions de l'estimation est plafonné lorsque le nombre de périodes tend vers l'infini. La méthode récursive apporte une solution au problème de la complexité des calculs que suscite l'estimation non biaisée de la variance minimale dans les enquêtes répétitives. Les auteurs recourent aux données de la U.S. Current Population Survey pour comparer les différents estimateurs, avec deux genres de plan d'échantillonnage: le plan à renouvellement intermittent de la Current Population Survey et deux plans à renouvellement continu.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013912
    Description :

    Le présent article traite de méthodes efficaces d'estimation de la taille et des chiffres de la population, à partir de données extraites de listes multiplis et d'une base aréolaire indépendante. Ces travaux constituent un prolongement de la méthode proposée par Hartley (1962), qui porte sur deux bases de sondage générales. Un des principaux inconvénients des listes vient de ce que celles-ci sont habituellement incomplètes. Nous proposons dans cet article plusieurs méthodes pour pallier ces lacunes. Un plan d'échantillonnage mixte alliant l'utilisation d'une liste et d'une base aréolaire permet d'inclure des bases de sondage multiples et de couvrir entièrement la population-cible. Pour chaque combinaison de bases de sondage qui est proposée, nous indiquons les notations qui s'y rapportent, la fonction de vraisemblance et les estimateurs de paramètres. Nous présentons également les résultats d'une étude de simulation qui compare les diverses caractéristiques des estimateurs proposés.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013913
    Description :

    On émet l'hypothèse que la mobilité temporaire contribue à l'erreur de couverture au sein des ménages, car cette mobilité pourrait avoir une incidence sur la détermination du "lieu de résidence habituel", notion qui est couramment appliquée lorsqu'on dresse une liste de personnes dans le cadre d'enquêtes ou de recensements portant sur les ménages. Dans la présente communication, nous analysons divers types de mobilité temporaire, ainsi que les rapports existant entre ceux-ci et la détermination du lieu de résidence habituel. La mobilité temporaire est définie par le type de déplacement effectué à partir d'un seul lieu de résidence (où normalement on revient), au cours d'une période de référence de deux à trois mois. La typologie est établie à partir de deux aspects: la diversité des endroits visités et la fréquence des visites. À l'aide de données tirées de la U.S. Living Situation Survey (LSS), qui a été effectuée en 1993, on a identifié quatre types de mobilité temporaire. Dans le cas de deux catégories, on a constaté un comportement associé à des visites répétées et la présence d'un plus grand nombre de personnes qui ont tendance à échapper au dénombrement lors d'enquêtes et de recensements. La modélisation log-linéaire indique que les types de mobilité temporaire constituent une variable prédictive importante liée à la détermination du lieu de résidence habituel, même lorsqu'on tient compte du temps passé loin du ménage et des caractéristiques démographiques.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013909
    Description :

    Dans cet article, les auteurs examinent comment estimer la fréquence des classes d'une variable discrète associée aux réponses par le biais d'un modèle. L'estimation fait appel à une nouvelle méthode d'estimation des données d'enquête, étroitement liée à l'estimation par régression généralisée. Dans cette dernière, les données sur les variables auxiliaires sont intégrées à la méthode d'estimation par ajustement au moyen d'un modèle linéaire. Au lieu de recourir à un modèle linéaire pour les indicateurs de classe, nous décrivons la distribution combinée des indicateurs de classe par un modèle logistique multinominal. Les auteurs présentent des estimateurs de régression généralisés logistiques pour la fréquence des classes au sein d'une population et de divers domaines. Ils ont entrepris des essais de Monte Carlo sur des données simulées et les données réelles issues de l'Enquête sur la population active menée chaque mois par Statistics Finland. L'estimation de régression généralisée logistique donne de meilleurs résultats que l'estimation de régression ordinaire pour les petits domaines, en particulier les classes à faible fréquence.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013908
    Description :

    L'analyse qui suit porte sur le problème qui consiste à estimer la variance de l'estimateur général de régresison linéaire. On a montré que l'approche de calage à bas niveau adoptée par Sändal (1996) est moins ou aussi efficace que celle d'une catégorie d'estimateurs avancée par Deng et Wu (1987). On a aussi proposé une approche par calage à un niveau plus élevé. Les auteurs montrent que cette dernière constitue une amélioration par rapport à l'originale. Plusieurs estimateurs correspondent à des cas particuliers de la nouvelle approche. On a notamment émis l'idée d'obtenir une estimation non négative de la variance de l'estimateur GREG. Les résultats ont été appliqués à un plan d'échantillonnage aléatoire stratifié. On a aussi entrepris une étude empirique afin de jauger l'efficacité des stratégies envisagées. Le logiciel de statistique SGE bien connu, élaboré par Statistique Canada, peut être perfectionné en vue de fournir une estimation plus précise de la variance de l'estimateur GREG par calage à niveau élevé, dans certaines circonstances examinées plus bas.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013906
    Description :

    Pour les sondages, il doit idéalement y avoir correspondance de un à un entre les unités de la base de sondage et les élements de la population-cible à l'étude. Dans bien des cas, toutefois, la base de sondage a une structure plusieurs à plusieurs, c'est-à-dire qu'une unité de la base de sondage peut être associée à de multiples éléments de la population-cible et, vice-versa, un élément de la population-cible peut être associé à de multiples unités de la base de sondage. C'est ce qui s'est produit dans le cadre d'une enquête sur les caractéristiques des immeubles, pour laquelle la base de sondage était constituée des adresses de voirie et les immeubles commerciaux formaient la population-cible. La base de sondage était complexe, car une même adresse pouvait correspondre à un seul immeuble, à plusieurs immeubles ou à une partie d'un immeuble. Nous présentons ici des estimateurs et des formules pour en calculer la variance, selon des plans d'échantillonnage aléatoire simple et stratifié, lorsque la base de sondage est de structure plusieurs à plusieurs.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013910
    Description :

    Soit A, le domaine de la population auquel on s’intéresse. Supposons qu’il est impossible d’identifier les éléments de A dans la base de sondage et qu’on ignore le nombre d’éléments que contient A. Supposons en outre qu’on prélève un échantillon de taille fixe (n par exemple) de la base de sondage et que la taille de l’échantillon du domaine résultant (appelons-la n_A) soit aléatoire. Le problème consiste à bâtir un intervalle de confiance pour un paramètre du domaine tel que 1’agrégat du domaine T_A = \sum_{i \in A} x_i. Habituellement, la solution consiste à redéfinir x_i en établissant x_i = 0 si i \notin A. Au lieu de construire un intervalle de confiance pour le total du domaine, on en construit donc un pour un total de la population, ce que permet de satisfaire la théorie de la distribution normale (de façon asymptotique pour n). Une autre solution consisterait à imposer des conditions à n_A et à bâtir des intervalles de confiance à couverture presque nominale, avec certaines hypothèses se rapportant à la population du domaine. Les auteurs évaluent la nouvelle approche de manière empirique au moyen de populations artificielles et des données de l’Occupational Compensation Survey du Bureau of Labor Statistics (BLS).

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013905
    Description :

    Les plans d'échantillonnage à deux phases permettent d'utiliser les données auxiliaires de diverses façons. Les auteurs débutent en passant en revue les différents aspects que peuvent prendre ces données dans les enquêtes à deux phases. Ils établissent ensuite la méthode en vertu de laquelle elles sont converties en poids calés dont on se sert pour créer de bons estimateurs d'un total d'une population. Le calage s'effectue en deux étapes: i) au niveau de la population et ii) à celui de l'échantillon de la première phase. Les auteurs montrent qu'on peut aussi dériver les estimateurs issus de calage par régression, également en deux temps. Ils examinent ces estimateurs dans un cas particulier, en l'occurrence quand les données auxiliaires portent sur quelques sous-ensembles de la population baptisés "groupes de calage". Les strates a posteriori en constituent l'illustration la plus simple. Suit une discussion sur l'estimation des domaines d'intérêt et de la variance. Enfin, les résultats sont appliqués à deux importants plans d'échantillonnage à deux phases en usage à Statistique Canada. La théorie générale concernant l'emploi des données auxiliaires dans l'échantillonnage à deux phases sera intégrée au Système généralisé d'estimation de Statistique Canada.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013911
    Description :

    Dans cet article, l'auteur se penche sur les grandes propriétés de l'estimateur de régression généralisé de la moyenne d'une population finie et de l'estimateur de régression dérivé de l'estimateur de la différence optimale. Comme le second s'avère plus efficace que le premier, on cerne les conditions à l'origine de la situation et présente un critère qui facilitera le choix entre les deux estimateurs. Une étude de simulation illustre la performance des estimateurs avec un échantillon fini.

    Date de diffusion : 1998-07-31

  • Tableau : 82-567-X
    Description :

    L'Enquête nationale sur la santé de la population a pout but d'améliorer la compréhension des différents processus affectant la santé. L'enquête collecte les données transversales ainsi que longitudinales. En 1994-1995, l'enquête portait sur un échantillon de 17 276 répondants qui ont été interviewés une deuxième fois en 1996-1997. Le taux de réponse fut de 96 % en 1996-1997. La collecte des données de cet échantillon se poursuivra durant une vingtaine d'années. Dans le but d'obtenir des données transversales, un total de 81 000 résidents de ménages ont été interviewés dans toutes les provinces (exepté les gens vivant dans les réserves Indiennes ou dans les Forces Armées Canadiennes) en 1996-1997.

    Voici quelques exemples de la variété d'informations disponibles que l'on peut obtenit grâce à l'enquête: perception de la santé, les conditions chroniques de santé, les blessures, les mouvements répétitifs, la dépression, le tabagisme, la consommation d'alcool, les activités physiques, la consommation de médicaments, l'utilisation des soins de santé et la médecine douce.

    Date de diffusion : 1998-07-29

  • Articles et rapports : 87-003-X19980033853
    Description :

    Les données sur les voyages internationaux, issues de l'Enquête sur les voyages internationaux (EVI), fournissent des renseignements de toutes sortes, tels que les destinations des voyageurs, leurs activités, le montant de leurs dépenses et leur degré de satisfaction à l'égard des attractions touristiques du pays visité.

    Date de diffusion : 1998-07-13

  • Classification : 89F0077X199802B
    Description :

    L' Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ) est la première enquête sur les enfants qui sera menée à l'échelle du Canada. Elle débutera en 1994 et recueillera des renseignements au sujet d'un groupe d'enfants et de leurs expériences de vie. L'enquête suivra ces enfants à mesure qu'ils grandissent. L'enquête a pour but de recueillir des renseignements sur les enfants, leurs familles, leur éducation, leur santé, leur développement, leur comportement, leurs ami(e)s, leurs activités, etc.

    Avec 89F0077XPF (ou XIF) numéro 9903b ce document contient les différents questionnaires utilisés pour recueillir des renseignements auprès des parents, des enfants, des enseignants et des directeurs d'école.

    Date de diffusion : 1998-06-04

  • Articles et rapports : 91F0015M1998005
    Description :

    Tous les pays qui organisent des recensements s'inquiètent post factum de sa qualité et de l'ampleur du sous- dénombrement net. Pour mesurer l'une et l'autre, différentes méthodes ont depuis longtemps été imaginées. Certaines mettent à profit des sources d'informations indépendantes du recensement lui-même, alors que d'autres contrôlent la cohérence des résultats. Ce sont des opérations lourdes et onéreuses.

    Attendu que la population dans chaque pays est organisée différemment et que les structures administratives ne sont pas les mêmes, il n'y a pas de modèle universel qui puisse être appliqué pour obtenir des mesures. La division de la Démographie de Statistique Canada a passé en revue les procédés utilisés dans quatre pays du monde industrialisé afin de comparer les méthodes et apprécier leurs avantages et leurs faiblesses : les États-Unis, le Royaume Uni, l'Australie et évidement le Canada. Il ressort de la revue que l'analyse démographique peut être d'un grand secours pour déceler les incohérences quand vient le temps de comparer deux recensements successifs et que la technique des micro-données et le couplage des enregistrements sont indispensables pour évaluer l'importance du nombre de ceux qui ont été omis ou au contraire comptés deux fois le jour de l'énumération. Mais la conclusion la plus importante est la nécessité de conjuguer les efforts des démographes et des statisticiens pour évaluer des nombres dont la justesse demeurera toujours sujette à discussion.

    Date de diffusion : 1998-03-27

  • Articles et rapports : 12-001-X19970023615
    Description :

    Le présent article montre l'utilité d'un plan de sondage à plusieurs degrés pour obtenir le dénombrement total des établissements de santé et de la population de clients éventuels dans une région. La plan décrit a été utilisé pour effectuer une enquête à l'échelle de l'État d'Uttar Pradesh, en Inde, au milieu de 1995. Il comprend la sélection d'un échantillon aréolaire en grappes à plusieurs degrés où l'unité primaire d'échantillonnage est soit un îlot urbain, soit un village rural. On a fait le relevé cartographique, dressé la liste et sélectionné tous les points de fourniture de services de santé, qu'il s'agisse d'établissements autonomes ou d'agents de distribution, situés dans les unités primaires d'échantillonnage ou assignés officiellement à ces dernières. On a tiré un échantillon systématique de ménages et interviewé toutes les femmes faisant partie de ces ménages qui satisfaisaient les critères prédéterminés d'admissibilité. On a appliqué des poids d'échantillonnage aux établissements ainsi qu'aux personnes. Pour les établissements, les poids sont corrigés pour tenir compte du fait que certains établissements desservent plusieurs unités secondaires d'échantillonnage. Pour les personnes, on a corrigé les poids pour tenir compte des taux de réponse à l'enquête. L'estimation par sondage du nombre total d'^établissements publics concorde bien avec les totaux publiés. Pareillement, l'estimation de la population de clientes calculée d'après l'enquête concorde avec le chiffre total du Recensement de 1991.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023620
    Description :

    La France ne disposant pas de registres de population, les recensements de la population y constituent la base du système d'informations socio-démographiques. Cependant, entre deux recensements, l'actualisation de certaines données est nécessaire, notamment à un niveau géographique fin, d'autant plus que les recensements ont, pour diverses raisons, tendance à s'espacer. Une mission, dont l'objectif était de proposer un système améliorant substantiellement le dispositif d'estimations locales de population en vigueur, a été créée en 1993 au sein de l'Institut National de la Statistique et des Études Économiques. Elle s'est consacrée à une double tâche: réaliser une synthèse efficace et robuste des informations apportées par différentes sources administratives et mobiliser un nombre suffisant de "bonnes" sources. Le système "multi-sources" qu'elle a conçu et qui est présenté ici est souple et fiable, sans être trop complexe.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023619
    Description :

    La présence d'observations extrêmes dans les données d'enquête est un problème récurrent de la statistique appliquée auquel l'enquête de l'INSEE sur l'investissement industriel est aussi confrontée. La prévision du taux de croissance des dépenses d'équipement dans l'industrie se ramène, de ce fait, à l'estimation robuste d'un total dans une population finie. Dans une première partie, cet article analyse l'estimateur actuellement utilisé dans l'enquête Investissement. Nous montrons qu'il suit une stratégie de repondération de l'estimateur linéaire. Mais la dichotomie stricte imposée entre les points extrêmes, tous supposés non représentatifs, et les autres points n'est pas entièrement satisfaisante d'un point de vue à la fois théorique et pratique. L'adoption d'une approche modélisée à l'estimation par les GM-estimateurs, appliqués au cas d'une population finie, permet de pallier ces défauts. Nous construisons ensuite une procédure adaptative robuste qui détermine l'estimateur approprié en fonction des résidus observés sur l'échantillon lorsque ceux-ci peuvent être supposés symétriques. Enfin, cette méthode est appliquée aux données de l'enquête Investissement sur la période 1990-1995.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023614
    Description :

    En 1993, Statistique Canada introduisait l'Interview assistée par ordinateur (IAO) pour certaines enquêtes-ménages menées dans un environnement décentralisé. Cette technologie a été utilisée avec succès pendant quelques années et la plupart des enquêtes-ménages sont maintenant converties à cette méthode de collecte. Le présent document fait un résumé de l'expérience acquise et des leçons apprises depuis le début de la recherche sur le sujet. Il décrit certains des essais qui ont mené à l'adoption de cette technologie et quelques-unes des nouvelles possibilités qui sont nées de sa mise en oeuvre. Il présente aussi un certain nombre d'enjeux qui se sont posés lors de l'adoption de l'IAO (certains existant encore aujourd'hui) et se termine sur un bref survol de ce que nous réserve l'avenir.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023617
    Description :

    La modélisation des réponses ordinales a déjà fait l'objet de beaucoup de recherches. Selon certains auteurs, lorsque la variable de réponses est ordinale, la prise en compte de cette caractéristique dans le modèle à estimer devrait accroître la performance de ce modèle. Dans des conditions ordinales, Campbell et Donner (1989) ont comparé le taux asymptotique d'erreurs de classificartion du modèle logistique multinomial à celui du modèle logistique ordinal d'Anderson (1984). Ils ont démontré que ce dernier était assorti d'un taux asymptotique d'erreurs prévisible inférieur à celui du modèle logistique multinomial. Dans le présent article, nous cherchons à comparer la performance d'un modèle logistique ordinal et d'un modèle multinomial pour les réponses ordinales. Toutefois, au lieu de concentrer notre attention sur l'efficacité de classification, nous nous attachons à estimer les proportions pour les petites régions. En utilisant un modèle logistique multinomial et un modèle ordinal, nous cherchons plus particulièrement à adapter l'estimation de proportions pour petites régions à partir de données binômiales par des méthodes empiriques de Bayes, tel que le suggèrent Farrell, MacGibbon et Tomberlin (1997a), aux variables qui appartiennent à plus de deux catégories de résultats. Les propriétés des estimateurs fondés sur ces deux modèles sont comparées au moyen d'une simulation au cours de laquelle les méthodes empiriques de Bayes proposées sont appliquées à des données issues du recensement américain de 1950, afin de chercher à prévoir, pour des petites régions, les proportions des personnes appartenant aux diverses catégories d'une variable de réponses ordinale représentant le niveau de revenu.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023621
    Description :

    L'estimateur de variance jackknife présente des propriétés intéressantes quand on s'en sert avec les estimateurs lisses tirés d'échantillons stratifiés à plusieurs degrès. L'article que voici porte sur l'application de cet estimateur à un plan particulier d'échantillonnage à deux phases: on commence par constituer un échantillon aléatoire stratifié en grappes par tirage non exhaustif, puis on restratifie les éléments des grappes échantillonnées et on prélève des sous-échantillons aléatoires simples de chaque strate de la deuxième phase. Apparemment, l'estimateur jackknife donne des résultats raisonnables pour ce qui est d'estimer la variance d'un estimateur de "développement" commun, mais pas celle d'un autre. Les auteurs parlent de l'application de leurs résultats à des stratégies d'estimation plus complexes. Une étude de Monte Carlo étaye leurs principales constatations.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023616
    Description :

    La stratification a posteriori est une méthode appliquée couramment pour tenir compte de l'inégalité des probabilités d'échantillonnage et de la non-réponse lors des enquêtes par sondage. Cette méthode consiste à subdiviser la population en plusieurs catégories, à estimer la répartition des réponses dans chaque catégorie, puis, à donner à chaque catégorie un poids proportionnel à sa taille dans la population. Nous considérons la stratification a posteriori comme un cadre de référence général englobant de nombreux scénarios de pondération utilisés dans le domaine de l'analyse d'enquête (consulter Little 1993). Nous construisons un modèle de régression logistique hiérarchique pour déterminer la moyenne conditionnelle d'une variable de réponse binaire subordonnée à des cellules, ou catégories, de stratification a posteriori. Le modèle hiérarchique permet d'inclure un nombre beaucoup plus grand de cellules que les méthodes classiques, donc, d'introduire beaucoup plus de renseignements sur la population, tout en incluant tous les renseignements qui sous-tendent l'inférence lors de l'échantillonnage d'enquête. Donc, nous combinons la méthode de modélisation appliquée fréquemment à l'estimation des petites régions aux renseignements sur la population utilisés à l'étape de la stratification a posteriori. Nous appliquons la méthode à un ensemble de sondages d'opinion préélectoraux effectués aux États-Unis, dont les données sont stratifiées a posteriori selon l'État et selon les variables démographiques habituelles. Nous évaluons les modèles graphiquement en comparant les résultats qu'ils produisent à ceux des élections au niveau de l'État.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023618
    Description :

    Les offices statistiques constituent souvent leurs panels d'entreprises par tirages de Poisson, ou par tirages strafifiés de taille fixe et à probabilités uniformes dans chaque strate. À ces tirages correspondent des algorithmes utilisant des numéros permanents suivant une loi uniforme. Comme les caractéristiques des unités évoluent, il est nécessaire d'effectuer périodiquement des retirages tout en cherchant à conserver le maximum d'unités. La solution par tirage de Poisson est la plus simple et donne le recouvrement théorique maximal, mais avec l'inconvénient d'une taille aléatoire de l'échantillon. Par contre, dans le cas du tirage stratifié de taille fixe, les changements de strates occasionnent des difficultés venant justement de ces contraintes de taille fixe. Une première difficulté est qu'on diminue le recouvrement, d'autant plus que la stratification est finie. Or c'est ce qui risque de se produire si les naissances constituent des strates à part. On montre comment le fait de rendre équidistants les numéros avant les retirages peut servir à corriger cet effet. L'inconvénient, assez faible, est que dans chaque strate le tirage n'est plus un tirage aléatoire simple ce qui rend moins rigoureuse l'estimation de la variance. Une autre difficulté est de concilier le retirage avec une rotation éventuelle des unités dans l'échantillon. On présente un type d'algorithme qui prolonge après retirage la rotation avant retirage. Il est basé sur des transformations des numéros aléatoires servant aux tirages, de façon à se ramener au retirage sans rotation. Ces transformations sont particulièrement simples quand elles portent sur les numéros équidistants, mais peuvent aussi se faire avec les numéros suivant une loi uniforme.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023613
    Description :

    Dans bien des cas, les meilleures décisions en matière de politiques sont celles qui peuvent s'appuyer sur des données statistiques, elles-mêmes obtenues d'analyses de microdonnées pertinentes. Cependant, il arrive parfois que l'on dispose de toutes les données nécessaires mais que celles-ci soient réparties entre de multiples fichiers pour lesquels il n'existe pas d'identificateurs communs (p. ex. numéro d'assurance sociale, numéro d'identification de l'employeur ou numéro de sécurité sociale). Nous proposons ici une méthode pour analyser deux fichiers de ce genre: 1) lorsqu'il existe des informations communes non uniques, sujettes à de nombreuses erreurs et 2) lorsque chaque fichier de base contient des données quantitatives non communes qui peuvent être reliées au moyen de modèles appropriés. Une telle situation peut se produire lorsqu'on utilise des fichiers d'entreprises qui n'ont en commun que l'information - difficile à utiliser - sur le nom et l'adresse, par exemple un premier fichier portant sur les produits énergétiques consommés par les entreprises et l'autre fichier regroupant les données sur le type et la quantité de biens produits. Une autre situation similaire peut survenir avec des fichiers sur des particuliers, dont le premier contiendrait les données sur les gains, le deuxième, des renseignements sur les dépenses reliées à la santé et le troisième, des données sur les revenus complémentaires. Le but de la méthode présentée est de réaliser des analyses statistiques valables, avec production ou non de fichiers de microdonnées pertinentes.

    Date de diffusion : 1998-03-12

Données (1)

Données (1) (1 result)

  • Tableau : 82-567-X
    Description :

    L'Enquête nationale sur la santé de la population a pout but d'améliorer la compréhension des différents processus affectant la santé. L'enquête collecte les données transversales ainsi que longitudinales. En 1994-1995, l'enquête portait sur un échantillon de 17 276 répondants qui ont été interviewés une deuxième fois en 1996-1997. Le taux de réponse fut de 96 % en 1996-1997. La collecte des données de cet échantillon se poursuivra durant une vingtaine d'années. Dans le but d'obtenir des données transversales, un total de 81 000 résidents de ménages ont été interviewés dans toutes les provinces (exepté les gens vivant dans les réserves Indiennes ou dans les Forces Armées Canadiennes) en 1996-1997.

    Voici quelques exemples de la variété d'informations disponibles que l'on peut obtenit grâce à l'enquête: perception de la santé, les conditions chroniques de santé, les blessures, les mouvements répétitifs, la dépression, le tabagisme, la consommation d'alcool, les activités physiques, la consommation de médicaments, l'utilisation des soins de santé et la médecine douce.

    Date de diffusion : 1998-07-29

Analyses (22)

Analyses (22) (22 of 22 results)

  • Articles et rapports : 89-553-X19980014027
    Description :

    Dans le cadre du présent document, j'examine trois questions : 1. L'état actuel des connaissances au sujet des transferts intergénérationnels, à la fois publics et privés, est-il suffisant pour nous permettre d'effectuer des choix politiques éclairés ? Quels éléments nous manque-t-il ? De quoi avons-nous besoin, en particulier au sein du système canadien de statistiques ? 2. En face d'une population vieillissante, d'un marché du travail en pleine mutation et de transferts sociaux qui diminent comme une peau de chagrin, sommes-nous les témoins de l'émergence d'un nouveau contrat social entre les générations ? 3. Quel rôle jouent les divers modèles de transferts intergénérationnels et, naturellement, quel rôle joue la génération en tant que concept démographique dans la définition du champ des options politiques qui s'offrent aux Canadiens à la fin des années 1990 ? Pour répondre à ces questions, je m'appuie sur les analyses et le cadre de travail présentés dans McDaniel (1997).

    Date de diffusion : 1998-11-05

  • Articles et rapports : 12-001-X19980013904
    Description :

    Un grand nombre des enquêtes économiques et agricoles visent des objectifs multiples. Il serait donc pratique de pouvoir stratifier la population-cible de ces enquêtes de différentes manières - et ainsi répondre à un certain nombre d'objectifs - puis de combiner les échantillons pour le dénombrement. Nous examinons dans ce document quatre méthodes d'échantillonnage distinctes qui prélèvent des échantillons similaires, toutes stratifications confondues, ce qui permet de réduire la taille globale de l'échantillon. L'efficacité de ces stratégies d'échantillonnage est évaluée à la lumière des données extraites d'une enquête sur l'agriculture. Nous indiquons ensuite comment un estimateur par calage (c.-à-d. pondéré de nouveau) peut accroître l'efficacité statistique, en reproduisant dans l'estimation ce que l'on sait de la taille de la strate initiale. La méthode itérative du quotient, qui a été proposée dans certains ouvrages, n'est en fait qu'une méthode de calage.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013907
    Description :

    Les amateurs évaluent la méthode d'estimation par les moindres carrés pour les enquêtes répétitives. Ils proposent plusieurs estimateurs pour le niveau courant, le changement de niveau et le niveau moyen applicables à des périodes multiples. Suit la présentation de l'estimateur de régression récursif, méthode récursive permettant de calculer le meilleur estimateur linéaire sans biais d'après l'ensemble des périodes couvertes par l'enquête. On constate qu'il y a convergence de la régression récursive et que le nombre de dimensions de l'estimation est plafonné lorsque le nombre de périodes tend vers l'infini. La méthode récursive apporte une solution au problème de la complexité des calculs que suscite l'estimation non biaisée de la variance minimale dans les enquêtes répétitives. Les auteurs recourent aux données de la U.S. Current Population Survey pour comparer les différents estimateurs, avec deux genres de plan d'échantillonnage: le plan à renouvellement intermittent de la Current Population Survey et deux plans à renouvellement continu.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013912
    Description :

    Le présent article traite de méthodes efficaces d'estimation de la taille et des chiffres de la population, à partir de données extraites de listes multiplis et d'une base aréolaire indépendante. Ces travaux constituent un prolongement de la méthode proposée par Hartley (1962), qui porte sur deux bases de sondage générales. Un des principaux inconvénients des listes vient de ce que celles-ci sont habituellement incomplètes. Nous proposons dans cet article plusieurs méthodes pour pallier ces lacunes. Un plan d'échantillonnage mixte alliant l'utilisation d'une liste et d'une base aréolaire permet d'inclure des bases de sondage multiples et de couvrir entièrement la population-cible. Pour chaque combinaison de bases de sondage qui est proposée, nous indiquons les notations qui s'y rapportent, la fonction de vraisemblance et les estimateurs de paramètres. Nous présentons également les résultats d'une étude de simulation qui compare les diverses caractéristiques des estimateurs proposés.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013913
    Description :

    On émet l'hypothèse que la mobilité temporaire contribue à l'erreur de couverture au sein des ménages, car cette mobilité pourrait avoir une incidence sur la détermination du "lieu de résidence habituel", notion qui est couramment appliquée lorsqu'on dresse une liste de personnes dans le cadre d'enquêtes ou de recensements portant sur les ménages. Dans la présente communication, nous analysons divers types de mobilité temporaire, ainsi que les rapports existant entre ceux-ci et la détermination du lieu de résidence habituel. La mobilité temporaire est définie par le type de déplacement effectué à partir d'un seul lieu de résidence (où normalement on revient), au cours d'une période de référence de deux à trois mois. La typologie est établie à partir de deux aspects: la diversité des endroits visités et la fréquence des visites. À l'aide de données tirées de la U.S. Living Situation Survey (LSS), qui a été effectuée en 1993, on a identifié quatre types de mobilité temporaire. Dans le cas de deux catégories, on a constaté un comportement associé à des visites répétées et la présence d'un plus grand nombre de personnes qui ont tendance à échapper au dénombrement lors d'enquêtes et de recensements. La modélisation log-linéaire indique que les types de mobilité temporaire constituent une variable prédictive importante liée à la détermination du lieu de résidence habituel, même lorsqu'on tient compte du temps passé loin du ménage et des caractéristiques démographiques.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013909
    Description :

    Dans cet article, les auteurs examinent comment estimer la fréquence des classes d'une variable discrète associée aux réponses par le biais d'un modèle. L'estimation fait appel à une nouvelle méthode d'estimation des données d'enquête, étroitement liée à l'estimation par régression généralisée. Dans cette dernière, les données sur les variables auxiliaires sont intégrées à la méthode d'estimation par ajustement au moyen d'un modèle linéaire. Au lieu de recourir à un modèle linéaire pour les indicateurs de classe, nous décrivons la distribution combinée des indicateurs de classe par un modèle logistique multinominal. Les auteurs présentent des estimateurs de régression généralisés logistiques pour la fréquence des classes au sein d'une population et de divers domaines. Ils ont entrepris des essais de Monte Carlo sur des données simulées et les données réelles issues de l'Enquête sur la population active menée chaque mois par Statistics Finland. L'estimation de régression généralisée logistique donne de meilleurs résultats que l'estimation de régression ordinaire pour les petits domaines, en particulier les classes à faible fréquence.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013908
    Description :

    L'analyse qui suit porte sur le problème qui consiste à estimer la variance de l'estimateur général de régresison linéaire. On a montré que l'approche de calage à bas niveau adoptée par Sändal (1996) est moins ou aussi efficace que celle d'une catégorie d'estimateurs avancée par Deng et Wu (1987). On a aussi proposé une approche par calage à un niveau plus élevé. Les auteurs montrent que cette dernière constitue une amélioration par rapport à l'originale. Plusieurs estimateurs correspondent à des cas particuliers de la nouvelle approche. On a notamment émis l'idée d'obtenir une estimation non négative de la variance de l'estimateur GREG. Les résultats ont été appliqués à un plan d'échantillonnage aléatoire stratifié. On a aussi entrepris une étude empirique afin de jauger l'efficacité des stratégies envisagées. Le logiciel de statistique SGE bien connu, élaboré par Statistique Canada, peut être perfectionné en vue de fournir une estimation plus précise de la variance de l'estimateur GREG par calage à niveau élevé, dans certaines circonstances examinées plus bas.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013906
    Description :

    Pour les sondages, il doit idéalement y avoir correspondance de un à un entre les unités de la base de sondage et les élements de la population-cible à l'étude. Dans bien des cas, toutefois, la base de sondage a une structure plusieurs à plusieurs, c'est-à-dire qu'une unité de la base de sondage peut être associée à de multiples éléments de la population-cible et, vice-versa, un élément de la population-cible peut être associé à de multiples unités de la base de sondage. C'est ce qui s'est produit dans le cadre d'une enquête sur les caractéristiques des immeubles, pour laquelle la base de sondage était constituée des adresses de voirie et les immeubles commerciaux formaient la population-cible. La base de sondage était complexe, car une même adresse pouvait correspondre à un seul immeuble, à plusieurs immeubles ou à une partie d'un immeuble. Nous présentons ici des estimateurs et des formules pour en calculer la variance, selon des plans d'échantillonnage aléatoire simple et stratifié, lorsque la base de sondage est de structure plusieurs à plusieurs.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013910
    Description :

    Soit A, le domaine de la population auquel on s’intéresse. Supposons qu’il est impossible d’identifier les éléments de A dans la base de sondage et qu’on ignore le nombre d’éléments que contient A. Supposons en outre qu’on prélève un échantillon de taille fixe (n par exemple) de la base de sondage et que la taille de l’échantillon du domaine résultant (appelons-la n_A) soit aléatoire. Le problème consiste à bâtir un intervalle de confiance pour un paramètre du domaine tel que 1’agrégat du domaine T_A = \sum_{i \in A} x_i. Habituellement, la solution consiste à redéfinir x_i en établissant x_i = 0 si i \notin A. Au lieu de construire un intervalle de confiance pour le total du domaine, on en construit donc un pour un total de la population, ce que permet de satisfaire la théorie de la distribution normale (de façon asymptotique pour n). Une autre solution consisterait à imposer des conditions à n_A et à bâtir des intervalles de confiance à couverture presque nominale, avec certaines hypothèses se rapportant à la population du domaine. Les auteurs évaluent la nouvelle approche de manière empirique au moyen de populations artificielles et des données de l’Occupational Compensation Survey du Bureau of Labor Statistics (BLS).

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013905
    Description :

    Les plans d'échantillonnage à deux phases permettent d'utiliser les données auxiliaires de diverses façons. Les auteurs débutent en passant en revue les différents aspects que peuvent prendre ces données dans les enquêtes à deux phases. Ils établissent ensuite la méthode en vertu de laquelle elles sont converties en poids calés dont on se sert pour créer de bons estimateurs d'un total d'une population. Le calage s'effectue en deux étapes: i) au niveau de la population et ii) à celui de l'échantillon de la première phase. Les auteurs montrent qu'on peut aussi dériver les estimateurs issus de calage par régression, également en deux temps. Ils examinent ces estimateurs dans un cas particulier, en l'occurrence quand les données auxiliaires portent sur quelques sous-ensembles de la population baptisés "groupes de calage". Les strates a posteriori en constituent l'illustration la plus simple. Suit une discussion sur l'estimation des domaines d'intérêt et de la variance. Enfin, les résultats sont appliqués à deux importants plans d'échantillonnage à deux phases en usage à Statistique Canada. La théorie générale concernant l'emploi des données auxiliaires dans l'échantillonnage à deux phases sera intégrée au Système généralisé d'estimation de Statistique Canada.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 12-001-X19980013911
    Description :

    Dans cet article, l'auteur se penche sur les grandes propriétés de l'estimateur de régression généralisé de la moyenne d'une population finie et de l'estimateur de régression dérivé de l'estimateur de la différence optimale. Comme le second s'avère plus efficace que le premier, on cerne les conditions à l'origine de la situation et présente un critère qui facilitera le choix entre les deux estimateurs. Une étude de simulation illustre la performance des estimateurs avec un échantillon fini.

    Date de diffusion : 1998-07-31

  • Articles et rapports : 87-003-X19980033853
    Description :

    Les données sur les voyages internationaux, issues de l'Enquête sur les voyages internationaux (EVI), fournissent des renseignements de toutes sortes, tels que les destinations des voyageurs, leurs activités, le montant de leurs dépenses et leur degré de satisfaction à l'égard des attractions touristiques du pays visité.

    Date de diffusion : 1998-07-13

  • Articles et rapports : 91F0015M1998005
    Description :

    Tous les pays qui organisent des recensements s'inquiètent post factum de sa qualité et de l'ampleur du sous- dénombrement net. Pour mesurer l'une et l'autre, différentes méthodes ont depuis longtemps été imaginées. Certaines mettent à profit des sources d'informations indépendantes du recensement lui-même, alors que d'autres contrôlent la cohérence des résultats. Ce sont des opérations lourdes et onéreuses.

    Attendu que la population dans chaque pays est organisée différemment et que les structures administratives ne sont pas les mêmes, il n'y a pas de modèle universel qui puisse être appliqué pour obtenir des mesures. La division de la Démographie de Statistique Canada a passé en revue les procédés utilisés dans quatre pays du monde industrialisé afin de comparer les méthodes et apprécier leurs avantages et leurs faiblesses : les États-Unis, le Royaume Uni, l'Australie et évidement le Canada. Il ressort de la revue que l'analyse démographique peut être d'un grand secours pour déceler les incohérences quand vient le temps de comparer deux recensements successifs et que la technique des micro-données et le couplage des enregistrements sont indispensables pour évaluer l'importance du nombre de ceux qui ont été omis ou au contraire comptés deux fois le jour de l'énumération. Mais la conclusion la plus importante est la nécessité de conjuguer les efforts des démographes et des statisticiens pour évaluer des nombres dont la justesse demeurera toujours sujette à discussion.

    Date de diffusion : 1998-03-27

  • Articles et rapports : 12-001-X19970023615
    Description :

    Le présent article montre l'utilité d'un plan de sondage à plusieurs degrés pour obtenir le dénombrement total des établissements de santé et de la population de clients éventuels dans une région. La plan décrit a été utilisé pour effectuer une enquête à l'échelle de l'État d'Uttar Pradesh, en Inde, au milieu de 1995. Il comprend la sélection d'un échantillon aréolaire en grappes à plusieurs degrés où l'unité primaire d'échantillonnage est soit un îlot urbain, soit un village rural. On a fait le relevé cartographique, dressé la liste et sélectionné tous les points de fourniture de services de santé, qu'il s'agisse d'établissements autonomes ou d'agents de distribution, situés dans les unités primaires d'échantillonnage ou assignés officiellement à ces dernières. On a tiré un échantillon systématique de ménages et interviewé toutes les femmes faisant partie de ces ménages qui satisfaisaient les critères prédéterminés d'admissibilité. On a appliqué des poids d'échantillonnage aux établissements ainsi qu'aux personnes. Pour les établissements, les poids sont corrigés pour tenir compte du fait que certains établissements desservent plusieurs unités secondaires d'échantillonnage. Pour les personnes, on a corrigé les poids pour tenir compte des taux de réponse à l'enquête. L'estimation par sondage du nombre total d'^établissements publics concorde bien avec les totaux publiés. Pareillement, l'estimation de la population de clientes calculée d'après l'enquête concorde avec le chiffre total du Recensement de 1991.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023620
    Description :

    La France ne disposant pas de registres de population, les recensements de la population y constituent la base du système d'informations socio-démographiques. Cependant, entre deux recensements, l'actualisation de certaines données est nécessaire, notamment à un niveau géographique fin, d'autant plus que les recensements ont, pour diverses raisons, tendance à s'espacer. Une mission, dont l'objectif était de proposer un système améliorant substantiellement le dispositif d'estimations locales de population en vigueur, a été créée en 1993 au sein de l'Institut National de la Statistique et des Études Économiques. Elle s'est consacrée à une double tâche: réaliser une synthèse efficace et robuste des informations apportées par différentes sources administratives et mobiliser un nombre suffisant de "bonnes" sources. Le système "multi-sources" qu'elle a conçu et qui est présenté ici est souple et fiable, sans être trop complexe.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023619
    Description :

    La présence d'observations extrêmes dans les données d'enquête est un problème récurrent de la statistique appliquée auquel l'enquête de l'INSEE sur l'investissement industriel est aussi confrontée. La prévision du taux de croissance des dépenses d'équipement dans l'industrie se ramène, de ce fait, à l'estimation robuste d'un total dans une population finie. Dans une première partie, cet article analyse l'estimateur actuellement utilisé dans l'enquête Investissement. Nous montrons qu'il suit une stratégie de repondération de l'estimateur linéaire. Mais la dichotomie stricte imposée entre les points extrêmes, tous supposés non représentatifs, et les autres points n'est pas entièrement satisfaisante d'un point de vue à la fois théorique et pratique. L'adoption d'une approche modélisée à l'estimation par les GM-estimateurs, appliqués au cas d'une population finie, permet de pallier ces défauts. Nous construisons ensuite une procédure adaptative robuste qui détermine l'estimateur approprié en fonction des résidus observés sur l'échantillon lorsque ceux-ci peuvent être supposés symétriques. Enfin, cette méthode est appliquée aux données de l'enquête Investissement sur la période 1990-1995.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023614
    Description :

    En 1993, Statistique Canada introduisait l'Interview assistée par ordinateur (IAO) pour certaines enquêtes-ménages menées dans un environnement décentralisé. Cette technologie a été utilisée avec succès pendant quelques années et la plupart des enquêtes-ménages sont maintenant converties à cette méthode de collecte. Le présent document fait un résumé de l'expérience acquise et des leçons apprises depuis le début de la recherche sur le sujet. Il décrit certains des essais qui ont mené à l'adoption de cette technologie et quelques-unes des nouvelles possibilités qui sont nées de sa mise en oeuvre. Il présente aussi un certain nombre d'enjeux qui se sont posés lors de l'adoption de l'IAO (certains existant encore aujourd'hui) et se termine sur un bref survol de ce que nous réserve l'avenir.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023617
    Description :

    La modélisation des réponses ordinales a déjà fait l'objet de beaucoup de recherches. Selon certains auteurs, lorsque la variable de réponses est ordinale, la prise en compte de cette caractéristique dans le modèle à estimer devrait accroître la performance de ce modèle. Dans des conditions ordinales, Campbell et Donner (1989) ont comparé le taux asymptotique d'erreurs de classificartion du modèle logistique multinomial à celui du modèle logistique ordinal d'Anderson (1984). Ils ont démontré que ce dernier était assorti d'un taux asymptotique d'erreurs prévisible inférieur à celui du modèle logistique multinomial. Dans le présent article, nous cherchons à comparer la performance d'un modèle logistique ordinal et d'un modèle multinomial pour les réponses ordinales. Toutefois, au lieu de concentrer notre attention sur l'efficacité de classification, nous nous attachons à estimer les proportions pour les petites régions. En utilisant un modèle logistique multinomial et un modèle ordinal, nous cherchons plus particulièrement à adapter l'estimation de proportions pour petites régions à partir de données binômiales par des méthodes empiriques de Bayes, tel que le suggèrent Farrell, MacGibbon et Tomberlin (1997a), aux variables qui appartiennent à plus de deux catégories de résultats. Les propriétés des estimateurs fondés sur ces deux modèles sont comparées au moyen d'une simulation au cours de laquelle les méthodes empiriques de Bayes proposées sont appliquées à des données issues du recensement américain de 1950, afin de chercher à prévoir, pour des petites régions, les proportions des personnes appartenant aux diverses catégories d'une variable de réponses ordinale représentant le niveau de revenu.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023621
    Description :

    L'estimateur de variance jackknife présente des propriétés intéressantes quand on s'en sert avec les estimateurs lisses tirés d'échantillons stratifiés à plusieurs degrès. L'article que voici porte sur l'application de cet estimateur à un plan particulier d'échantillonnage à deux phases: on commence par constituer un échantillon aléatoire stratifié en grappes par tirage non exhaustif, puis on restratifie les éléments des grappes échantillonnées et on prélève des sous-échantillons aléatoires simples de chaque strate de la deuxième phase. Apparemment, l'estimateur jackknife donne des résultats raisonnables pour ce qui est d'estimer la variance d'un estimateur de "développement" commun, mais pas celle d'un autre. Les auteurs parlent de l'application de leurs résultats à des stratégies d'estimation plus complexes. Une étude de Monte Carlo étaye leurs principales constatations.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023616
    Description :

    La stratification a posteriori est une méthode appliquée couramment pour tenir compte de l'inégalité des probabilités d'échantillonnage et de la non-réponse lors des enquêtes par sondage. Cette méthode consiste à subdiviser la population en plusieurs catégories, à estimer la répartition des réponses dans chaque catégorie, puis, à donner à chaque catégorie un poids proportionnel à sa taille dans la population. Nous considérons la stratification a posteriori comme un cadre de référence général englobant de nombreux scénarios de pondération utilisés dans le domaine de l'analyse d'enquête (consulter Little 1993). Nous construisons un modèle de régression logistique hiérarchique pour déterminer la moyenne conditionnelle d'une variable de réponse binaire subordonnée à des cellules, ou catégories, de stratification a posteriori. Le modèle hiérarchique permet d'inclure un nombre beaucoup plus grand de cellules que les méthodes classiques, donc, d'introduire beaucoup plus de renseignements sur la population, tout en incluant tous les renseignements qui sous-tendent l'inférence lors de l'échantillonnage d'enquête. Donc, nous combinons la méthode de modélisation appliquée fréquemment à l'estimation des petites régions aux renseignements sur la population utilisés à l'étape de la stratification a posteriori. Nous appliquons la méthode à un ensemble de sondages d'opinion préélectoraux effectués aux États-Unis, dont les données sont stratifiées a posteriori selon l'État et selon les variables démographiques habituelles. Nous évaluons les modèles graphiquement en comparant les résultats qu'ils produisent à ceux des élections au niveau de l'État.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023618
    Description :

    Les offices statistiques constituent souvent leurs panels d'entreprises par tirages de Poisson, ou par tirages strafifiés de taille fixe et à probabilités uniformes dans chaque strate. À ces tirages correspondent des algorithmes utilisant des numéros permanents suivant une loi uniforme. Comme les caractéristiques des unités évoluent, il est nécessaire d'effectuer périodiquement des retirages tout en cherchant à conserver le maximum d'unités. La solution par tirage de Poisson est la plus simple et donne le recouvrement théorique maximal, mais avec l'inconvénient d'une taille aléatoire de l'échantillon. Par contre, dans le cas du tirage stratifié de taille fixe, les changements de strates occasionnent des difficultés venant justement de ces contraintes de taille fixe. Une première difficulté est qu'on diminue le recouvrement, d'autant plus que la stratification est finie. Or c'est ce qui risque de se produire si les naissances constituent des strates à part. On montre comment le fait de rendre équidistants les numéros avant les retirages peut servir à corriger cet effet. L'inconvénient, assez faible, est que dans chaque strate le tirage n'est plus un tirage aléatoire simple ce qui rend moins rigoureuse l'estimation de la variance. Une autre difficulté est de concilier le retirage avec une rotation éventuelle des unités dans l'échantillon. On présente un type d'algorithme qui prolonge après retirage la rotation avant retirage. Il est basé sur des transformations des numéros aléatoires servant aux tirages, de façon à se ramener au retirage sans rotation. Ces transformations sont particulièrement simples quand elles portent sur les numéros équidistants, mais peuvent aussi se faire avec les numéros suivant une loi uniforme.

    Date de diffusion : 1998-03-12

  • Articles et rapports : 12-001-X19970023613
    Description :

    Dans bien des cas, les meilleures décisions en matière de politiques sont celles qui peuvent s'appuyer sur des données statistiques, elles-mêmes obtenues d'analyses de microdonnées pertinentes. Cependant, il arrive parfois que l'on dispose de toutes les données nécessaires mais que celles-ci soient réparties entre de multiples fichiers pour lesquels il n'existe pas d'identificateurs communs (p. ex. numéro d'assurance sociale, numéro d'identification de l'employeur ou numéro de sécurité sociale). Nous proposons ici une méthode pour analyser deux fichiers de ce genre: 1) lorsqu'il existe des informations communes non uniques, sujettes à de nombreuses erreurs et 2) lorsque chaque fichier de base contient des données quantitatives non communes qui peuvent être reliées au moyen de modèles appropriés. Une telle situation peut se produire lorsqu'on utilise des fichiers d'entreprises qui n'ont en commun que l'information - difficile à utiliser - sur le nom et l'adresse, par exemple un premier fichier portant sur les produits énergétiques consommés par les entreprises et l'autre fichier regroupant les données sur le type et la quantité de biens produits. Une autre situation similaire peut survenir avec des fichiers sur des particuliers, dont le premier contiendrait les données sur les gains, le deuxième, des renseignements sur les dépenses reliées à la santé et le troisième, des données sur les revenus complémentaires. Le but de la méthode présentée est de réaliser des analyses statistiques valables, avec production ou non de fichiers de microdonnées pertinentes.

    Date de diffusion : 1998-03-12

Références (4)

Références (4) (4 of 4 results)

  • Produits techniques : 88F0006X1998006
    Description :

    Les résultats obtenus du Survol des indicateurs statistiques de l'innovation dans les régions du Canada : comparaison des provinces servent à analyser les différences régionales dans les activités de sciences et technologie menées au Canada. Cette analyse s'inscrit dans le cadre du Projet de système d'information sur les sciences et la technologie de Statistique Canada. Ce document de travail présente des estimations des dépenses et du personnel consacrés à la R-D dans les universités, l'administration fédérale, l'industrie et les organismes de recherche provinciaux aussi bien que les statistiques générales provinciales. L'objectif de ce projet est de développer des indicateurs d'activité utiles réunis dans un cadre conceptuel permettant de dresser un portrait cohérent des sciences et de la technologie au Canada. Ces indicateurs peuvent être utilisés pour brosser un tableau au niveau national ou encore à un niveau provincial ou infraprovincial pour refléter les différences régionales. Un autre document de travail déjà publié, La fiscalité de la recherche et du développement au Canada : comparaison interprovinciale, présente une analyse basée sur une méthode mise au point par le Conference Board du Canada pour comparer les stimulants fiscaux à la R-D de chaque province. Six provinces sur dix offrent des programmes d'encouragement et des taux d'imposition qui leurs sont propres et qui diffèrent. L'analyse de l'Indice-B du Conference Board fournit un moyen pour comparer les stimulants fiscaux et propose un indicateur.

    Date de diffusion : 1998-10-30

  • Classification : 89F0077X199802B
    Description :

    L' Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ) est la première enquête sur les enfants qui sera menée à l'échelle du Canada. Elle débutera en 1994 et recueillera des renseignements au sujet d'un groupe d'enfants et de leurs expériences de vie. L'enquête suivra ces enfants à mesure qu'ils grandissent. L'enquête a pour but de recueillir des renseignements sur les enfants, leurs familles, leur éducation, leur santé, leur développement, leur comportement, leurs ami(e)s, leurs activités, etc.

    Avec 89F0077XPF (ou XIF) numéro 9903b ce document contient les différents questionnaires utilisés pour recueillir des renseignements auprès des parents, des enfants, des enseignants et des directeurs d'école.

    Date de diffusion : 1998-06-04

  • Classification : 89F0077X1996001
    Description :

    L' Enquête longitudinale nationale sur les enfants (ELNE) est la première enquête sur les enfants qui sera menée à l'échelle du Canada. Elle débutera en 1994 et recueillera des renseignements au sujet d'un groupe d'enfants et de leurs expériences de vie. L'enquête suivra ces enfants à mesure qu'ils grandissent. L'enquête a pour but de recueillir des renseignements sur les enfants, leurs familles, leur éducation, leur santé, leur développement, leur comportement, leurs ami(e)s, leurs activités, etc.

    Date de diffusion : 1998-02-27

  • Classification : 89F0077X199802A
    Description :

    L' Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ) est la première enquête sur les enfants qui sera menée à l'échelle du Canada. Elle débutera en 1994 et recueillera des renseignements au sujet d'un groupe d'enfants et de leurs expériences de vie. L'enquête suivra ces enfants à mesure qu'ils grandissent. L'enquête a pour but de recueillir des renseignements sur les enfants, leurs familles, leur éducation, leur santé, leur développement, leur comportement, leurs ami(e)s, leurs activités, etc.

    Avec 89F0077XPF numéro 9802b ce document contient les différents questionnaires utilisés pour recueillir des renseignements auprès des parents, des enfants, des enseignants et des directeurs d'école.

    Date de diffusion : 1998-02-27

Date de modification :