Statistiques par sujet – Méthodes statistiques

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Année de publication

1 facettes affichées. 1 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Année de publication

1 facettes affichées. 1 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Année de publication

1 facettes affichées. 1 facettes sélectionnées.

Préciser les résultats par

Aide pour les filtres et la recherche
Filtres actuellement sélectionnés pouvant être supprimés

Mot(s)-clé(s)

Année de publication

1 facettes affichées. 1 facettes sélectionnées.

Autres ressources disponibles pour appuyer vos recherches.

Aide pour trier les résultats
Explorer notre base centrale des principaux concepts normalisés, définitions, sources de données et méthodes.
En cours de chargement
Chargement en cours, veuillez patienter...
Tout (54)

Tout (54) (25 of 54 results)

  • Index et guides : 92-371-X
    Description :

    Le présent rapport porte sur l'échantillonnage et la pondération, un procédé qui consiste à recueillir et à traiter certaines caractéristiques à partir d'un échantillon aléatoire de logements et de personnes dénombrés lors du recensement intégral. On obtient ensuite, pour l'ensemble de la population, les données pour ces caractéristiques en pondérant les données-échantillon. L'utilisation de l'échantillonnage peut permettre de faire des économies substantielles et de réduire le fardeau du répondant, ou encore, d'élargir la portée d'un recensement sans frais supplémentaires.

    Date de diffusion : 1999-12-07

  • Produits techniques : 11-522-X19980015031
    Description :

    La U.S. Third National Health and Nutrition Examination Survey (NHANES III) a été réalisée de 1988 à 1994. Cette enquête visait avant tout à fournir des estimations de paramètres transversaux considérés comme pratiquement constants durant la période de collecte des données de six ans. Cependant, dans le cas de certaines variables (p. ex., la concentration sérique du plomb, l'indice de masse corporelle et le comportement concernant l'usage du tabac), des considérations importantes donnent à penser que des changements de niveau non négligeables pourraient être survenus entre 1988 et 1994. Pour ces variables, la NHANES III pourrait être une source de renseignements sur les tendances temporelles plus précieuse que d'autres études portant sur des populations et des échantillons plus restreints. Deux difficultés compliquent l'étude des tendances temporelles possibles. Premièrement, il existe un certain déséquilibre en ce qui a trait à l'attribution des interviews et des calendriers d'examen dans les diverses régions. Cette situation pose un problème pratique, car on note des écarts considérables d'une région à l'autre, dans le cas de certaines variables. Deuxièmement, des variations non négligeables des niveaux au fil du temps peuvent entacher d'un biais non négligeable certains estimateurs habituels de la variance NHANES III. Dans la présente communication, nous nous penchons sur ces deux inconvénients et présentons quelques-unes de leurs conséquences relativement à l'établissement de politiques en matière de statistique.

    Date de diffusion : 1999-10-22

  • Classification : 89F0077X199903B
    Description :

    L'Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ) est la première enquête sur les enfants qui sera menée à l'échelle du Canada. Elle débutera en 1994 et recueillera des renseignements au sujet d'un groupe d'enfants et de leurs expériences de vie. L'enquête suivra ces enfants à mesure qu'ils grandissent. L'enquête a pour but de recueillir des renseignements sur les enfants, leurs familles, leur éducation, leur santé, leur développement, leur comportement, leurs ami(e)s, leurs activités, etc.

    Avec 89F0077XPF (ou XIF) numéro 9903a ce document contient les différents questionnaires utilisés pour recueillir des renseignements auprès des parents, des enfants, des enseignants et des directeurs d'école.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015033
    Description :

    Les incidents de victimisation ne sont pas distribués aléatoirement de façon uniforme à travers la population, mais ont plutôt tendance à se limiter à un nombre relativement faible de personnes. Nous utilisons des données tirées de la U.S. National Crime Victimization Survey (NCVS), qui est une enquête par panel avec renouvellement à plusieurs degrés, pour estimer les probabilités conditionnelles d'être la victime d'un crime à un temps t, compte tenu de son état de victimisation lors d'interviews antérieures. Nous présentons et ajustons des modèles qui permettent l'utilisation d'informations partielles provenant de ménages qui emménagent dans l'unité de logement ou qui la quittent durant la période d'étude. Nous avons constaté que la probabilité estimée d'être la victime d'un crime de l'interview t, compte tenu de la situation à l'interview (t-l) diminue avec (t). Nous examinons également les conséquences éventuelles sur l'estimation des taux transversaux de victimisation.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015016
    Description :

    Des modèles d'ajustement des réponses binaires longitudinales sont explorés au moyen d'une étude par panel réalisée sur les intentions de vote. Un modèle logistique à plusieurs niveaux pour mesurer types répétés se révèle inapproprié en raison de la présence d'une proportion substantielle de répondants qui donnent une réponse constante au fil du temps. Un modèle de réponses binaires multidimensionnel se révèle mieux adapté aux données.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015010
    Description :

    En 1994, Statistique Canada a implanté une nouvelle enquête longitudinale à caractère social auprès de 23 000 enfants répartis dans 13 500 ménages. L'enquête longitudinale nationale sur les enfants et les jeunes a pour but de mesurer le développement et le bien-être des enfants jusqu'à l'âge adulte. Pour ce faire, l'enquête recueille de l'information au sujet de l'enfant, ses parents, son voisinage, son environnement familial et scolaire. Il s'en suit que les données reçues pour chaque enfant proviennent de plusieurs répondants, tant parents qu'enseignants, ce qui ajoute au risque de divulgation. Pour établir un juste équilibre entre le respect de la confidentialité et la capacité analytique des données diffusées, l'enquête produit trois fichiers de microdonnées ayant un contenu plus ou moins riche. Le fichier le plus complet n'est disponible que par accès à distance. Ainsi les chercheurs n'ont pas directement accès aux données mais envoient leurs demandes d'analyses sous forme de programme informatique qui sont excécutés par des employés de Statistique Canada. Les résultats de ces analyses sont scrutés avant d'être renvoyés aux chercheurs. La présentation porte sur les différents risques de divulgation d'une telle enquête et des moyens de les atténuer.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015017
    Description :

    Les études longitudinales avec observations répétées sur des individus permettent de mieux caractériser les changements et de mieux évaluer les facteurs de risque éventuels. On possède toutefois peu d'expérience sur l'application de modèles perfectionnés à des données longitudinales avec plan d'échantillonnage complexe. Nous présentons ici les résultats d'une comparaison de différentes méthodes d'estimation de la variance applicables à des modèles à effets aléatoires évaluant l'évolution de la fonction cognitive chez les personnes âgées. Le plan d'échantillonnage consiste en un échantillon stratifié de personnes âgées de 65 ans et plus, prélevé dans le cadre d'une étude communautaire visant à examiner les facteurs de risque de la démence. Le modèle résume l'hétérogénéité de la population, en ce qui a trait au niveau global et au taux d'évolution de la fonction cognitive, en utilisant des effets aléatoires comme coordonnée à l'origine et comme pente. Nous discutons d'une méthode de régression non pondérée avec covariables représentant les variables de stratification, d'une méthode de régression pondérée et de la méthode bootstrap; nous présentons également quelques travaux préliminaires sur la méthode de répétition équilibrée et celle du jackknife.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015025
    Description :

    On étudie la modélisation log-linéaire de données d'enquêtes longitudinales catégoriques sur le revenu. Un accent est mis sur l'inférence sur le changement. Une attention particulière est accordée à la modélisation de données longitudinales collectées durant deux périodes de référence. Nous présentons un exemple fondé sur les données de l'Enquête sur la dynamique du travail et du revenu effectuée au Canada.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015007
    Description :

    L'Enquête nationale sur la santé de la population (ENSP) comprend une famille d'enquêtes à objectifs multiples, l'un étant de fournir des renseignements sur un panel de personnes qui sera suivi au fil du temps pour reflèter la dynamique de la santé et de la maladie. Les données du premier cycle de l'Enquête sur les ménages - ENSP ont été collectées de juin 1994 à juin 1995, et diffusées en septembre 1995. Les données du deuxième cycle ont été collectées de juin 1996 à août 1997. L'un des principaux produits du deuxième cycle est un fichier longitudinal principal. Ce document décrira six grandes stratégies qui ont été mises au point pour traiter le fichier longitudinal principal.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015028
    Description :

    Nous abordons le problème de l'estimation des statistiques sur la dynamique du revenu calculées d'après les données d'enquêtes longitudinales complexes. En outre, nous comparons deux estimateurs (fondés sur le plan d'échantillonnage) de proportions longitudinales et de taux de transition, du point de vue de la variabilité, dans le cas de taux d'érosion élevé. Un des estimateurs est fondé sur des échantillons transversaux pour l'estimation des bornes de catégories de revenu à chaque période, ainsi que sur un échantillon longitudinal pour l'estimation des dénombrements longitudinaux. L'autre estimateur est entièrement fondé sur l'échantillon longitudinal pour l'estimation des bornes de catégories et pour les dénombrements longitudinaux. Nous établissons des estimateurs de variance par la linéarisation de Taylor, tant pour l'estimateur longitudinal que pour l'estimateur mixte, dans le cas où l'on présume qu'il n'y a aucun changement dans la population, et pour l'estimateur mixte, dans le cas où la population subit des changements.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015024
    Description :

    Une étude longitudinale d'une cohorte d'élèves de l'école secondaire est menée dans une région de l'Italie depuis 1986 afin d'étudier la transition entre l'école et le marché du travail. Les renseignements ont été collectés à chaque étape au moyen d'un questionnaire envoyé par la poste et, à l'étape finale, au moyen d'une interview en salle de classe au cours de laquelle on a posé des questions rétrospectives portant sur l'ensemble de la période d'observation. Les flux bruts entre différents états discrets - toujours dans le système scolaire, sur le marché du travail mais inactif, sur le marché du travail et actif - peuvent ensuite être estimés à la fois à partir de donées prospectives et rétrospectives, et l'effet de mémoire peut être évalué. De plus, les conditions observées au moyen des deux techniques différentes peuvent être considérées comme deux indicateurs de la condition réelle non observable, ce qui nous amène à la spécification et à l'estimation d'un modèle de catégorie latente. Dans ce cadre de référence, une hypothèse de chaïne markovienne peut être introduite et évaluée de maniére à estimer les probabilités de transition entre les états, une fois ceux-ci corrigés ou les erreurs de classification. Puisque les renseignements collectés par la poste présentent une proportion importante de données manquantes sous forme de non-réponse d'unités, nous introduisons aussi la catégorie manquante dans le modèle applicable aux données prospectives.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015022
    Description :

    La présente communication élargit et développe la méthode proposée par Pfeffermann, Skinner et Humphreys (1998) pour l'estimation de mouvements bruts en présence d'erreurs de classification. L'élément principal de la méthode en question est l'utilisation de renseignements complémentaires au niveau des individus, ce qui permet d'éviter de recourir à des données de validation pour l'estimation des taux d'erreur de classification. Les développements contenus dans la présente communication sont l'établissement de conditions permettant l'identification de modèles, une étude des caracéristiques de la qualité de l'ajustement d'un modèle et des modifications à la vraisemblance de l'échantillon afin de tenir compte des données manquantes et de l'échantillonnage informatif. Ces développements sont illustrés par une petite simulation fondée sur la méthode de Monte Carlo.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015023
    Description :

    L'étude de la mobilité sociale, par exemple entre situations sur le marché du travail ou entre niveaux de revenus, s'appuie souvent sur l'analyse de matrices de mobilité. Lorsqu'on compare ces matrices de transition, en vue d'évaluer les changements de comportements, on oublie souvent que les données sont issues d'une enquête par sondage, et qu'elles sont par conséquent affectées d'une variance d'échantillonnage. De même, on postule que les réponses collectées correspondent à la vraie valeur.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015035
    Description :

    Dans le cadre d'une enquête longitudinale effectuée pendant k périodes, certaines unités peuvent être observées pour un nombre de périodes inférieur à k. Les enquêtes avec sous-échantillons se chevauchant partiellement, les enquêtes par panel pur avec non-réponse (une enquête par panel pur étant une enquête par panel non-complétée d'échantillons supplémentaires) et les enquêtes par panel complétées par des échantillons supplémentaires pour certaines périodes en sont des exemples. Nous présentons des estimateurs par régression pour des enquêtes de ce genre. Nous examinons une application aux études spéciales liées au National Resources Inventory.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015020
    Description :

    Fin 1993, Eurostat a pris la décision de lancer un panel communautaire de ménages. La première vague, réalisée en 1994 dans les douze pays de l'Union, a touché en France environ 7.300 ménages, comportant un peu plus de 14.000 adultes de 17 ans ou plus. Chaque individu devait alors être suivi et interrogé chaque année, même en cas de déménagement. Les individus disparaissant de l'échantillon présentent un profil particulier. Dans une première partie, nous présentons le schéma d'évolution de notre échantillon ainsi qu'une analyse des caractéristiques principales des non-répondants. Nous proposons ensuite deux modèles de correction de la non-réponse par catégories homogènes. Nous décrivons ensuite les distributions des poids longitudinaux obtenus selon les deux modèles, et des poids transversaux dérivés, calculés selon la méthode de partage des poids. Nous comparons enfin les valeurs de quelques indicateurs estimés à l'aide de l'un ou l'autre jeu de pondérations.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015036
    Description :

    En tant que généralisation de la régression logistique, la régression logistique multivariée, introduite par Glonek et McCullagh (1995), facilite l'analyse des données longitudinales en acceptant les observations répétées et dépendantes d'une variable nominale ainsi que des jeux de réponses incomplets. L'auteur montre comment étendre cette méthode au traitement des données d'une enquête complexe et en fournit l'illustration grâce à l'Enquête sur la population active suisse. Il examine également l'incidence des poids d'échantillonnage sur l'estimation des paramètres et des erreurs-types.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015029
    Description :

    Dans le cas des enquêtes longitudinales, les sujets qui font partie de l'échantillon sont observés pendant plusieurs périodes. En général, cette caractéristique produit des observations dépendantes sur le même sujet, plus des corrélations ordinaires entre sujets résultant du plan d'échantillonnage. Nombre des travaux décrits dans la littérature portent surtout sur la modélisation de la moyenne marginale d'une réponse en fonction de covariables. Liang et Zeger (1986) se sont servis d'équations d'estimation généralisées nécessitant uniquement la spécification correcte de la moyenne marginale et ont obtenu les erreurs-types des estimations des paramètres de régression et les critères connexes du test de Wald, en supposant que les mesures répétées effectuées sur un sujet de l'échantillon présentent une structure de corrélation provisoire. Rotnitzky et Jewell (1990) ont développé des tests de quasi-résultat et des corrections de Rao-Scott aux tests de quasi-résultat provisoire dans le cadre de modèles marginaux. Ces méthodes sont asymptotiquement robustes en regard de la spécification erronée de la structure des corrélations propre à un sujet, mais supposent que les sujets de l'échantillon sont indépendants, ce qui n'est pas toujours vrai dans le cas de donneées d'enquêtes longitudinales complexes fondées sur un échantillonnage stratifié à plusieurs degrés. Nous proposons des tests de Wald et des tests de quasi-score asymptotiquement valides pour les données d'enquêtes longitudinales, fondés sur la méthode de linéarisation de Taylor et sur la méthode jackknife. Nous élaborons aussi d'autres tests, fondés sur les corrections apportées par Rao-Scott à des tests naïfs qui ne tiennent pas compte des caractéristiques du plan de sondage et sur les t de Bonferroni. Ces tests sont particulièrement utiles quand le nombre réel de degrés de liberté, ordinairement considéré comme égal au nombre total d'unités primaires dans l'échantillon (grappes) moins le nombre de strates, est petit.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015019
    Description :

    La British Labour Force Survey (LFS) est une enquête-ménage trimestrielle qui se fonde sur un plan d'échantillonnage avec renouvellement et qui pourrait être utilisée pour produire des données longitudinales, y compris des estimations des mouvements bruts de la population active. Cependant ces estimations peuvent être biaisées à cause de la non-réponse. L'ajustement de la pondération est une méthode fréquemment utilisée pour tenir compte du biais de la non-réponse. Nous nous sommes rendus compte qu'il se pourrait que cet ajustement ne tienne pas pleinement compte de l'effet du biais de la non-réponse, parce que la non-réponse pourrait être attribuable aux mouvements non observés de la population active, c'est-à-dire que la non-réponse est non négligeable. Pour tenir compte des effets de la non-réponse non négligeable, nous proposons un modèle pour la tendance à la non-réponse complexe dans la LSF qui contrôle la non-réponse corrélée à l'intérieur des ménages qu'on décèle dans l'enquête. Les résultats de la modélisation portent à croire qu'il se pourrait que la non-réponse soit non négligeable dans la LFS, de sorte que les estimations pondérées ajustées seraient biaisées.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015037
    Description :

    Pour des données longitudinales, les modéles mixtes sont fréquemment utilisés puisqu'ils permettent de tenir compte de la corrélation entre les observations provenant d'un même individu. Le modèle pour un mélange fini de distributions peut être considéré comme un cas particulier d'un modéle mixte. Dans ce document, on portera l'attention sur la méthode du maximum de vraisemblance. La maximisation de la fonction de vraisemblance pour un mélange fini de distributions est généralement plus ardue que dans le cas usuel d'une seule distribution et peut exiger beaucoup de temps. L'objectif de ce travail a donc consisté principalement à déterminer le(s) algorithme(s) qui satisfait(ont) au mieux les critères de temps d'exécution et d'efficacité pour trouver la solution. Pour atteindre cet objectif, on a effectué une étude de simulation. On n'a considéré que la situation dans laquelle la variable dépendante est dichotomique. Cette situation est très utile en pratique puisqu'elle sert, entre autres, à modéliser des durées discrètes telle que la durée dans l'état "faible revenu".

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015026
    Description :

    Le but de la présente étude est d'utiliser les données de panel de la Current Population Survey (CPS) pour examiner les effets de la non-réponse des unités. Étant donné que la plupart des non-répondants à la CPS sont des répondants durant au moins un mois de présence dans l'échantillon, on peut se servir des données relatives aux autres mois pour comparer les caractéristiques des personnes qui participent entièrement au panel avec les caractéristiques des non-répondants, ainsi que pour évaluer les méthodes de correction pour tenir compte de la non-réponse. Dans la présente communication, nous présentons des analyses fondées sur les données de panel de la CPS pour illustrer les effets de la non-réponse des unités. Après avoir apporté les corrections nécessaires pour tenir compte de l'absence de réponse, nous effectuons également des comparaisons visantà évaluer l'incidence de ces corrections. En outre, nous analysons la signification des constatations et les propositions de recherche ultérieure.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015032
    Description :

    Le présent projet de recherche a pour objectif d'examiner les conséquences à long terme liées au fait de grandir dans un ménage monoparental. Nous examinons l'incidence de la séparation ou du divorce des parents sur le comportement qu'ont les enfants sur le marché du travail une fois qu'ils atteignent l'âge adulte, dix à quinze ans après l'évènement. Plus précisément, nous établissons le lien entre le revenu familial et les caractéristiques du ménage observé pour une cohorte de jeunes de 16 à 19 ans en 1982, d'une part, et les revenus que ces jeunes tirent d'un travail, la mesure dont ils dépendent des transferts sociaux (assurance-chômage et soutien du revenu) et leur situation matrimoniale et de fécondité au début des années 1990, quand ils arrivent à la fin de la vingtaine ou au début de la trentaine, d'autre part. Nos données sont tirées des dossiers couplés sur l'impôt sur le revenu des particuliers créés à Statistique Canada, de l'Enquête sur la dynamique du travail et du revenu et de l'Enquête nationale longitudinale sur les enfants et les jeunes.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015030
    Description :

    Les plans d'échantillonnage à deux phases sont utilisés dans le cadre d'études à plusieurs cycles, pour estimer l'incidence de maladies rares, comme la démence. Cependant, les estimations de l'incidence établies à partir d'une étude longitudinale sur la démence doivent être corrigées comme il se doit, pour tenir compte des données manquantes dues aux décès et du plan d'échantillonnage utilisé à chaque cycle de l'étude. Dans cet article, nous proposons une approche basée sur un modèle de sélection pour la modélisation des données manquantes dues aux décès et nous utilisons une méthode de vraisemblance pour estimer l'incidence. Un algorithme EM modifié est également utilisé pour tenir compte des données manquantes dues à l'échantillonnage. L'estimateur non paramétrique de la variance obtenu par la méthode du jackknife est utilisé pour estimer la variance des paramètres du modèle et des estimations de l'incidence. Les méthodes proposées ici sont appliquées aux données tirées de l'étude sur la démence d'Indianapolis et d'Ibadan.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015015
    Description :

    En épidémiologie, on considère généralement que l'analyse de données longitudinales offre les mesures les plus robustes des liens existant entre un risque présumé et certains résultats, comme la mort ou le cancer. Le logiciel SMARTIE est une application SAS qui permet d'analyser de manière efficace des données longitudinales. D'après le nombre de jours-personnes à risque, le logiciel peut traiter des sorties et des retours multiples en ce qui a trait à l'exposition au risque et calculer des indicateurs des résultats, comme les taux de survie, les deux comparatifs de mortalité et les taux comparatifs d'incidence du cancer. Il produit également des données sommaires dans une présentation qui permet de transférer facilement ces données à tout progiciel de modélisation, dont Stats 5.0. Nous présentons l'historique de la création du logiciel, la structure générale du programme et le langage de commande; nous abordons également l'organisation des données de sortie. Nous utilisons les résultats des études sur la survie fondées sur l'étude longitudinale de l'Office for National Statistics (ONS) pour présenter les caractéristiques de SMARTIE. Cette étude est effectuée auprès d'un pour cent de la population de l'Angleterre et du pays de Galles. Elle est continuellement mise à jour par l'ajout de nouveaux participants et de renseignements tirés des fichiers sur les naissances, les décès et le cancer, ainsi que des recensements.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015034
    Description :

    Nous avons estimé un modèle de progression scolaire au secondaire à l'aide de données tirées de l'Enquête auprès des sortants (EAS) de 1991, qui a été effectuée par Statistique Canada. Les informations sur lesquelles est fondé le modèle de progression scolaire comprennent le niveau de scolarité actuel et les réponses à des questions rétrospectives portant sur les dates des évènements de scolarisation. Ces données ont permis de reconstituer de manière approximative l'historique des évènements éducatifs de chaque répondant. Le modèle de progression scolaire a été conçu pour être inclus dans un modèle plus vaste de micro-simulation à temps continu. Les principaux éléments du modèle comportent l'estimation (par âge, mois de naissance et saison, dans le cas des deux sexes et dans chaque province) des taux d'obtention de diplômes, de décrochage scolaire, de retour à l'école et d'obtention du diplôme après un décrochage. Ces estimations ont été renforcées à l'aide de données auxiliaires tirées du Recensement de 1991 et de données administratives.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015027
    Description :

    La diffusion des résultats des enquêtes annuelles d'entreprise comporte immanquablement des statistiques en évolution. Comme l'univers économique est de plus en plus mouvant, une simple différence d'agrégats entre n-l et n ne suffit plus à décrire synthétiquement ce qui s'est passé. Le module de calcul d'évolution de la nouvelle génération d'EAE divise l'évolution en diverses composantes (naissances, cessations, changements de secteur), et détermine une évolution à champ constant en accordant une importance particulière aux restructurations. Les difficultés essentielles résident dans la détermination des sous-échantillons, la repondération, le recalage sur des évolutions calculables, et la prise en compte des restructurations.

    Date de diffusion : 1999-10-22

Données (1)

Données (1) (1 result)

  • Tableau : 75M0007X
    Description :

    L'Enquête sur l'absence du travail fournit aux ministères des renseignements importants sur le temps perdu au travail par les Canadiens pour des raisons de santé. Ces renseignements contribuent également à l'élaboration de programmes d'aide à l'intention des employés qui s'absentent du travail. Par exemple, le régime restreint d'assurance-salaire tire des renseignements essentiels des données sur l'absence du travail. Ce régime s'adresse aux employeurs qui offrent à leurs salariés une assurance contre les pertes de salaire attribuable à la maladie, etc. Ces employeurs bénéficient d'une réduction des contributions qu'ils versent à la Commission d'assurance-emploi. Les réponses obtenues permettront également d'aider à déterminer les taux de réduction applicables à ces employeurs. Bien que l'enquête sur l'absence du travail recueille des renseignements sur les absences pour cause de maladie, d'accident ou de grossesse, elle ne constitue pas une représentation exhaustive des personnes qui ont été absentes du travail pour ces raisons, car les concepts et les définitions ont été élaborés spécialement pour répondre aux besoins du client. Aux fins de cette enquête, l'absence est, par définition, de deux semaines au moins, et on ne demande aux répondants que de citer les trois raisons de leur absence la plus récente et de celle qui l'a précédée.

    Date de diffusion : 1999-06-29

Analyses (23)

Analyses (23) (23 of 23 results)

  • Articles et rapports : 12-001-X19990014713
    Description :

    Les auteurs étudient l'estimation régionale robuste en fonction d'un modèle simple à effets aléatoires constitué d'un modèle de base (ou à effets fixes) et d'un modèle de liaison qui traite les effets fixes comme des réalisations d'une variable aléatoire. À l'aide de ce modèle, on obtient également un estimateur modélisé d'une moyenne régionale. Cet estimateur, qui dépend des poids d'enquête, demeure conforme au plan. On obtient également un estimateur à base de modèle de son erreur quadratique moyenne (EQM). Les résultats d'une simulation indiquent que l'estimateur proposé et l'estimateur modélisé de Kott (1989) sont également efficaces, et que l'estimateur de l'EQM proposé est souvent beaucoup plus stable que l'estimateur de l'EQM de Kott, même pour des écarts modérés du modèle de liaison. La méthode s'étend également à des modèles de régression à erreur emboîtée.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014709
    Description :

    Nous élaborons une méthode qui permet d'estimer la variance dans le cas de la désaisonnalisation effectuée à l'aide de la méthode X-11 et qui prend en compte les effets de l'erreur d'échantillonnage et des erreurs liées à l'extension de prévision. Dans notre méthode, l'erreur de désaisonnalisation présente dans les valeurs centrales d'une série chronologique suffisamment longue est causée uniquement par les effets de l'application de filtres X-11 aux erreurs d'échantillonnage. Vers les deux extrémités d'une série, nous prenons également en considération la contribution des erreurs d'extrapolation rétrospective et de prévision à l'erreur de désaisonnalisation. Nous élargissons notre méthode afin d'obtenir la variance d'erreurs contenues dans des estimations de tendance X-11 et de prendre en compte l'erreur d'estimation de coefficients de régression utilisés pour modéliser, par exemple, des effets de calendrier. Dans le cas de nos résultats empiriques, la contribution la plus importante à la variance de la désaisonnalisation provenait souvent de l'erreur d'échantillonnage. Cependant, la variance des estimations de tendance augmentait de façon importante aux extrémités des séries, en raison des effets d'erreurs d'extrapolation rétrospective et de prévision. En outre, des composantes non stationnaires des erreurs d'échantillonnage produisaient des patrons singuliers dans la variance de la désaisonnalisation et de l'estimation de tendance.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014711
    Description :

    Nous considérons l'utilisation d'estimateurs de calage en présence de valeurs aberrantes. Une extension de la classe des estimateurs de calage de Deville et Särndal (1992) reposant sur les estimateurs QR de Wright (1983) est obtenue. Elle s'obtient aussi en minimisant une métrique générale sous des contraintes sur les variables de calage et sur les poids. Comme application, cette classe d'estimateurs nous permet de considérer des estimateurs de calage robustes en choisissant judicieusement ses paramètres. Il est ainsi possible, pour des besoins éventuellement cosmétiques, de restreindre les poids robustes à une intervalle spécifié à l'avance. L'utilisation d'estimateurs robustes avec haut point de rupture est considéré. Dans le cas particulier de la métrique quadratique, l'estimateur que nous suggérons est une généralisation d'une proposition de Lee (1991). Une brève étude de simulation illustre la nouvelle méthodologie.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014718
    Description :

    Les auteurs de la présente note montrent que la formule bien connue de l'effet de plan de sondage, proposée intuitivement par Kish, comporte une justification à base de modèle. La formule peut-être interprétée comme une valeur prudente de l'effet réel de plan de sondage.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014714
    Description :

    Dans cet article, nous utilisons un modèle général à niveaux multiples pour obtenir des estimations régionales à partir des données d'enquête. Ce type de modèle permet de ternir compte des variations entre les régions, en raison : (i) des différences dans la distribution des variables unitaires entre les régions; (ii) des différences dans la distribution des variables régionales entre les régions et (iii) des composantes de la variance propres à la région, qui permettent de tenir compte de la variation locale additionnelle qui ne peut être expliquée par les covariables unitaires ou régionales. Des estimateurs régionaux sont calculés pour ce modèle multiniveau et nous fournissons une approximation de l'erreur quadratique moyenne (EQM) de chaque estimation régionale, pour cette catégorie générale de modèles mixtes, ainsi qu'un estimateur de cette EQM. L'approximation de la EQM et l'estimateur de la EQM tiennent compte de trois sources de variation : (i) la prévision de l'erreur quadratique moyenne en présumant que les termes fixes et les composantes de la variance dans le modèle à niveaux multiples sont connus; (ii) la composante additionnelle du fait qu'il faille estimer les coefficients fixes et (iii) la composante additionnelle du fait que les composantes de la variance dans le modèle doivent être estimées. Les estimations par les méthodes proposées sont obtenues à partir d'un grand ensemble de données qui sert de base aux études numériques. Les résultats obtenus confirment que les composantes additionnelles de la variance incluses dans les modèles à niveaux multiples, de même que les covariables régionales, peuvent améliorer les estimations régionales et que l'approximation de la EQM et l'estimateur de la EQM sont satisfaisants.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X199900111395
    Description :

    La rubrique Dans ce numéro contient une brève présentation par le rédacteur en chef de chacun des articles contenus dans le présent numéro de Techniques d'enquête. Aussi, on y trouve parfois quelques commentaires sur des changements dans la structure ou la gestion de la revue.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014712
    Description :

    L'auteur étudie une méthode basée sur le plan de sondage permettant d'utiliser une information auxiliaire en vue d'améliorer la précision des estimateurs. L'objectif est de construire un estimateur dont le biais conditionnel est faible grâce à la pondération des valeurs observées par l'inverse des probabilités d'inclusion conditionnelles. L'auteur propose une approximation générale dans le cas où la statistique auxiliaire est un vecteur d'estimateurs de Horvitz-Thompson. Cette approximation est assez proche de l'estimateur optimal deécrit par Fuller et Isaki (1981), Montanari (1987, 1997), Deville (1992) et Rao (1994, 1997). Puis, il applique l'estimateur optimal à un plan d'échantillonnage stratifié et montre qu'on peut considérer cet estimateur optimal comme estimateur de régression généralisé pour lequel les variables indicatrices de la stratification sont également utilisés au stade de l'estimation. Enfin, il discute du domaine d'application de cet estimateur dans le contexte général de l'utilisation de données auxiliaires.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014716
    Description :

    Les auteurs étudient deux estimateurs fondés sur le plan de sondage des flux et des taux de transition. L'un, appelé estimateur mixte, s'appuie sur les échantillons transversaux pour l'estimation des bornes des caégories de revenu pour chaque période de référence et sur l'échantillon longitudinal pour l'estimation du nombre d'unités dans la population longitudinale (dénombrement longitudinal). L'autre, appelé estimateur longitudinal, se fonde sur l'échantillon longitudinal aussi bien pour l'estimation des bornes des catégories de revenu que pour les dénombrements longitudinaux. Par une méthode de simulation, les auteurs comparent les deux estimateurs lorsque les taux d'érosion sont élevés. Ils constatent que, si le modèle de correction pour l'érosion est imparfait, l'estimateur mixte est ordinairement plus sensible que l'estimateur longitudinal au biais lié au modèle. Ils observent aussi que, dans le cas de l'estimateur mixte, ce biais annule le faible gain de précision obtenu comparativement à l'estimateur longitudinal. Enfin, ils se servent des données de l'Enquête sur la dynamique du travail et du revenu et de la base de données longitudinales administratives de Statistique Canada pour illustrer les résultats.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014715
    Description :

    The Gallup Organization a mené des enquêtes-ménages pour étudier la prévalence à l'échelle des États de la consommation d'alcool et de drogues (par exemple, cocaïne, marijuana, etc.). Les estimations traditionnelles dans le cadre d'enquêtes fondées sur le plan d'échantillonnage relativement à l'utilisation et à la dépendance pour des comptés et des groupes démographiques choisis ont des erreurs-types inacceptables parce que la taille des échantillons dans des groupes infra-états est trop petite. L'estimation synthétique incorpore des renseignements démographiques et des indicateurs sociaux dans les estimations de la prévalence grâce à un modèle de régression implicite. Les estimations synthétiques ont tendance à produire des variances plus petites que les estimations fondées sur le plan d'échantillonnage, mais elles peuvent être très homogènes d'un comté à l'autre lorsque les variables auxiliaires sont homogènes. Les estimations composites pour les données régionales sont des mouvements ponérées des estimations synthétiques et des estimations d'enquêtes fondées sur le plan d'échantillonnage. Un deuxième problème que l'on ne rencontre pas généralement au niveau de l'État, mais qui est présent pour des zones infra-états et des groupes concerne l'estimation des erreurs-types des prévalences estimées qui sont près de zéro. Cette difficulté touche non seulement les estimations des enquêtes-ménages téléphoniques, mais aussi les estimations composites. Un modèle hiérarchique est proposé pour régler ce problème. Des estimateurs composites empririques de Bayes, qui incorporent des facteurs de pondération des enquêtes, des prévalences et des estimateurs selon la technique du jackknife de leurs erreurs quadratiques moyennes sont présentés et illustrés.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014707
    Description :

    Les auteurs présentent l'échantillonnage mixte de Poisson, qui correspond à une famille de plans d'échantillonnage tirant son nom du fait que chaque membre de la famille est un mélange de deux plans d'échantillonnage de Poisson, c'est-à-dire l'échantillonnage ptn de Poisson et l'échantillonnage de Bernoulli. Ces deux plans si situent aux extrémités opposées d'un spectre continu indexé en fonction d'un paramètre continu. L'échantillonnage mixte de Poisson est destiné aux populations très asymétriques que l'on rencontre souvent dans les enquêtes-entreprises. Les statisticiens y trouvent un éventail d'options pour l'ampleur de la coordination des échantillons et le contrôle du fardeau de réponse. Certains plans d'échantillonnage mixte de Poisson donnent des estimations nettement plus précises que l'échantillonnage ptn de Poisson habituel. Ce résultat a de l'importance car l'échantillonnage ptn de Poisson est très efficace en soi, à supposer qu'il se fonde sur une bonne mesure de la taille.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014717
    Description :

    L'Enquête britannique sur la population active (EPA) utilise un plan d'échantillonnage avec renouvellement, chaque ménage de l'échantillon étant conservé pendant cinq trimestres consécutifs. Le fait de relier ensemble les renseignements sur les mêmes personnes d'un trimestre à l'autre produit une source potentiellement très riche des données longitudinales. Cependant, il y a de graves risques de distorsion dans les résultats du fait de cette liaison longitudinale, surtout en raison de l'érosion de l'échantillon, et des erreurs de réponse, ce qui peut produire de faux flux entre les situations au regard de l'activité économique. Le présent document décrit les premiers résultats d'investigations menées par l'Office for National Statistics (ONS) quant à la nature et à l'ampleur des problèmes.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 12-001-X19990014710
    Description :

    La plupart des bureaux de la statistique utilisent des techniques non probabilistes pour choisir l'échantillon de produits dont les prix permettent de calculer les indices des prix à la consommation. Aux Pays-Bas, comme dans beacoup d'autres pays, ce genre de sondage raisonné se rapproche en quelque sorte de la sélection par seuil d'inclusion, une bonne partie de la population (normalement les produits suscitant le moins de dépenses) étant délibérément exclue des observations. Bien sûr, cette méthode donne lieu à des chiffres biaisés pour l'indice des prix. On peut se demander si un échangillonnage probabiliste donnerait de meilleurs résultats quant à l'erreur quadratique moyenne. Les auteurs ont considéré l'échantillonnage aléatoire simple, l'échantillonnage stratifié et l'échantillonnage systématique proportionnel aux dépenses. Ils ont mené des simulations de Monte Carlo à l'aide de données de lecture optique pour le café, les couches de bébés et le paper hygiénique afin d'évaluer le rendement des quatre plans d'échantillonnage. Il est assez surprenant de constater que la sélection par seuil d'inclusion est une bonne stratégie d'échantillonnage des produits pour l'indice des prix à la consommation.

    Date de diffusion : 1999-10-08

  • Articles et rapports : 62F0014M1998013
    Description :

    La population de référence de l'indice des prix à la consommation (IPC) est représentée, depuis la mise à jour du panier de biens et services de 1992, par les familles et personnes seules vivant dans des ménages privés, urbains ou ruraux. L'IPC officiel est une mesure du taux de variation moyen dans le temps du coût d'achat d'un panier fixe de biens et services achetés par les consommateurs canadiens.

    Étant donné l'étendue de la population cible de l'IPC, on a reproché à cette mesure de négliger les expériences inflationistes de certains groupes socio-démographiques. La présente étude s'intéresse à cette question pour trois sous-groupes de la population de référence de l'IPC. Elle est une prolongation des recherches antérieures sur le sujet réalisées à Statistique Canada.

    Dans le présent document, les indices analytiques de prix à la consommation des sous-groupes sont comparés à l'indice analytique pour l'ensemble de la population de référence, au niveau géographique national.

    Les conclusions s'inscrivent dans la même lignée que celles des études précédentes de Statistique Canada portant sur des sous-groupes de la population de référence de l'IPC. Ces études ont toujours conclu qu'un indice des prix à la consommation établi pour un sous-groupe quelconque, ne diffère pas sensiblement de l'indice pour l'ensemble de la population de référence.

    Date de diffusion : 1999-05-13

  • Articles et rapports : 12-001-X19980024348
    Description :

    Les flux bruts entre situations d'activité sont d'une grande importance pour comprendre la dynamique du marché du travail. Les flux observés sont généralement entachés d'erreurs de classification qui peuvent introduire des biais importants. Dans le présent article, nous passons en revue certaines des stratégies les plus couramment utilisées pour recueillir des données longitudinales sur la situation par rapport au marché du travail, ainsi que des méthodes de modélisation qui ont été créées pour corriger les flux bruts lorsqu'ils présentent des erreurs de classification. Nous présentons un cadre général pour l'estimation des flux bruts. Nous donnons des exemples des diverses spécifications de modèle appliquées à des données qui ont été recueillies avec des stratégies différentes. Nous considérons en particulier deux cas, c'est-à-dire les flux bruts de la U.S. Survey of Income and Program Participation et les flux bruts de l'Enquête française sur la population active, qui est une enquête annuelle dans laquelle on recueille des données mensuelles rétrospectives.

    Date de diffusion : 1999-01-14

  • Articles et rapports : 12-001-X19980024354
    Description :

    Le présent article porte sur un essai de mise en tableau croisé de deux variables nominales qui ont été recueillies de manière distincte à partir de deux échantillons indépendants de grande taille, et recueillies conjointement à partir d'un seul échantillon de petite taille. Dans le cadre de cet essai, on a présumé que les échantillons de grande taille présentent un grand ensemble de variables communes. La méthode d'estimation qui est proposée peut être considérée comme un mélange entre les méthodes de calage et l'appariement statistique. Grâce aux méthodes de calage, il est possible d'intégrer les plans d'échantillonnage complexes à la méthode d'estimation, afin de répondre à certaines exigences en matière de cohérence entre des estimations provenant de sources différentes, ainsi que pour obtenir des estimations plutôt non biaisées dans le cas du tableau à double entrée. Grâce aux méthodes d'appariement statistique, il est possible d'intégrer un ensemble relativement important de variables communes à l'estimation de calage, à l'aide de laquelle on peut améliorer la justesse du tableau à double entrée qui est estimé. La méthode d'estimation nous permet de mieux comprendre le biais qui accompagne généralement l'estimation du tableau à double entrée lorsqu'on utilise uniquement les échantillons de grande taille. Nous montrons l'utilité de la méthode d'estimation dans l'imputation des valeurs provenant d'un des grands échantillons (source donneuse) à l'autre grand échantillon (source-hôte). Bien que la méthode soit élaborée principalement pour les valeurs nominales Y et Z, une modification mineure permet de l'appliquer également à des valeurs Y et Z continues.

    Date de diffusion : 1999-01-14

  • Articles et rapports : 12-001-X19980024349
    Description :

    La mesure des flux bruts de la population active est un objectif important des enquêtes continues sur la population active effectuées par un grand nombre d'offices nationaux de la statistique. Cependant, il est bien connu que l'estimation de ces flux peut être compliquée par une non-réponse, des erreurs de mesure, un renouvellement de l'échantillon et des effets complexes du plan de sondage. Le présent article, inspiré par des modèles de non-réponse dans les enquêtes sur les ménages, porte sur l'estimation des flux bruts tout en apportant des ajustements en fonction de la non-réponse dont il faut tenir compte. Les approches antérieures basées sur un modèle en ce qui concerne l'estimation des flux bruts supposaient que la non-réponse était un processus au niveau de la personne. Nous proposons une catégorie de modèles qui permettent une non-réponse dont il faut tenir compte au niveau du ménage. On a recours à une étude en simulation pour démontrer que les estimations des flux bruts de la population active au niveau de la personne provenant des données d'enquêtes sur les ménages peuvent être biaisées et que les estimations en fonction de modèles au niveau du ménage peuvent permettre de réduire ce biais.

    Date de diffusion : 1999-01-14

  • Articles et rapports : 12-001-X19980024355
    Description :

    Deux stratégies d'échantillonnage sont proposées pour estimer les chiffres d'une population finie au cycle le plus récent, à partir des échantillons prélevés sur deux cycles, au moyen de plans d'échantillonnage à probabilité variable. Nous utilisons les données recueillies au premier cycle sur une variable à l'étude comme mesure de la taille et comme variable de stratification pour la sélection de l'échantillon apparié, au deuxième cycle. L'efficacité relative des stratégies proposées est comparée ici à d'autres méthodes appropriées.

    Date de diffusion : 1999-01-14

  • Articles et rapports : 12-001-X19980024351
    Description :

    Pour calculer les indices de prix, il faut recueillir des données relatives à un même article (en fait, un ensemble d'articles définis avec précision) durant diverses périodes. La question qu'on se pose est celle de savoir si de telles données quasi-longitudinales peuvent être modélisées de manière à expliquer ce qu'est un indice des prix. Des chercheurs de pointe spécialisés dans les questions relatives aux indices de prix ont émis des doutes quant à la possibilité d'utiliser la modélisation statistique pour caractériser de tels indices. Dans la présente communications, on propose un simple modèle à espace d'états relatif aux données sur les prix qui donne un indice des prix à la consommation exprimé d'après les paramètres du modèle.

    Date de diffusion : 1999-01-14

  • Articles et rapports : 12-001-X19980024352
    Description :

    L'Enquête nationale sur la santé de la population (ENSP) est l'une des trois principales enquêtes-ménages longitudinales que mène Statistique Canada à une grande échelle auprès de la population canadienne. Depuis vingt ans, tous les deux ans, on a suivi un panel constitué d'environ 17 000 personnes. Les données provenant de l'enquête sont utilisées pour des analyses longitudinales, même si l'un des objectifs important est la production d'estimations transversales. Pour chaque cycle, les panélistes fournissent des renseignements détaillés sur leur santé (S) pendant qu'au même moment, pour augmenter l'échantillon transversal, des données socio-démographiques et quelques renseignements sur la santé sont recueillis (G) auprès de tous les membres des ménages. Cette stratégie de collecte présente différents schémas de réponse pour les panélistes après deux cycles: GS-GS, GS-G*, GS-**, G*-GS, G*-G* et G*-**, où * indique une portion de données manquantes. Le présent article explique la méthodologie élaborée pour traiter ces types de non-réponse longitudinale de même que la non-réponse d'une perspective transversale. L'utilisation de facteurs de pondération pour la non-réponse et la création de cellules d'ajustement pour la pondération à l'aide de l'algorithme CHAID sont expliquées ici.

    Date de diffusion : 1999-01-14

  • Articles et rapports : 12-001-X19980024350
    Description :

    Dans le cadre d'enquêtes longitudinales, de simples estimations de variations, comme des différences de pourcentages, peuvent ne pas être toujours suffisamment efficaces pour déceler des variations ayant de l'importance sur le plan pratique, notamment dans le cas de sous-populations. Le recours à des modèles, qui peuvent représenter la structure de dépendance de l'enquête longitudinale, peut aider à résoudre ce problème. Une des principales caractéristiques observées dans le cadre de l'Enquête suisse sur la population active (ESPA) est la situation d'activité. Étant donné que cette enquête comporte un plan d'échantillonnage à renouvellement de panel, les données qui en sont tirées sont des données nominales multidimensionnelles, et une grande partie des profils de réponse est absente conformément à ce plan. Le modèle logistique multidimensionnel, qui a été introduit par Glonek et McCullagh (1995) comme généralisation de la régression logistique présente de l'intérêt dans ce contexte parce qu'il autorise des observations répétées dépendantes et des profiles de réponse incomplets. Nous montrons qu'en utilisant la régression logistique multidimensionnelle, on peut représenter la structure de dépendance complexe de l'ESPA à l'aide d'un petit nombre de paramètres et obtenir des estimations plus efficaces d'une variation.

    Date de diffusion : 1999-01-14

  • Articles et rapports : 12-001-X19980024347
    Description :

    Nous examinons dans cet article divers aspects de la conception et de l'analyse des études dans le cadre desquelles les mêmes unités sont examinées à différents moments; au fil des ans. Ces études incluent les enquêtes longitudinales, ainsi que les analyses longitudinales d'études rétrospectives et de données administratives ou données du recensement. Nous nous intéressons ici tout particulièrement aux problèmes particuliers qui résultent du caractère longitudinal de l'étude, en examinant quatre des principales composantes de l'étude longitudinale, à savoir la conception, la mise en oeuvre, l'évaluation et l'analyse. Une attention particulière doit être portée à chacune de ces étapes durant la planification d'une étude longitudinale. Au nombre des questions qui sont liées à la nature longitudinale des études, mentionnons les suivantes: concepts et définitions, bases de sondage, méthodes d'échantillonnage, collecte des données, traitement de la non-réponse, imputation, estimation, validation des données ainsi que analyse et diffusion des données. En présumant que les exigences fondamentales liées à la conduite d'une enquête transversale sont connues, nous énonçons ci-après les questions et les problèmes que se dessinent pour bon nombre d'études longitudinales.

    Date de diffusion : 1999-01-14

  • Articles et rapports : 12-001-X19980024353
    Description :

    Nous examinons dans cet article les erreurs de réponse qui surviennent lors de la Current Population Survey menée par le U.S. Bureau of the Census et évaluons l'incidence de ces erreurs sur les taux de chômage qui sont ensuite publiés par le Bureau of Labor Statistics. Les taux d'erreur sont calculés à partir des données de la réinterview, par une méthode qui se veut un prolongement de celle mise au point par Hui et Walter pour évaluer les tests de diagnostic. Contrairement aux études antérieures qui présumaient que les données conciliées de la réinterview reflétaient la situation véritable, la méthode proposée ici estime les taux d'erreur dans les deux interviews. À partir de ces estimations, nous montrons que les erreurs de classification dans l'enquête initiale ont un effet cyclique sur les estimations du taux de chômage qui sont ensuite publiées et que le degré de sous-estimation augmente tout particulièrement lorsque le taux de chômage réel est élevé. Comme nous n'avions pas suffisamment de données pour établir une distinction entre, d'une part, un modèle présumant que les taux d'erreurs de classification sont les mêmes durant tout le cycle économique et, d'autre part, un modèle qui présume que les taux varient selon que le taux de chômage est faible, modéré ou élevé, nos conclusions doivent être considérées comme provisoires. Celles-ci indiquent néanmoins qu'il y aurait lieu d'examiner plus à fond la relation entre les modèles utilisés pour évaluer l'exactitude des tests de diagnostic et les modèles servant à mesurer les taux d'erreurs de classification dans les données d'enquête.

    Date de diffusion : 1999-01-14

  • Articles et rapports : 12-001-X19980024356
    Description :

    En dehors des enquêtes complexes, on applique fréquemment des intervalles de confiance exacts aux proportions obtenues par distribution binomiale au lieu d'intervalles reposant sur une normalité approximative, quand les événements positifs sont peu nombreux. Malheureusement, il est impossible d'en faire autant avec les données des enquêtes complexes, en sorte qu'on utilise des intervalles reposant sur la normalité approximative hypothétique de la proportion pondérée selon l'échantillon, même quand il existe peu d'évènements positifs. Les auteurs proposent une simple modification aux intervalles binomiaux dans une situation de ce genre. Les simulations restreintes qu'ils présentent indiquent que la couverture probable de tels intervalles dépasse celle des intervalles reposant sur la normalité, des intervalles venant de la transformation par logit et des intervalles résultant de l'approximation de Poisson. Ils appliquent ensuite ces intervalles à la prévalance du virus de l'immunodéficience humaine (VIH) selon les données de la troisième Enquête nationale sur la santé et la nutrition et à la proportion de cocaïnomanes selon les données de l'Enquête sur la santé et la nutrition des personnes hispaniques.

    Date de diffusion : 1999-01-14

Références (30)

Références (30) (25 of 30 results)

  • Index et guides : 92-371-X
    Description :

    Le présent rapport porte sur l'échantillonnage et la pondération, un procédé qui consiste à recueillir et à traiter certaines caractéristiques à partir d'un échantillon aléatoire de logements et de personnes dénombrés lors du recensement intégral. On obtient ensuite, pour l'ensemble de la population, les données pour ces caractéristiques en pondérant les données-échantillon. L'utilisation de l'échantillonnage peut permettre de faire des économies substantielles et de réduire le fardeau du répondant, ou encore, d'élargir la portée d'un recensement sans frais supplémentaires.

    Date de diffusion : 1999-12-07

  • Produits techniques : 11-522-X19980015031
    Description :

    La U.S. Third National Health and Nutrition Examination Survey (NHANES III) a été réalisée de 1988 à 1994. Cette enquête visait avant tout à fournir des estimations de paramètres transversaux considérés comme pratiquement constants durant la période de collecte des données de six ans. Cependant, dans le cas de certaines variables (p. ex., la concentration sérique du plomb, l'indice de masse corporelle et le comportement concernant l'usage du tabac), des considérations importantes donnent à penser que des changements de niveau non négligeables pourraient être survenus entre 1988 et 1994. Pour ces variables, la NHANES III pourrait être une source de renseignements sur les tendances temporelles plus précieuse que d'autres études portant sur des populations et des échantillons plus restreints. Deux difficultés compliquent l'étude des tendances temporelles possibles. Premièrement, il existe un certain déséquilibre en ce qui a trait à l'attribution des interviews et des calendriers d'examen dans les diverses régions. Cette situation pose un problème pratique, car on note des écarts considérables d'une région à l'autre, dans le cas de certaines variables. Deuxièmement, des variations non négligeables des niveaux au fil du temps peuvent entacher d'un biais non négligeable certains estimateurs habituels de la variance NHANES III. Dans la présente communication, nous nous penchons sur ces deux inconvénients et présentons quelques-unes de leurs conséquences relativement à l'établissement de politiques en matière de statistique.

    Date de diffusion : 1999-10-22

  • Classification : 89F0077X199903B
    Description :

    L'Enquête longitudinale nationale sur les enfants et les jeunes (ELNEJ) est la première enquête sur les enfants qui sera menée à l'échelle du Canada. Elle débutera en 1994 et recueillera des renseignements au sujet d'un groupe d'enfants et de leurs expériences de vie. L'enquête suivra ces enfants à mesure qu'ils grandissent. L'enquête a pour but de recueillir des renseignements sur les enfants, leurs familles, leur éducation, leur santé, leur développement, leur comportement, leurs ami(e)s, leurs activités, etc.

    Avec 89F0077XPF (ou XIF) numéro 9903a ce document contient les différents questionnaires utilisés pour recueillir des renseignements auprès des parents, des enfants, des enseignants et des directeurs d'école.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015033
    Description :

    Les incidents de victimisation ne sont pas distribués aléatoirement de façon uniforme à travers la population, mais ont plutôt tendance à se limiter à un nombre relativement faible de personnes. Nous utilisons des données tirées de la U.S. National Crime Victimization Survey (NCVS), qui est une enquête par panel avec renouvellement à plusieurs degrés, pour estimer les probabilités conditionnelles d'être la victime d'un crime à un temps t, compte tenu de son état de victimisation lors d'interviews antérieures. Nous présentons et ajustons des modèles qui permettent l'utilisation d'informations partielles provenant de ménages qui emménagent dans l'unité de logement ou qui la quittent durant la période d'étude. Nous avons constaté que la probabilité estimée d'être la victime d'un crime de l'interview t, compte tenu de la situation à l'interview (t-l) diminue avec (t). Nous examinons également les conséquences éventuelles sur l'estimation des taux transversaux de victimisation.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015016
    Description :

    Des modèles d'ajustement des réponses binaires longitudinales sont explorés au moyen d'une étude par panel réalisée sur les intentions de vote. Un modèle logistique à plusieurs niveaux pour mesurer types répétés se révèle inapproprié en raison de la présence d'une proportion substantielle de répondants qui donnent une réponse constante au fil du temps. Un modèle de réponses binaires multidimensionnel se révèle mieux adapté aux données.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015010
    Description :

    En 1994, Statistique Canada a implanté une nouvelle enquête longitudinale à caractère social auprès de 23 000 enfants répartis dans 13 500 ménages. L'enquête longitudinale nationale sur les enfants et les jeunes a pour but de mesurer le développement et le bien-être des enfants jusqu'à l'âge adulte. Pour ce faire, l'enquête recueille de l'information au sujet de l'enfant, ses parents, son voisinage, son environnement familial et scolaire. Il s'en suit que les données reçues pour chaque enfant proviennent de plusieurs répondants, tant parents qu'enseignants, ce qui ajoute au risque de divulgation. Pour établir un juste équilibre entre le respect de la confidentialité et la capacité analytique des données diffusées, l'enquête produit trois fichiers de microdonnées ayant un contenu plus ou moins riche. Le fichier le plus complet n'est disponible que par accès à distance. Ainsi les chercheurs n'ont pas directement accès aux données mais envoient leurs demandes d'analyses sous forme de programme informatique qui sont excécutés par des employés de Statistique Canada. Les résultats de ces analyses sont scrutés avant d'être renvoyés aux chercheurs. La présentation porte sur les différents risques de divulgation d'une telle enquête et des moyens de les atténuer.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015017
    Description :

    Les études longitudinales avec observations répétées sur des individus permettent de mieux caractériser les changements et de mieux évaluer les facteurs de risque éventuels. On possède toutefois peu d'expérience sur l'application de modèles perfectionnés à des données longitudinales avec plan d'échantillonnage complexe. Nous présentons ici les résultats d'une comparaison de différentes méthodes d'estimation de la variance applicables à des modèles à effets aléatoires évaluant l'évolution de la fonction cognitive chez les personnes âgées. Le plan d'échantillonnage consiste en un échantillon stratifié de personnes âgées de 65 ans et plus, prélevé dans le cadre d'une étude communautaire visant à examiner les facteurs de risque de la démence. Le modèle résume l'hétérogénéité de la population, en ce qui a trait au niveau global et au taux d'évolution de la fonction cognitive, en utilisant des effets aléatoires comme coordonnée à l'origine et comme pente. Nous discutons d'une méthode de régression non pondérée avec covariables représentant les variables de stratification, d'une méthode de régression pondérée et de la méthode bootstrap; nous présentons également quelques travaux préliminaires sur la méthode de répétition équilibrée et celle du jackknife.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015025
    Description :

    On étudie la modélisation log-linéaire de données d'enquêtes longitudinales catégoriques sur le revenu. Un accent est mis sur l'inférence sur le changement. Une attention particulière est accordée à la modélisation de données longitudinales collectées durant deux périodes de référence. Nous présentons un exemple fondé sur les données de l'Enquête sur la dynamique du travail et du revenu effectuée au Canada.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015007
    Description :

    L'Enquête nationale sur la santé de la population (ENSP) comprend une famille d'enquêtes à objectifs multiples, l'un étant de fournir des renseignements sur un panel de personnes qui sera suivi au fil du temps pour reflèter la dynamique de la santé et de la maladie. Les données du premier cycle de l'Enquête sur les ménages - ENSP ont été collectées de juin 1994 à juin 1995, et diffusées en septembre 1995. Les données du deuxième cycle ont été collectées de juin 1996 à août 1997. L'un des principaux produits du deuxième cycle est un fichier longitudinal principal. Ce document décrira six grandes stratégies qui ont été mises au point pour traiter le fichier longitudinal principal.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015028
    Description :

    Nous abordons le problème de l'estimation des statistiques sur la dynamique du revenu calculées d'après les données d'enquêtes longitudinales complexes. En outre, nous comparons deux estimateurs (fondés sur le plan d'échantillonnage) de proportions longitudinales et de taux de transition, du point de vue de la variabilité, dans le cas de taux d'érosion élevé. Un des estimateurs est fondé sur des échantillons transversaux pour l'estimation des bornes de catégories de revenu à chaque période, ainsi que sur un échantillon longitudinal pour l'estimation des dénombrements longitudinaux. L'autre estimateur est entièrement fondé sur l'échantillon longitudinal pour l'estimation des bornes de catégories et pour les dénombrements longitudinaux. Nous établissons des estimateurs de variance par la linéarisation de Taylor, tant pour l'estimateur longitudinal que pour l'estimateur mixte, dans le cas où l'on présume qu'il n'y a aucun changement dans la population, et pour l'estimateur mixte, dans le cas où la population subit des changements.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015024
    Description :

    Une étude longitudinale d'une cohorte d'élèves de l'école secondaire est menée dans une région de l'Italie depuis 1986 afin d'étudier la transition entre l'école et le marché du travail. Les renseignements ont été collectés à chaque étape au moyen d'un questionnaire envoyé par la poste et, à l'étape finale, au moyen d'une interview en salle de classe au cours de laquelle on a posé des questions rétrospectives portant sur l'ensemble de la période d'observation. Les flux bruts entre différents états discrets - toujours dans le système scolaire, sur le marché du travail mais inactif, sur le marché du travail et actif - peuvent ensuite être estimés à la fois à partir de donées prospectives et rétrospectives, et l'effet de mémoire peut être évalué. De plus, les conditions observées au moyen des deux techniques différentes peuvent être considérées comme deux indicateurs de la condition réelle non observable, ce qui nous amène à la spécification et à l'estimation d'un modèle de catégorie latente. Dans ce cadre de référence, une hypothèse de chaïne markovienne peut être introduite et évaluée de maniére à estimer les probabilités de transition entre les états, une fois ceux-ci corrigés ou les erreurs de classification. Puisque les renseignements collectés par la poste présentent une proportion importante de données manquantes sous forme de non-réponse d'unités, nous introduisons aussi la catégorie manquante dans le modèle applicable aux données prospectives.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015022
    Description :

    La présente communication élargit et développe la méthode proposée par Pfeffermann, Skinner et Humphreys (1998) pour l'estimation de mouvements bruts en présence d'erreurs de classification. L'élément principal de la méthode en question est l'utilisation de renseignements complémentaires au niveau des individus, ce qui permet d'éviter de recourir à des données de validation pour l'estimation des taux d'erreur de classification. Les développements contenus dans la présente communication sont l'établissement de conditions permettant l'identification de modèles, une étude des caracéristiques de la qualité de l'ajustement d'un modèle et des modifications à la vraisemblance de l'échantillon afin de tenir compte des données manquantes et de l'échantillonnage informatif. Ces développements sont illustrés par une petite simulation fondée sur la méthode de Monte Carlo.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015023
    Description :

    L'étude de la mobilité sociale, par exemple entre situations sur le marché du travail ou entre niveaux de revenus, s'appuie souvent sur l'analyse de matrices de mobilité. Lorsqu'on compare ces matrices de transition, en vue d'évaluer les changements de comportements, on oublie souvent que les données sont issues d'une enquête par sondage, et qu'elles sont par conséquent affectées d'une variance d'échantillonnage. De même, on postule que les réponses collectées correspondent à la vraie valeur.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015035
    Description :

    Dans le cadre d'une enquête longitudinale effectuée pendant k périodes, certaines unités peuvent être observées pour un nombre de périodes inférieur à k. Les enquêtes avec sous-échantillons se chevauchant partiellement, les enquêtes par panel pur avec non-réponse (une enquête par panel pur étant une enquête par panel non-complétée d'échantillons supplémentaires) et les enquêtes par panel complétées par des échantillons supplémentaires pour certaines périodes en sont des exemples. Nous présentons des estimateurs par régression pour des enquêtes de ce genre. Nous examinons une application aux études spéciales liées au National Resources Inventory.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015020
    Description :

    Fin 1993, Eurostat a pris la décision de lancer un panel communautaire de ménages. La première vague, réalisée en 1994 dans les douze pays de l'Union, a touché en France environ 7.300 ménages, comportant un peu plus de 14.000 adultes de 17 ans ou plus. Chaque individu devait alors être suivi et interrogé chaque année, même en cas de déménagement. Les individus disparaissant de l'échantillon présentent un profil particulier. Dans une première partie, nous présentons le schéma d'évolution de notre échantillon ainsi qu'une analyse des caractéristiques principales des non-répondants. Nous proposons ensuite deux modèles de correction de la non-réponse par catégories homogènes. Nous décrivons ensuite les distributions des poids longitudinaux obtenus selon les deux modèles, et des poids transversaux dérivés, calculés selon la méthode de partage des poids. Nous comparons enfin les valeurs de quelques indicateurs estimés à l'aide de l'un ou l'autre jeu de pondérations.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015036
    Description :

    En tant que généralisation de la régression logistique, la régression logistique multivariée, introduite par Glonek et McCullagh (1995), facilite l'analyse des données longitudinales en acceptant les observations répétées et dépendantes d'une variable nominale ainsi que des jeux de réponses incomplets. L'auteur montre comment étendre cette méthode au traitement des données d'une enquête complexe et en fournit l'illustration grâce à l'Enquête sur la population active suisse. Il examine également l'incidence des poids d'échantillonnage sur l'estimation des paramètres et des erreurs-types.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015029
    Description :

    Dans le cas des enquêtes longitudinales, les sujets qui font partie de l'échantillon sont observés pendant plusieurs périodes. En général, cette caractéristique produit des observations dépendantes sur le même sujet, plus des corrélations ordinaires entre sujets résultant du plan d'échantillonnage. Nombre des travaux décrits dans la littérature portent surtout sur la modélisation de la moyenne marginale d'une réponse en fonction de covariables. Liang et Zeger (1986) se sont servis d'équations d'estimation généralisées nécessitant uniquement la spécification correcte de la moyenne marginale et ont obtenu les erreurs-types des estimations des paramètres de régression et les critères connexes du test de Wald, en supposant que les mesures répétées effectuées sur un sujet de l'échantillon présentent une structure de corrélation provisoire. Rotnitzky et Jewell (1990) ont développé des tests de quasi-résultat et des corrections de Rao-Scott aux tests de quasi-résultat provisoire dans le cadre de modèles marginaux. Ces méthodes sont asymptotiquement robustes en regard de la spécification erronée de la structure des corrélations propre à un sujet, mais supposent que les sujets de l'échantillon sont indépendants, ce qui n'est pas toujours vrai dans le cas de donneées d'enquêtes longitudinales complexes fondées sur un échantillonnage stratifié à plusieurs degrés. Nous proposons des tests de Wald et des tests de quasi-score asymptotiquement valides pour les données d'enquêtes longitudinales, fondés sur la méthode de linéarisation de Taylor et sur la méthode jackknife. Nous élaborons aussi d'autres tests, fondés sur les corrections apportées par Rao-Scott à des tests naïfs qui ne tiennent pas compte des caractéristiques du plan de sondage et sur les t de Bonferroni. Ces tests sont particulièrement utiles quand le nombre réel de degrés de liberté, ordinairement considéré comme égal au nombre total d'unités primaires dans l'échantillon (grappes) moins le nombre de strates, est petit.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015019
    Description :

    La British Labour Force Survey (LFS) est une enquête-ménage trimestrielle qui se fonde sur un plan d'échantillonnage avec renouvellement et qui pourrait être utilisée pour produire des données longitudinales, y compris des estimations des mouvements bruts de la population active. Cependant ces estimations peuvent être biaisées à cause de la non-réponse. L'ajustement de la pondération est une méthode fréquemment utilisée pour tenir compte du biais de la non-réponse. Nous nous sommes rendus compte qu'il se pourrait que cet ajustement ne tienne pas pleinement compte de l'effet du biais de la non-réponse, parce que la non-réponse pourrait être attribuable aux mouvements non observés de la population active, c'est-à-dire que la non-réponse est non négligeable. Pour tenir compte des effets de la non-réponse non négligeable, nous proposons un modèle pour la tendance à la non-réponse complexe dans la LSF qui contrôle la non-réponse corrélée à l'intérieur des ménages qu'on décèle dans l'enquête. Les résultats de la modélisation portent à croire qu'il se pourrait que la non-réponse soit non négligeable dans la LFS, de sorte que les estimations pondérées ajustées seraient biaisées.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015037
    Description :

    Pour des données longitudinales, les modéles mixtes sont fréquemment utilisés puisqu'ils permettent de tenir compte de la corrélation entre les observations provenant d'un même individu. Le modèle pour un mélange fini de distributions peut être considéré comme un cas particulier d'un modéle mixte. Dans ce document, on portera l'attention sur la méthode du maximum de vraisemblance. La maximisation de la fonction de vraisemblance pour un mélange fini de distributions est généralement plus ardue que dans le cas usuel d'une seule distribution et peut exiger beaucoup de temps. L'objectif de ce travail a donc consisté principalement à déterminer le(s) algorithme(s) qui satisfait(ont) au mieux les critères de temps d'exécution et d'efficacité pour trouver la solution. Pour atteindre cet objectif, on a effectué une étude de simulation. On n'a considéré que la situation dans laquelle la variable dépendante est dichotomique. Cette situation est très utile en pratique puisqu'elle sert, entre autres, à modéliser des durées discrètes telle que la durée dans l'état "faible revenu".

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015026
    Description :

    Le but de la présente étude est d'utiliser les données de panel de la Current Population Survey (CPS) pour examiner les effets de la non-réponse des unités. Étant donné que la plupart des non-répondants à la CPS sont des répondants durant au moins un mois de présence dans l'échantillon, on peut se servir des données relatives aux autres mois pour comparer les caractéristiques des personnes qui participent entièrement au panel avec les caractéristiques des non-répondants, ainsi que pour évaluer les méthodes de correction pour tenir compte de la non-réponse. Dans la présente communication, nous présentons des analyses fondées sur les données de panel de la CPS pour illustrer les effets de la non-réponse des unités. Après avoir apporté les corrections nécessaires pour tenir compte de l'absence de réponse, nous effectuons également des comparaisons visantà évaluer l'incidence de ces corrections. En outre, nous analysons la signification des constatations et les propositions de recherche ultérieure.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015032
    Description :

    Le présent projet de recherche a pour objectif d'examiner les conséquences à long terme liées au fait de grandir dans un ménage monoparental. Nous examinons l'incidence de la séparation ou du divorce des parents sur le comportement qu'ont les enfants sur le marché du travail une fois qu'ils atteignent l'âge adulte, dix à quinze ans après l'évènement. Plus précisément, nous établissons le lien entre le revenu familial et les caractéristiques du ménage observé pour une cohorte de jeunes de 16 à 19 ans en 1982, d'une part, et les revenus que ces jeunes tirent d'un travail, la mesure dont ils dépendent des transferts sociaux (assurance-chômage et soutien du revenu) et leur situation matrimoniale et de fécondité au début des années 1990, quand ils arrivent à la fin de la vingtaine ou au début de la trentaine, d'autre part. Nos données sont tirées des dossiers couplés sur l'impôt sur le revenu des particuliers créés à Statistique Canada, de l'Enquête sur la dynamique du travail et du revenu et de l'Enquête nationale longitudinale sur les enfants et les jeunes.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015030
    Description :

    Les plans d'échantillonnage à deux phases sont utilisés dans le cadre d'études à plusieurs cycles, pour estimer l'incidence de maladies rares, comme la démence. Cependant, les estimations de l'incidence établies à partir d'une étude longitudinale sur la démence doivent être corrigées comme il se doit, pour tenir compte des données manquantes dues aux décès et du plan d'échantillonnage utilisé à chaque cycle de l'étude. Dans cet article, nous proposons une approche basée sur un modèle de sélection pour la modélisation des données manquantes dues aux décès et nous utilisons une méthode de vraisemblance pour estimer l'incidence. Un algorithme EM modifié est également utilisé pour tenir compte des données manquantes dues à l'échantillonnage. L'estimateur non paramétrique de la variance obtenu par la méthode du jackknife est utilisé pour estimer la variance des paramètres du modèle et des estimations de l'incidence. Les méthodes proposées ici sont appliquées aux données tirées de l'étude sur la démence d'Indianapolis et d'Ibadan.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015015
    Description :

    En épidémiologie, on considère généralement que l'analyse de données longitudinales offre les mesures les plus robustes des liens existant entre un risque présumé et certains résultats, comme la mort ou le cancer. Le logiciel SMARTIE est une application SAS qui permet d'analyser de manière efficace des données longitudinales. D'après le nombre de jours-personnes à risque, le logiciel peut traiter des sorties et des retours multiples en ce qui a trait à l'exposition au risque et calculer des indicateurs des résultats, comme les taux de survie, les deux comparatifs de mortalité et les taux comparatifs d'incidence du cancer. Il produit également des données sommaires dans une présentation qui permet de transférer facilement ces données à tout progiciel de modélisation, dont Stats 5.0. Nous présentons l'historique de la création du logiciel, la structure générale du programme et le langage de commande; nous abordons également l'organisation des données de sortie. Nous utilisons les résultats des études sur la survie fondées sur l'étude longitudinale de l'Office for National Statistics (ONS) pour présenter les caractéristiques de SMARTIE. Cette étude est effectuée auprès d'un pour cent de la population de l'Angleterre et du pays de Galles. Elle est continuellement mise à jour par l'ajout de nouveaux participants et de renseignements tirés des fichiers sur les naissances, les décès et le cancer, ainsi que des recensements.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015034
    Description :

    Nous avons estimé un modèle de progression scolaire au secondaire à l'aide de données tirées de l'Enquête auprès des sortants (EAS) de 1991, qui a été effectuée par Statistique Canada. Les informations sur lesquelles est fondé le modèle de progression scolaire comprennent le niveau de scolarité actuel et les réponses à des questions rétrospectives portant sur les dates des évènements de scolarisation. Ces données ont permis de reconstituer de manière approximative l'historique des évènements éducatifs de chaque répondant. Le modèle de progression scolaire a été conçu pour être inclus dans un modèle plus vaste de micro-simulation à temps continu. Les principaux éléments du modèle comportent l'estimation (par âge, mois de naissance et saison, dans le cas des deux sexes et dans chaque province) des taux d'obtention de diplômes, de décrochage scolaire, de retour à l'école et d'obtention du diplôme après un décrochage. Ces estimations ont été renforcées à l'aide de données auxiliaires tirées du Recensement de 1991 et de données administratives.

    Date de diffusion : 1999-10-22

  • Produits techniques : 11-522-X19980015027
    Description :

    La diffusion des résultats des enquêtes annuelles d'entreprise comporte immanquablement des statistiques en évolution. Comme l'univers économique est de plus en plus mouvant, une simple différence d'agrégats entre n-l et n ne suffit plus à décrire synthétiquement ce qui s'est passé. Le module de calcul d'évolution de la nouvelle génération d'EAE divise l'évolution en diverses composantes (naissances, cessations, changements de secteur), et détermine une évolution à champ constant en accordant une importance particulière aux restructurations. Les difficultés essentielles résident dans la détermination des sous-échantillons, la repondération, le recalage sur des évolutions calculables, et la prise en compte des restructurations.

    Date de diffusion : 1999-10-22

Date de modification :