Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

1 facets displayed. 0 facets selected.

Contenu

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (42)

Tout (42) (0 à 10 de 42 résultats)

  • Articles et rapports : 11-633-X2022006
    Description :

    La présente étude vise à comparer la façon dont le mode d’enquête, le contexte thématique de l’enquête et le plan d’échantillonnage contribuent à la variation des réponses aux questions semblables sur la discrimination raciale autoperçue entre les cycles de 2013, de 2014, de 2019 et de 2020 de l’Enquête sociale générale (ESG).

    Date de diffusion : 2022-08-09

  • Articles et rapports : 12-001-X202100100002
    Description :

    Nous nous penchons sur le problème du choix d’une stratégie d’échantillonnage et, tout particulièrement, d’un plan de sondage. Nous proposons une mesure du risque, dans laquelle la minimisation de la valeur oriente le choix. La méthode repose sur un modèle de superpopulation et l’incertitude entourant ses paramètres est prise en compte grâce à une distribution a priori. L’utilisation de cette méthode est illustrée au moyen d’un ensemble de données réel, qui donne des résultats satisfaisants. Comme base de référence, nous utilisons la stratégie qui couple l’estimateur par la différence à un échantillonnage avec probabilité proportionnelle à la taille, car elle est reconnue comme optimale quand le modèle de superpopulation est entièrement connu. Nous démontrons qu’y compris en cas de spécifications erronées modérées du modèle, cette stratégie n’est pas robuste et peut être surpassée par d’autres solutions.

    Date de diffusion : 2021-06-24

  • Articles et rapports : 12-001-X202000100002
    Description :

    On a besoin de méthodes par modèle pour estimer des paramètres d’intérêt de petit domaine, comme les totaux et les moyennes, là où les méthodes classiques d’estimation directe ne peuvent garantir une précision suffisante. Les modèles au niveau des unités et au niveau des domaines sont les plus répandus dans la pratique. S’il s’agit d’un modèle au niveau des unités, il est possible d’obtenir des estimateurs efficaces par modèle si le plan de sondage est tel que les modèles d’échantillon et de population coïncident, c’est-à-dire que le plan d’échantillonnage n’est pas informatif pour le modèle en question. Si en revanche le plan de sondage est informatif pour le modèle, les probabilités de sélection seront liées à la variable d’intérêt même après conditionnement par les données auxiliaires disponibles, d’où l’implication que le modèle de la population ne vaut plus pour l’échantillon. Pfeffermann et Sverchkov (2007) se sont reportés aux relations entre les distributions de population et d’échantillon de la variable étudiée pour obtenir des prédicteurs semi-paramétriques approximativement sans biais des moyennes de domaine dans des plans d’échantillonnage informatifs. La procédure qu’ils ont employée est applicable aux domaines avec et sans échantillon. Verret, Rao et Hidiroglou (2015) ont étudié d’autres méthodes utilisant une fonction appropriée des probabilités de sélection d’unités comme variable auxiliaire supplémentaire. Leur technique a donné des estimateurs Empirical Best Linear Unbiased Prediction (EBLUP) approximativement sans biais pour les moyennes de petit domaine. Dans le présent exposé, nous étendons la méthode de Verret et coll. (2015) en ne formant aucune hypothèse au sujet des probabilités d’inclusion. Nous nous contentons d’intégrer ces dernières au modèle au niveau des unités en utilisant une fonction lisse des probabilités d’inclusion. C’est une fonction que nous estimons par une approximation locale donnant un estimateur polynomial local. Nous proposons une méthode bootstrap conditionnelle pour l’estimation de l’erreur quadratique moyenne (EQM) des estimateurs polynomiaux locaux et des estimateurs EBLUP. Nous examinons par simulation le biais et les propriétés d’efficacité de l’estimateur polynomial local. Nous présentons enfin les résultats de l’estimateur bootstrap de l’EQM.

    Date de diffusion : 2020-06-30

  • Articles et rapports : 12-001-X201600214662
    Description :

    Les plans d’échantillonnage à deux phases sont souvent utilisés dans les enquêtes lorsque la base de sondage ne contient que peu d’information auxiliaire, voire aucune. Dans la présente note, nous apportons certains éclaircissements sur le concept d’invariance souvent mentionné dans le contexte des plans d’échantillonnage à deux phases. Nous définissons deux types de plans d’échantillonnage à deux phases invariants, à savoir les plans fortement invariants et les plans faiblement invariants, et donnons des exemples. Enfin, nous décrivons les implications d’une forte ou d’une faible invariance du point de vue de l’inférence.

    Date de diffusion : 2016-12-20

  • Articles et rapports : 89-648-X2016001
    Description :

    Les couplages entre les données des enquêtes et les données administratives sont une pratique de plus en plus répandue, d’une part parce qu’ils réduisent le fardeau de réponse des répondants, et d’autre part parce qu’ils permettent d’obtenir des données à un coût relativement faible. Le couplage rétrospectif, soit le couplage de données administratives des années antérieures avec celles de l’année de l’enquête, cumule ces avantages en offrant des années supplémentaires de données. Le présent document porte sur l’Étude longitudinale et internationale des adultes (ELIA), qui a été couplée avec les données fiscales rétrospectives sur les déclarations de revenus des particuliers (T1) et les données tirées des fichiers des entrepreneurs (T4), entre autres documents non cités ici. Il présente les tendances des taux de couplage rétrospectif, compare la cohérence des données administratives entre les fichiers T1 et T4, présente la possibilité d’utiliser les données pour créer des panels équilibrés et emploie les données des T1 pour produire des profils des gains en fonction de l’âge par sexe. Les résultats démontrent que le taux de couplage rétrospectif est supérieur (plus de 90 % dans la plupart des cas) et stable dans le temps chez les répondants susceptibles de produire une déclaration de revenus, et que les sources administratives des T1 et T4 montrent des revenus concordants. En outre, les données administratives de couplage de l’ELIA permettent de créer de longs panels équilibrés couvrant plus de 30 années (au moment de rédiger la présente étude).

    Date de diffusion : 2016-08-18

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014749
    Description :

    Dans le cadre du remaniement du Programme de la statistique du tourisme, Statistique Canada élabore l’Enquête nationale sur les voyages (ENV), qui recueillera de l’information relativement aux voyages effectués par les voyageurs canadiens. Cette nouvelle enquête remplacera l’actuelle Enquête sur les voyages des résidents du Canada, de même que la composante reliée aux voyages des résidents canadiens de l’Enquête sur les voyages internationaux. L’ENV tirera parti des bases de sondage communes de Statistique Canada et des outils de traitement communs, tout en maximisant l’utilisation des données administratives. Dans cette communication, on montrera comment les données administratives, comme celles provenant des fichiers de Passeport Canada, de l’Agence des services frontaliers du Canada et de l’Agence du revenu du Canada, pourraient servir à améliorer l’efficacité du plan de sondage de l’ENV.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 12-001-X201500214229
    Description :

    L’estimation autopondérée au moyen de méthodes d’échantillonnage avec probabilités égales (epsem pour equal probability selection methods) est souhaitable pour des raisons d’efficacité relativement à la variance. Habituellement, pour obtenir la propriété epsem pour des plans de sondage à deux degrés (et à une phase) en vue d’estimer des paramètres au niveau de la population, on utilise le chiffre de population de chaque unité primaire d’échantillonnage (UPE) comme mesure de taille pour la sélection des UPE, ainsi que l’attribution d’une taille d’échantillon égale aux UPE sous échantillonnage aléatoire simple (EAS) des unités élémentaires. Cependant, si l’on souhaite des estimations autopondérées pour les paramètres correspondant à de multiples domaines sous une répartition préétablie de l’échantillon entre les domaines, Folsom, Potter et Williams (1987) ont montré que l’on peut utiliser une mesure composite de taille pour sélectionner les UPE afin d’obtenir des plans epsem quand on suppose qu’outre les chiffres de population des UPE au niveau des domaines (c’est à dire la répartition de la population entre les domaines dans les UPE), les identificateurs de domaines pour les unités élémentaires sont également disponibles dans la base de sondage. Le terme depsem-A sera utilisé pour désigner ce genre de plan de sondage à deux degrés (et à une phase) pour obtenir l’estimation epsem au niveau du domaine. Folsom et coll. ont également considéré des plans d’échantillonnage à deux phases et à deux degrés quand les chiffres de population des UPE au niveau des domaines sont inconnus, mais que les dénombrements d’UPE entières sont connus. Pour ces plans (que nous désignerons depsem-B) avec les UPE sélectionnées avec probabilité proportionnelle à la mesure de taille habituelle (c’est à dire la population totale de l’UPE) au premier degré, toutes les unités élémentaires dans chaque UPE sélectionnée font d’abord l’objet d’une présélection en vue de les classer par domaine à la première phase de collecte des données, avant la sélection par EAS au deuxième degré d’échantillonnage. Des échantillons stratifiés par domaine sont ensuite sélectionnés dans les UPE en appliquant des taux d’échantillonnage de domaine choisis de manière appropriée pour que les tailles d’échantillon de domaine obtenues soient celles souhaitées et que le plan d’échantillonnage résultant soit autopondéré. Dans le présent article, nous commençons par donner une justification simple des mesures composites de taille pour le plan depsem-A et des taux d’échantillonnage de domaine pour le plan depsem-B. Puis, pour les plans depsem-A et -B, nous proposons des généralisations, premièrement aux cas pour lesquels les identificateurs de domaine pour les unités élémentaires ne sont pas disponibles dans la base de sondage et les chiffres de population des UPE au niveau des domaines ne sont connus qu’approximativement à partir d’autres sources, et deuxièmement, aux cas pour lesquels les mesures de taille des UPE sont préétablies en se basant sur d’autres considérations pratiques et souhaitables de suréchantillonnage ou de sous-échantillonnage de certains domaines. Nous présentons aussi une généralisation supplémentaire en présence de sous-échantillonnage des unités élémentaires et de non-réponse dans certaines UPE à la première phase, avant la sélection des unités élémentaires de deuxième phase dans les domaines à l’intérieur de chaque UPE sélectionnée. Cette dernière généralisation du plan depsem-B est illustrée pour un échantillon aréolaire de logements.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201400214119
    Description :

    Lorsqu’on envisage la stratification d’un échantillon en fonction de plusieurs variables, on se trouve souvent dans la situation où le nombre prévu d’unités de l’échantillon qui doivent être sélectionnées dans chaque strate est très petit et où le nombre total d’unités à sélectionner est plus petit que le nombre total de strates. Ces plans de sondage stratifiés sont représentés spécifiquement par des tableaux contenant des nombres réels, appelés problèmes de sélection contrôlée, et ne peuvent pas être résolus par les méthodes classiques de répartition. Depuis une soixantaine d’années, de nombreux algorithmes ont été examinés pour résoudre ces problèmes, à commencer par celui de Goodman et Kish (1950). Ceux qui ont été élaborés plus récemment sont particulièrement exigeants du point de vue informatique et trouvent toujours les solutions. Cependant, la question qui demeure sans réponse est celle de savoir dans quel sens les solutions d’un problème de sélection contrôlée obtenues au moyen de ces algorithmes sont optimales. Nous introduisons le concept général des solutions optimales, et nous proposons un nouvel algorithme de sélection contrôlée fondé sur des fonctions de distance type pour obtenir ces solutions. Cet algorithme peut être exécuté facilement par un nouveau logiciel basé sur SAS. La présente étude porte sur les plans de sondage avec stratification à deux dimensions. Les solutions de sélection contrôlée issues du nouvel algorithme sont comparées à celles obtenues au moyen des algorithmes existants, en se fondant sur plusieurs exemples. Le nouvel algorithme arrive à fournir des solutions robustes aux problèmes de sélection contrôlée à deux dimensions qui satisfont aux critères d’optimalité.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 11-522-X201300014276
    Description :

    En France, les contraintes budgétaires rendent plus difficile l’embauche d’enquêteurs occasionnels pour prendre en compte des problèmes de collecte. Il devient donc nécessaire de respecter une quotité de travail annuelle préalablement fixée. Pour les enquêtes Insee, réalisées à partir d’un échantillon maître, les difficultés apparaissent lors de l’absence prolongée d’un enquêteur sur l’ensemble de la durée de la collecte d’une enquête. En effet, dans ces conditions une partie du territoire peut devenir non couverte par l’enquête, ce qui génère de fait un biais. Afin de répondre à cette nouvelle difficulté, deux méthodes ont été mises en oeuvre en fonction du moment où le problème est diagnostiqué. Si l’ « abandon » de zone intervient avant ou juste au début de la collecte, une procédure dite de « sous-allocation » est mise en oeuvre. Elle consiste à interroger un minimum de ménages dans chaque zone de collecte au détriment d’autres zones pour lesquelles aucun problème de collecte n’est a priori diagnostiqué. Il s’agit donc de minimiser la dispersion des poids sous contrainte de respect de la charge de collecte. Si l’ « abandon » de zone intervient en cours de collecte, une priorisation des enquêtes restantes est mise en oeuvre. Elle se base sur le R-indicateur (indicateur de Représentativité) qui permet de mesurer le degré de similarité d’un échantillon par rapport à la population de base. L’objectif de cette priorisation en cours de collecte est de s’approcher le plus possible au final d’une équi-probabilité de réponse des répondants. Il est basé sur la dispersion des probabilités de réponse estimées des ménages échantillonnés, et se décline en R-indicateurs partiels mesurant cette représentativité variable par variable. Ces R-indicateurs sont des outils permettant d’analyser la collecte en isolant des groupes de populations sous-représentées. Il est possible d’intensifier les efforts de collecte sur les groupes précédemment identifiés. Lors de la présentation orale, les deux points avaient été évoqués succinctement. Toutefois, cet article ne traite que du premier point évoqué ci-dessus, à savoir la « sous-allocation ». La priorisation est en cours de mise en oeuvre pour la première fois à l’Insee pour l’enquête Patrimoine et elle donnera lieu à un article spécifique qui sera rédigé par A. Rebecq.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 12-001-X201200111682
    Description :

    Les questions concernant la répartition de l'échantillon sont étudiées dans le contexte de l'estimation des moyennes de sous-population (strate ou domaine), ainsi que de la moyenne de population agrégée sous-échantillonnage aléatoire simple stratifié. Une méthode de programmation non linéaire est utilisée pour obtenir la répartition « optimale » de l'échantillon entre les strates qui minimise la taille totale d'échantillon sous la contrainte des tolérances spécifiées pour les coefficients de variation des estimateurs des moyennes de strate et de la moyenne de population. La taille totale d'échantillon résultante est alors utilisée pour déterminer les répartitions de l'échantillon par les méthodes de Costa, Satorra et Ventura (2004) s'appuyant sur une répartition intermédiaire ou de compromis et de Longford (2006) fondée sur des « priorités inférencielles » spécifiées. En outre, nous étudions la répartition de l'échantillon entre les strates quand sont également spécifiées des exigences de fiabilité pour des domaines qui recoupent les strates. Les propriétés des trois méthodes sont étudiées au moyen de données provenant de l'Enquête mensuelle sur le commerce de détail (EMCD) menée par Statistique Canada auprès d'établissements uniques.

    Date de diffusion : 2012-06-27
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (35)

Analyses (35) (0 à 10 de 35 résultats)

  • Articles et rapports : 11-633-X2022006
    Description :

    La présente étude vise à comparer la façon dont le mode d’enquête, le contexte thématique de l’enquête et le plan d’échantillonnage contribuent à la variation des réponses aux questions semblables sur la discrimination raciale autoperçue entre les cycles de 2013, de 2014, de 2019 et de 2020 de l’Enquête sociale générale (ESG).

    Date de diffusion : 2022-08-09

  • Articles et rapports : 12-001-X202100100002
    Description :

    Nous nous penchons sur le problème du choix d’une stratégie d’échantillonnage et, tout particulièrement, d’un plan de sondage. Nous proposons une mesure du risque, dans laquelle la minimisation de la valeur oriente le choix. La méthode repose sur un modèle de superpopulation et l’incertitude entourant ses paramètres est prise en compte grâce à une distribution a priori. L’utilisation de cette méthode est illustrée au moyen d’un ensemble de données réel, qui donne des résultats satisfaisants. Comme base de référence, nous utilisons la stratégie qui couple l’estimateur par la différence à un échantillonnage avec probabilité proportionnelle à la taille, car elle est reconnue comme optimale quand le modèle de superpopulation est entièrement connu. Nous démontrons qu’y compris en cas de spécifications erronées modérées du modèle, cette stratégie n’est pas robuste et peut être surpassée par d’autres solutions.

    Date de diffusion : 2021-06-24

  • Articles et rapports : 12-001-X202000100002
    Description :

    On a besoin de méthodes par modèle pour estimer des paramètres d’intérêt de petit domaine, comme les totaux et les moyennes, là où les méthodes classiques d’estimation directe ne peuvent garantir une précision suffisante. Les modèles au niveau des unités et au niveau des domaines sont les plus répandus dans la pratique. S’il s’agit d’un modèle au niveau des unités, il est possible d’obtenir des estimateurs efficaces par modèle si le plan de sondage est tel que les modèles d’échantillon et de population coïncident, c’est-à-dire que le plan d’échantillonnage n’est pas informatif pour le modèle en question. Si en revanche le plan de sondage est informatif pour le modèle, les probabilités de sélection seront liées à la variable d’intérêt même après conditionnement par les données auxiliaires disponibles, d’où l’implication que le modèle de la population ne vaut plus pour l’échantillon. Pfeffermann et Sverchkov (2007) se sont reportés aux relations entre les distributions de population et d’échantillon de la variable étudiée pour obtenir des prédicteurs semi-paramétriques approximativement sans biais des moyennes de domaine dans des plans d’échantillonnage informatifs. La procédure qu’ils ont employée est applicable aux domaines avec et sans échantillon. Verret, Rao et Hidiroglou (2015) ont étudié d’autres méthodes utilisant une fonction appropriée des probabilités de sélection d’unités comme variable auxiliaire supplémentaire. Leur technique a donné des estimateurs Empirical Best Linear Unbiased Prediction (EBLUP) approximativement sans biais pour les moyennes de petit domaine. Dans le présent exposé, nous étendons la méthode de Verret et coll. (2015) en ne formant aucune hypothèse au sujet des probabilités d’inclusion. Nous nous contentons d’intégrer ces dernières au modèle au niveau des unités en utilisant une fonction lisse des probabilités d’inclusion. C’est une fonction que nous estimons par une approximation locale donnant un estimateur polynomial local. Nous proposons une méthode bootstrap conditionnelle pour l’estimation de l’erreur quadratique moyenne (EQM) des estimateurs polynomiaux locaux et des estimateurs EBLUP. Nous examinons par simulation le biais et les propriétés d’efficacité de l’estimateur polynomial local. Nous présentons enfin les résultats de l’estimateur bootstrap de l’EQM.

    Date de diffusion : 2020-06-30

  • Articles et rapports : 12-001-X201600214662
    Description :

    Les plans d’échantillonnage à deux phases sont souvent utilisés dans les enquêtes lorsque la base de sondage ne contient que peu d’information auxiliaire, voire aucune. Dans la présente note, nous apportons certains éclaircissements sur le concept d’invariance souvent mentionné dans le contexte des plans d’échantillonnage à deux phases. Nous définissons deux types de plans d’échantillonnage à deux phases invariants, à savoir les plans fortement invariants et les plans faiblement invariants, et donnons des exemples. Enfin, nous décrivons les implications d’une forte ou d’une faible invariance du point de vue de l’inférence.

    Date de diffusion : 2016-12-20

  • Articles et rapports : 89-648-X2016001
    Description :

    Les couplages entre les données des enquêtes et les données administratives sont une pratique de plus en plus répandue, d’une part parce qu’ils réduisent le fardeau de réponse des répondants, et d’autre part parce qu’ils permettent d’obtenir des données à un coût relativement faible. Le couplage rétrospectif, soit le couplage de données administratives des années antérieures avec celles de l’année de l’enquête, cumule ces avantages en offrant des années supplémentaires de données. Le présent document porte sur l’Étude longitudinale et internationale des adultes (ELIA), qui a été couplée avec les données fiscales rétrospectives sur les déclarations de revenus des particuliers (T1) et les données tirées des fichiers des entrepreneurs (T4), entre autres documents non cités ici. Il présente les tendances des taux de couplage rétrospectif, compare la cohérence des données administratives entre les fichiers T1 et T4, présente la possibilité d’utiliser les données pour créer des panels équilibrés et emploie les données des T1 pour produire des profils des gains en fonction de l’âge par sexe. Les résultats démontrent que le taux de couplage rétrospectif est supérieur (plus de 90 % dans la plupart des cas) et stable dans le temps chez les répondants susceptibles de produire une déclaration de revenus, et que les sources administratives des T1 et T4 montrent des revenus concordants. En outre, les données administratives de couplage de l’ELIA permettent de créer de longs panels équilibrés couvrant plus de 30 années (au moment de rédiger la présente étude).

    Date de diffusion : 2016-08-18

  • Articles et rapports : 12-001-X201500214229
    Description :

    L’estimation autopondérée au moyen de méthodes d’échantillonnage avec probabilités égales (epsem pour equal probability selection methods) est souhaitable pour des raisons d’efficacité relativement à la variance. Habituellement, pour obtenir la propriété epsem pour des plans de sondage à deux degrés (et à une phase) en vue d’estimer des paramètres au niveau de la population, on utilise le chiffre de population de chaque unité primaire d’échantillonnage (UPE) comme mesure de taille pour la sélection des UPE, ainsi que l’attribution d’une taille d’échantillon égale aux UPE sous échantillonnage aléatoire simple (EAS) des unités élémentaires. Cependant, si l’on souhaite des estimations autopondérées pour les paramètres correspondant à de multiples domaines sous une répartition préétablie de l’échantillon entre les domaines, Folsom, Potter et Williams (1987) ont montré que l’on peut utiliser une mesure composite de taille pour sélectionner les UPE afin d’obtenir des plans epsem quand on suppose qu’outre les chiffres de population des UPE au niveau des domaines (c’est à dire la répartition de la population entre les domaines dans les UPE), les identificateurs de domaines pour les unités élémentaires sont également disponibles dans la base de sondage. Le terme depsem-A sera utilisé pour désigner ce genre de plan de sondage à deux degrés (et à une phase) pour obtenir l’estimation epsem au niveau du domaine. Folsom et coll. ont également considéré des plans d’échantillonnage à deux phases et à deux degrés quand les chiffres de population des UPE au niveau des domaines sont inconnus, mais que les dénombrements d’UPE entières sont connus. Pour ces plans (que nous désignerons depsem-B) avec les UPE sélectionnées avec probabilité proportionnelle à la mesure de taille habituelle (c’est à dire la population totale de l’UPE) au premier degré, toutes les unités élémentaires dans chaque UPE sélectionnée font d’abord l’objet d’une présélection en vue de les classer par domaine à la première phase de collecte des données, avant la sélection par EAS au deuxième degré d’échantillonnage. Des échantillons stratifiés par domaine sont ensuite sélectionnés dans les UPE en appliquant des taux d’échantillonnage de domaine choisis de manière appropriée pour que les tailles d’échantillon de domaine obtenues soient celles souhaitées et que le plan d’échantillonnage résultant soit autopondéré. Dans le présent article, nous commençons par donner une justification simple des mesures composites de taille pour le plan depsem-A et des taux d’échantillonnage de domaine pour le plan depsem-B. Puis, pour les plans depsem-A et -B, nous proposons des généralisations, premièrement aux cas pour lesquels les identificateurs de domaine pour les unités élémentaires ne sont pas disponibles dans la base de sondage et les chiffres de population des UPE au niveau des domaines ne sont connus qu’approximativement à partir d’autres sources, et deuxièmement, aux cas pour lesquels les mesures de taille des UPE sont préétablies en se basant sur d’autres considérations pratiques et souhaitables de suréchantillonnage ou de sous-échantillonnage de certains domaines. Nous présentons aussi une généralisation supplémentaire en présence de sous-échantillonnage des unités élémentaires et de non-réponse dans certaines UPE à la première phase, avant la sélection des unités élémentaires de deuxième phase dans les domaines à l’intérieur de chaque UPE sélectionnée. Cette dernière généralisation du plan depsem-B est illustrée pour un échantillon aréolaire de logements.

    Date de diffusion : 2015-12-17

  • Articles et rapports : 12-001-X201400214119
    Description :

    Lorsqu’on envisage la stratification d’un échantillon en fonction de plusieurs variables, on se trouve souvent dans la situation où le nombre prévu d’unités de l’échantillon qui doivent être sélectionnées dans chaque strate est très petit et où le nombre total d’unités à sélectionner est plus petit que le nombre total de strates. Ces plans de sondage stratifiés sont représentés spécifiquement par des tableaux contenant des nombres réels, appelés problèmes de sélection contrôlée, et ne peuvent pas être résolus par les méthodes classiques de répartition. Depuis une soixantaine d’années, de nombreux algorithmes ont été examinés pour résoudre ces problèmes, à commencer par celui de Goodman et Kish (1950). Ceux qui ont été élaborés plus récemment sont particulièrement exigeants du point de vue informatique et trouvent toujours les solutions. Cependant, la question qui demeure sans réponse est celle de savoir dans quel sens les solutions d’un problème de sélection contrôlée obtenues au moyen de ces algorithmes sont optimales. Nous introduisons le concept général des solutions optimales, et nous proposons un nouvel algorithme de sélection contrôlée fondé sur des fonctions de distance type pour obtenir ces solutions. Cet algorithme peut être exécuté facilement par un nouveau logiciel basé sur SAS. La présente étude porte sur les plans de sondage avec stratification à deux dimensions. Les solutions de sélection contrôlée issues du nouvel algorithme sont comparées à celles obtenues au moyen des algorithmes existants, en se fondant sur plusieurs exemples. Le nouvel algorithme arrive à fournir des solutions robustes aux problèmes de sélection contrôlée à deux dimensions qui satisfont aux critères d’optimalité.

    Date de diffusion : 2014-12-19

  • Articles et rapports : 11-522-X201300014276
    Description :

    En France, les contraintes budgétaires rendent plus difficile l’embauche d’enquêteurs occasionnels pour prendre en compte des problèmes de collecte. Il devient donc nécessaire de respecter une quotité de travail annuelle préalablement fixée. Pour les enquêtes Insee, réalisées à partir d’un échantillon maître, les difficultés apparaissent lors de l’absence prolongée d’un enquêteur sur l’ensemble de la durée de la collecte d’une enquête. En effet, dans ces conditions une partie du territoire peut devenir non couverte par l’enquête, ce qui génère de fait un biais. Afin de répondre à cette nouvelle difficulté, deux méthodes ont été mises en oeuvre en fonction du moment où le problème est diagnostiqué. Si l’ « abandon » de zone intervient avant ou juste au début de la collecte, une procédure dite de « sous-allocation » est mise en oeuvre. Elle consiste à interroger un minimum de ménages dans chaque zone de collecte au détriment d’autres zones pour lesquelles aucun problème de collecte n’est a priori diagnostiqué. Il s’agit donc de minimiser la dispersion des poids sous contrainte de respect de la charge de collecte. Si l’ « abandon » de zone intervient en cours de collecte, une priorisation des enquêtes restantes est mise en oeuvre. Elle se base sur le R-indicateur (indicateur de Représentativité) qui permet de mesurer le degré de similarité d’un échantillon par rapport à la population de base. L’objectif de cette priorisation en cours de collecte est de s’approcher le plus possible au final d’une équi-probabilité de réponse des répondants. Il est basé sur la dispersion des probabilités de réponse estimées des ménages échantillonnés, et se décline en R-indicateurs partiels mesurant cette représentativité variable par variable. Ces R-indicateurs sont des outils permettant d’analyser la collecte en isolant des groupes de populations sous-représentées. Il est possible d’intensifier les efforts de collecte sur les groupes précédemment identifiés. Lors de la présentation orale, les deux points avaient été évoqués succinctement. Toutefois, cet article ne traite que du premier point évoqué ci-dessus, à savoir la « sous-allocation ». La priorisation est en cours de mise en oeuvre pour la première fois à l’Insee pour l’enquête Patrimoine et elle donnera lieu à un article spécifique qui sera rédigé par A. Rebecq.

    Date de diffusion : 2014-10-31

  • Articles et rapports : 12-001-X201200111682
    Description :

    Les questions concernant la répartition de l'échantillon sont étudiées dans le contexte de l'estimation des moyennes de sous-population (strate ou domaine), ainsi que de la moyenne de population agrégée sous-échantillonnage aléatoire simple stratifié. Une méthode de programmation non linéaire est utilisée pour obtenir la répartition « optimale » de l'échantillon entre les strates qui minimise la taille totale d'échantillon sous la contrainte des tolérances spécifiées pour les coefficients de variation des estimateurs des moyennes de strate et de la moyenne de population. La taille totale d'échantillon résultante est alors utilisée pour déterminer les répartitions de l'échantillon par les méthodes de Costa, Satorra et Ventura (2004) s'appuyant sur une répartition intermédiaire ou de compromis et de Longford (2006) fondée sur des « priorités inférencielles » spécifiées. En outre, nous étudions la répartition de l'échantillon entre les strates quand sont également spécifiées des exigences de fiabilité pour des domaines qui recoupent les strates. Les propriétés des trois méthodes sont étudiées au moyen de données provenant de l'Enquête mensuelle sur le commerce de détail (EMCD) menée par Statistique Canada auprès d'établissements uniques.

    Date de diffusion : 2012-06-27

  • Articles et rapports : 89-648-X2011001
    Géographie : Canada
    Description :

    En janvier 2006, un congrès sur les enquêtes longitudinales organisé par Statistique Canada, le Conseil de recherches en sciences humaines du Canada (CRSH) et les Instituts de recherche en santé du Canada (IRSC) a permis de conclure que le Canada n'a pas d'enquête longitudinale lui permettant de recueillir des renseignements sur de multiples sujets tels que la famille, le capital humain, la santé de la main-d'oeuvre et le suivi des répondants pour une longue période dans le temps. Suite à ce congrès, du financement provenant du Fonds du Groupe de données pour la recherche sur les politiques (GDRP) a été accordé afin de soutenir l'enquête pilote pour la nouvelle Enquête par panel auprès des ménages canadiens (EPMC-Pilote). Des consultations concernant le plan et le contenu ont eu lieu avec des experts universitaires et politiques en 2007 et 2008, et une enquête pilote a été menée à l'automne 2008. Les objectifs de l'enquête pilote étaient 1) de soumettre un questionnaire à un test, évaluer la longueur de l'interview et examiner la qualité des données; 2) d'évaluer plusieurs caractéristiques du plan; et 3) de vérifier la réaction des répondants et des interviewers sur le terrain à propos de l'enquête. L'enquête pilote a été menée avec un taux de réponse de 76 %, et un temps d'entrevue moyen de 64 minutes par ménages. Plusieurs innovations dans les caractéristiques du plan ont été évaluées, et se sont avérées viables. La réponse à l'enquête provenant des répondants ou des interviewers a été positive. Cet article met en évidence ces résultats ainsi que d'autres résultats tirés de l'EPMC-Pilote.

    Date de diffusion : 2011-09-14
Références (7)

Références (7) ((7 résultats))

  • Enquêtes et programmes statistiques — Documentation : 11-522-X201700014749
    Description :

    Dans le cadre du remaniement du Programme de la statistique du tourisme, Statistique Canada élabore l’Enquête nationale sur les voyages (ENV), qui recueillera de l’information relativement aux voyages effectués par les voyageurs canadiens. Cette nouvelle enquête remplacera l’actuelle Enquête sur les voyages des résidents du Canada, de même que la composante reliée aux voyages des résidents canadiens de l’Enquête sur les voyages internationaux. L’ENV tirera parti des bases de sondage communes de Statistique Canada et des outils de traitement communs, tout en maximisant l’utilisation des données administratives. Dans cette communication, on montrera comment les données administratives, comme celles provenant des fichiers de Passeport Canada, de l’Agence des services frontaliers du Canada et de l’Agence du revenu du Canada, pourraient servir à améliorer l’efficacité du plan de sondage de l’ENV.

    Date de diffusion : 2016-03-24

  • Enquêtes et programmes statistiques — Documentation : 75F0002M1992007
    Description :

    L'interview préliminaire sera menée auprès du premier panel de l'EDTR, en janvier 1993, en guise de supplément à l'Enquête sur la population active. Le premier panel est formé d'environ 20 000 ménages, soit ceux qui terminent leur période de six mois dans l'échantillon de l'Enquête sur la population active, en janvier ou en février 1993. Le présent document vise à décrire l'objet de l'interview préliminair e de l'EDTR et les questions qui doivent être posées.

    Date de diffusion : 2008-02-29

  • Enquêtes et programmes statistiques — Documentation : 75F0002M2004006
    Description :

    Dans ce document, on présente les données se rapportant à la partie entrées-sorties des interviews annuels sur le travail et le revenu de l'Enquête sur la dynamique du travail et du revenu (EDTR).

    Date de diffusion : 2004-06-21

  • Enquêtes et programmes statistiques — Documentation : 81-595-M2003009
    Géographie : Canada
    Description :

    Dans ce rapport, on examine l'utilisation de l'Enquête sur l'éducation et sur la formation des adultes (EEFA) au Canada en tant qu'outil permettant d'analyser la participation des adultes aux activités d'éducation et de formation ainsi que l'incidence de ces activités sur ces personnes.

    Date de diffusion : 2003-10-15

  • Enquêtes et programmes statistiques — Documentation : 11-522-X20010016293
    Description :

    Cette publication comporte une description détaillée des questions techniques entourant la conception et la réalisation d'enquêtes, et s'adresse à des méthodologistes.

    Le présent article décrit le Projet régional des indicateurs de l'éducation (PRIE) du deuxième Sommet des Amériques dont l'objectif fondamental est d'élaborer un ensemble d'indicateurs comparables pour les pays des Amériques. Le projet, qui est dirigé par le ministère de l'Éducation du Chili, a été mis sur pied pour répondre aux besoins qu'ont les pays concernés d'améliorer leur système d'information et leurs statistiques, et de créer des indicateurs fiables et pertinents pour appuyer les décisions dans le domaine de l'éducation, à l'échelle de leur pays et de la région des Amériques dans son ensemble. Dans la première partie de l'article, nous analysons le rôle important des statistiques et des indicateurs dans le soutien des politiques et des programmes d'éducation, et nous décrivons la situation des pays en ce qui concerne les systèmes d'information et de statistique. Nous discutons aussi des grands problèmes qui doivent être résolus et passons en revue les enseignements tirés de la participation des pays à d'autres projets ou programmes d'indicateurs de l'éducation, comme le programme INES (Indicateurs des systèmes nationaux d'enseignement), le projet IFE (Initiative pour les femmes entrepreneurs), le projet du MERCOSUR (Marché commun du Sud) et le CREMIS (Gestion régionale éducative des systèmes d'information des Caraïbes). Dans la deuxième partie de l'article, nous examinons les objectifs et la mise en oeuvre du programme de coopération technique du PRIE. Par ailleurs, nous mettons l'accent sur la façon dont cette coopération technique répond aux besoins des pays concernés et les aide à combler les lacunes quant à la disponibilité et à la fiabilité des données.

    Date de diffusion : 2002-09-12

  • Enquêtes et programmes statistiques — Documentation : 75F0002M2000012
    Description :

    Dans ce document, on présente les renseignements de la nouvelle composante Entrée-sortie de l'interview sur le revenu de l'Enquête sur la dynamique du travail et du revenu (EDTR).

    Date de diffusion : 2001-03-27

  • Enquêtes et programmes statistiques — Documentation : 11-522-X19980015030
    Description :

    Les plans d'échantillonnage à deux phases sont utilisés dans le cadre d'études à plusieurs cycles, pour estimer l'incidence de maladies rares, comme la démence. Cependant, les estimations de l'incidence établies à partir d'une étude longitudinale sur la démence doivent être corrigées comme il se doit, pour tenir compte des données manquantes dues aux décès et du plan d'échantillonnage utilisé à chaque cycle de l'étude. Dans cet article, nous proposons une approche basée sur un modèle de sélection pour la modélisation des données manquantes dues aux décès et nous utilisons une méthode de vraisemblance pour estimer l'incidence. Un algorithme EM modifié est également utilisé pour tenir compte des données manquantes dues à l'échantillonnage. L'estimateur non paramétrique de la variance obtenu par la méthode du jackknife est utilisé pour estimer la variance des paramètres du modèle et des estimations de l'incidence. Les méthodes proposées ici sont appliquées aux données tirées de l'étude sur la démence d'Indianapolis et d'Ibadan.

    Date de diffusion : 1999-10-22
Date de modification :