Analyse des données

Filtrer les résultats par

Aide à la recherche
Currently selected filters that can be removed

Mot(s)-clé(s)

Géographie

1 facets displayed. 0 facets selected.
Aide à l'ordre
entrées

Résultats

Tout (28)

Tout (28) (0 à 10 de 28 résultats)

  • Stats en bref : 11-627-M2022016
    Description :

    Cette infographie explique les étapes de la collecte des données pour toutes les enquêtes de Statistique Canada sur les ménages et les entreprises. Les réponses sont compilées, analysées et utilisées pour prendre des décisions importantes et sont gardées strictement confidentielles.

    Date de diffusion : 2022-02-28

  • Articles et rapports : 11-522-X202100100009
    Description :

    Le recours à des données auxiliaires pour améliorer l’efficacité d’estimateurs de totaux et de moyennes au moyen d’une procédure d’estimation d’enquête assistée par un modèle de régression a reçu une attention considérable ces dernières années. Des estimateurs par la régression généralisée (GREG), fondés sur un modèle de régression linéaire, sont actuellement utilisés dans le cadre d’enquêtes auprès d’établissements, à Statistique Canada et au sein de plusieurs autres organismes de statistiques. Les estimateurs GREG utilisent des poids d’enquête communs à toutes les variables d’étude et un calage aux totaux de population de variables auxiliaires. De plus en plus de variables auxiliaires sont disponibles et certaines peuvent être superflues. Cela mène à des poids GREG instables lorsque toutes les variables auxiliaires disponibles, y compris les interactions parmi les variables catégoriques, sont utilisées dans le modèle de régression linéaire. En revanche, de nouvelles méthodes d’apprentissage automatique, comme les arbres de régression et la méthode LASSO, sélectionnent automatiquement des variables auxiliaires significatives et mènent à des poids non négatifs stables et à d’éventuels gains d’efficacité par rapport à la méthode GREG. Dans cet article, une étude par simulations, fondée sur un ensemble de données-échantillon d’une enquête-entreprise réelle traité comme la population cible, est menée afin d’examiner le rendement relatif de la méthode GREG, d’arbres de régression et de la méthode LASSO sur le plan de l’efficacité des estimateurs.

    Mots-clés : inférence assistée par modèle; estimation par calage; sélection du modèle; estimateur par la régression généralisée.

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-522-X202100100018
    Description : Le Centre des statistiques finlandais a commencé à publier des prévisions immédiates de l’indicateur de tendance de la production ou TIO (pour Trend Indicator of Output), l’indicateur mensuel de l’activité économique réelle, afin de répondre aux besoins des utilisateurs pendant la pandémie de COVID-19. Cet indicateur a été d’abord publié en avril 2020, au tout début de la pandémie en Finlande, et a depuis été publié chaque mois jusqu’en juin 2021. Les prévisions immédiates de l’indicateur TIO sont élaborées à l’aide de données de sources ouverte relatives aux volumes de circulation de camions à environ 100 points de mesure automatiques dans la région de Helsinki/Uusimaa ainsi qu’à l’aide de l’indicateur du climat économique pour la Finlande. L’estimation est effectuée à l’aide d’une approche d’apprentissage automatique et la méthodologie se fonde sur le travail réalisé antérieurement par le Centre des statistiques finlandais et ETLA Economic Research.

    Mots clés : prévisions immédiates; estimations rapides; apprentissage automatique; statistiques expérimentales.

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-633-X2018017
    Description :

    Afin de concevoir des politiques visant à promouvoir l’égalité entre les sexes en matière de leadership, l’autonomisation économique des femmes et la croissance inclusive, il est important de bien comprendre la propriété d’entreprises par des femmes ainsi que le rendement des entreprises appartenant à des femmes. Cependant, l’information sur la propriété d’entreprises selon le sexe demeure rare, en raison du manque de données exhaustives. L’étude Entreprises appartenant à des femmes au Canada (Grekou, Li et Liu, 2018), comble ce manque de données en distinguant les propriétaires d’entreprises selon leur sexe à l’aide d’un nouvel ensemble de données administratives appelé la Base de données canadienne sur la dynamique employeurs-employés. Cet ensemble de données contient des renseignements sur les propriétaires d’entreprises pour toutes les entreprises non constituées en société et les sociétés privées au Canada. Le présent document porte sur la méthodologie adoptée pour établir la structure de la propriété d’entreprises selon le sexe. Il présente ensuite des estimations de la propriété d’entreprises selon le sexe (propriétaires majoritairement masculins ou féminins et propriété à parts égales). Enfin, il analyse la sensibilité de ces estimations et les compare à celles calculées à l’aide d’autres sources de données.

    Date de diffusion : 2018-09-24

  • Articles et rapports : 12-001-X201700114822
    Description :

    Nous utilisons une méthode bayésienne pour inférer sur une proportion dans une population finie quand des données binaires sont recueillies selon un plan d’échantillonnage double sur des petits domaines. Le plan d’échantillonnage double correspond à un plan d’échantillonnage en grappes à deux degrés dans chaque domaine. Un modèle bayésien hiérarchique établi antérieurement suppose que, pour chaque domaine, les réponses binaires de premier degré suivent des lois de Bernoulli indépendantes et que les probabilités suivent des lois bêta paramétrisées par une moyenne et un coefficient de corrélation. La moyenne varie selon le domaine, tandis que la corrélation est la même dans tous les domaines. En vue d’accroître la flexibilité de ce modèle, nous l’avons étendu afin de permettre aux corrélations de varier. Les moyennes et les corrélations suivent des lois bêta indépendantes. Nous donnons à l’ancien modèle le nom de modèle homogène et au nouveau, celui de modèle hétérogène. Tous les hyperparamètres possèdent des distributions a priori non informatives appropriées. Une complication supplémentaire tient au fait que certains paramètres sont faiblement identifiés, ce qui rend difficile l’utilisation d’un échantillonneur de Gibbs classique pour les calculs. Donc, nous avons imposé des contraintes unimodales sur les distributions bêta a priori et utilisé un échantillonneur de Gibbs par blocs pour effectuer les calculs. Nous avons comparé les modèles hétérogène et homogène au moyen d’un exemple et d’une étude en simulation. Comme il fallait s’y attendre, le modèle double avec corrélations hétérogènes est celui qui est privilégié.

    Date de diffusion : 2017-06-22

  • Enquêtes et programmes statistiques — Documentation : 91F0015M2016012
    Description :

    Le présent article renferme de l’information pertinente à l’utilisation des variables relatives à la famille dans les fichiers de microdonnées du Recensement de la population du Canada. Ces fichiers se trouvent à Statistique Canada même, dans les centres de données de recherche (CDR) ou sous forme de fichiers de microdonnées à grande diffusion (FMGD). L’article explique certains des aspects techniques des trois versions, y compris la création de variables multiniveau à des fins analytiques.

    Date de diffusion : 2016-12-22

  • Articles et rapports : 11-633-X2016004
    Description :

    Pour comprendre l’importance du processus dynamique d’entrée dans l’économie canadienne, il faut mesurer le nombre et l’importance des entrées des entreprises. Le document porte sur l’estimation de l’importance de l’entrée des entreprises au Canada au moyen de la base de données qui sous-tend le Programme d’analyse longitudinale de l’emploi (PALE), qui sert à produire des mesures de l’entrée et de la sortie des entreprises depuis 1988. On y présente la méthodologie employée pour estimer l’entrée et la sortie, les problèmes qu’il a fallu résoudre et les raisons qui expliquent les solutions retenues. Sont ensuite exposées les mesures dérivées du PALE. Enfin, les auteurs proposent une analyse de la sensibilité des estimations fondées sur le PALE à différentes méthodes d’estimation de l’entrée et de la sortie.

    Date de diffusion : 2016-11-10

  • Articles et rapports : 11-633-X2016003
    Description :

    De grandes cohortes de mortalité nationales sont utilisées pour estimer les taux de mortalité en fonction de différents groupes socioéconomiques et démographiques ainsi que pour effectuer des recherches dans le domaine de la santé environnementale. En 2008, Statistique Canada a créé une cohorte en couplant les données du Recensement de 1991 avec des données sur la mortalité. La présente étude décrit le couplage des données des répondants au questionnaire détaillé du Recensement de 2001 âgés de 19 ans et plus avec les données du Fichier maître des particuliers T1 et la Base de données combinées sur la mortalité. Ce couplage permet de faire le suivi de tous les décès survenus sur une période de 10,6 ans (soit pour le moment jusqu’à la fin de 2011).

    Date de diffusion : 2016-10-26

  • Articles et rapports : 11-522-X201700014756
    Description :

    Comment pouvons-nous regrouper des données multidimensionnelles sur le rendement du système de santé de façon simple, afin qu’il soit facile d’y accéder et de fournir des renseignements comparables et exploitables pour accélérer les améliorations des soins de santé? L’Institut canadien d’information sur la santé a élaboré un ensemble d’outils pour répondre aux besoins de divers auditoires en matière de mesures de rendement, déterminer les priorités au chapitre des améliorations, comprendre comment les régions et les établissements se comparent les uns aux autres, et appuyer la transparence et la reddition de comptes. Les outils pancanadiens de [Votre système de santé (VSS)] consolident les rapports de 45 indicateurs clés du rendement de façon structurée, et sont comparables au fil du temps et à divers niveaux géographiques. Le présent document rend compte de l’élaboration et des approches et considérations méthodologiques qui ont servi à créer un outil dynamique qui facilite l’étalonnage et les comparaisons significatives pour l’amélioration du rendement du système de santé.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 82-003-X201500614196
    Description :

    La présente étude examine la faisabilité et la validité de l’utilisation des numéros d’assurance-maladie personnels pour coupler de façon déterministe le Registre canadien du cancer la Base de données sur les congés des patients, afin d’obtenir des données sur les hospitalisations des personnes atteintes d’un cancer primaire.

    Date de diffusion : 2015-06-17
Données (0)

Données (0) (0 résultat)

Aucun contenu disponible actuellement

Analyses (26)

Analyses (26) (0 à 10 de 26 résultats)

  • Stats en bref : 11-627-M2022016
    Description :

    Cette infographie explique les étapes de la collecte des données pour toutes les enquêtes de Statistique Canada sur les ménages et les entreprises. Les réponses sont compilées, analysées et utilisées pour prendre des décisions importantes et sont gardées strictement confidentielles.

    Date de diffusion : 2022-02-28

  • Articles et rapports : 11-522-X202100100009
    Description :

    Le recours à des données auxiliaires pour améliorer l’efficacité d’estimateurs de totaux et de moyennes au moyen d’une procédure d’estimation d’enquête assistée par un modèle de régression a reçu une attention considérable ces dernières années. Des estimateurs par la régression généralisée (GREG), fondés sur un modèle de régression linéaire, sont actuellement utilisés dans le cadre d’enquêtes auprès d’établissements, à Statistique Canada et au sein de plusieurs autres organismes de statistiques. Les estimateurs GREG utilisent des poids d’enquête communs à toutes les variables d’étude et un calage aux totaux de population de variables auxiliaires. De plus en plus de variables auxiliaires sont disponibles et certaines peuvent être superflues. Cela mène à des poids GREG instables lorsque toutes les variables auxiliaires disponibles, y compris les interactions parmi les variables catégoriques, sont utilisées dans le modèle de régression linéaire. En revanche, de nouvelles méthodes d’apprentissage automatique, comme les arbres de régression et la méthode LASSO, sélectionnent automatiquement des variables auxiliaires significatives et mènent à des poids non négatifs stables et à d’éventuels gains d’efficacité par rapport à la méthode GREG. Dans cet article, une étude par simulations, fondée sur un ensemble de données-échantillon d’une enquête-entreprise réelle traité comme la population cible, est menée afin d’examiner le rendement relatif de la méthode GREG, d’arbres de régression et de la méthode LASSO sur le plan de l’efficacité des estimateurs.

    Mots-clés : inférence assistée par modèle; estimation par calage; sélection du modèle; estimateur par la régression généralisée.

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-522-X202100100018
    Description : Le Centre des statistiques finlandais a commencé à publier des prévisions immédiates de l’indicateur de tendance de la production ou TIO (pour Trend Indicator of Output), l’indicateur mensuel de l’activité économique réelle, afin de répondre aux besoins des utilisateurs pendant la pandémie de COVID-19. Cet indicateur a été d’abord publié en avril 2020, au tout début de la pandémie en Finlande, et a depuis été publié chaque mois jusqu’en juin 2021. Les prévisions immédiates de l’indicateur TIO sont élaborées à l’aide de données de sources ouverte relatives aux volumes de circulation de camions à environ 100 points de mesure automatiques dans la région de Helsinki/Uusimaa ainsi qu’à l’aide de l’indicateur du climat économique pour la Finlande. L’estimation est effectuée à l’aide d’une approche d’apprentissage automatique et la méthodologie se fonde sur le travail réalisé antérieurement par le Centre des statistiques finlandais et ETLA Economic Research.

    Mots clés : prévisions immédiates; estimations rapides; apprentissage automatique; statistiques expérimentales.

    Date de diffusion : 2021-10-29

  • Articles et rapports : 11-633-X2018017
    Description :

    Afin de concevoir des politiques visant à promouvoir l’égalité entre les sexes en matière de leadership, l’autonomisation économique des femmes et la croissance inclusive, il est important de bien comprendre la propriété d’entreprises par des femmes ainsi que le rendement des entreprises appartenant à des femmes. Cependant, l’information sur la propriété d’entreprises selon le sexe demeure rare, en raison du manque de données exhaustives. L’étude Entreprises appartenant à des femmes au Canada (Grekou, Li et Liu, 2018), comble ce manque de données en distinguant les propriétaires d’entreprises selon leur sexe à l’aide d’un nouvel ensemble de données administratives appelé la Base de données canadienne sur la dynamique employeurs-employés. Cet ensemble de données contient des renseignements sur les propriétaires d’entreprises pour toutes les entreprises non constituées en société et les sociétés privées au Canada. Le présent document porte sur la méthodologie adoptée pour établir la structure de la propriété d’entreprises selon le sexe. Il présente ensuite des estimations de la propriété d’entreprises selon le sexe (propriétaires majoritairement masculins ou féminins et propriété à parts égales). Enfin, il analyse la sensibilité de ces estimations et les compare à celles calculées à l’aide d’autres sources de données.

    Date de diffusion : 2018-09-24

  • Articles et rapports : 12-001-X201700114822
    Description :

    Nous utilisons une méthode bayésienne pour inférer sur une proportion dans une population finie quand des données binaires sont recueillies selon un plan d’échantillonnage double sur des petits domaines. Le plan d’échantillonnage double correspond à un plan d’échantillonnage en grappes à deux degrés dans chaque domaine. Un modèle bayésien hiérarchique établi antérieurement suppose que, pour chaque domaine, les réponses binaires de premier degré suivent des lois de Bernoulli indépendantes et que les probabilités suivent des lois bêta paramétrisées par une moyenne et un coefficient de corrélation. La moyenne varie selon le domaine, tandis que la corrélation est la même dans tous les domaines. En vue d’accroître la flexibilité de ce modèle, nous l’avons étendu afin de permettre aux corrélations de varier. Les moyennes et les corrélations suivent des lois bêta indépendantes. Nous donnons à l’ancien modèle le nom de modèle homogène et au nouveau, celui de modèle hétérogène. Tous les hyperparamètres possèdent des distributions a priori non informatives appropriées. Une complication supplémentaire tient au fait que certains paramètres sont faiblement identifiés, ce qui rend difficile l’utilisation d’un échantillonneur de Gibbs classique pour les calculs. Donc, nous avons imposé des contraintes unimodales sur les distributions bêta a priori et utilisé un échantillonneur de Gibbs par blocs pour effectuer les calculs. Nous avons comparé les modèles hétérogène et homogène au moyen d’un exemple et d’une étude en simulation. Comme il fallait s’y attendre, le modèle double avec corrélations hétérogènes est celui qui est privilégié.

    Date de diffusion : 2017-06-22

  • Articles et rapports : 11-633-X2016004
    Description :

    Pour comprendre l’importance du processus dynamique d’entrée dans l’économie canadienne, il faut mesurer le nombre et l’importance des entrées des entreprises. Le document porte sur l’estimation de l’importance de l’entrée des entreprises au Canada au moyen de la base de données qui sous-tend le Programme d’analyse longitudinale de l’emploi (PALE), qui sert à produire des mesures de l’entrée et de la sortie des entreprises depuis 1988. On y présente la méthodologie employée pour estimer l’entrée et la sortie, les problèmes qu’il a fallu résoudre et les raisons qui expliquent les solutions retenues. Sont ensuite exposées les mesures dérivées du PALE. Enfin, les auteurs proposent une analyse de la sensibilité des estimations fondées sur le PALE à différentes méthodes d’estimation de l’entrée et de la sortie.

    Date de diffusion : 2016-11-10

  • Articles et rapports : 11-633-X2016003
    Description :

    De grandes cohortes de mortalité nationales sont utilisées pour estimer les taux de mortalité en fonction de différents groupes socioéconomiques et démographiques ainsi que pour effectuer des recherches dans le domaine de la santé environnementale. En 2008, Statistique Canada a créé une cohorte en couplant les données du Recensement de 1991 avec des données sur la mortalité. La présente étude décrit le couplage des données des répondants au questionnaire détaillé du Recensement de 2001 âgés de 19 ans et plus avec les données du Fichier maître des particuliers T1 et la Base de données combinées sur la mortalité. Ce couplage permet de faire le suivi de tous les décès survenus sur une période de 10,6 ans (soit pour le moment jusqu’à la fin de 2011).

    Date de diffusion : 2016-10-26

  • Articles et rapports : 11-522-X201700014756
    Description :

    Comment pouvons-nous regrouper des données multidimensionnelles sur le rendement du système de santé de façon simple, afin qu’il soit facile d’y accéder et de fournir des renseignements comparables et exploitables pour accélérer les améliorations des soins de santé? L’Institut canadien d’information sur la santé a élaboré un ensemble d’outils pour répondre aux besoins de divers auditoires en matière de mesures de rendement, déterminer les priorités au chapitre des améliorations, comprendre comment les régions et les établissements se comparent les uns aux autres, et appuyer la transparence et la reddition de comptes. Les outils pancanadiens de [Votre système de santé (VSS)] consolident les rapports de 45 indicateurs clés du rendement de façon structurée, et sont comparables au fil du temps et à divers niveaux géographiques. Le présent document rend compte de l’élaboration et des approches et considérations méthodologiques qui ont servi à créer un outil dynamique qui facilite l’étalonnage et les comparaisons significatives pour l’amélioration du rendement du système de santé.

    Date de diffusion : 2016-03-24

  • Articles et rapports : 82-003-X201500614196
    Description :

    La présente étude examine la faisabilité et la validité de l’utilisation des numéros d’assurance-maladie personnels pour coupler de façon déterministe le Registre canadien du cancer la Base de données sur les congés des patients, afin d’obtenir des données sur les hospitalisations des personnes atteintes d’un cancer primaire.

    Date de diffusion : 2015-06-17

  • Articles et rapports : 12-001-X201400214096
    Description :

    Afin d’obtenir une meilleure couverture de la population d’intérêt et de réduire les coûts, un certain nombre d’enquêtes s’appuient sur un plan à base de sondage double, suivant lequel des échantillons indépendants sont tirés de deux bases de sondage chevauchantes. La présente étude porte sur les tests du khi-carré dans les enquêtes à base de sondage double en présence de données catégoriques. Nous étendons le test de Wald généralisé (Wald 1943), ainsi que les tests avec correction d’ordre un et correction d’ordre deux de Rao-Scott (Rao et Scott 1981) pour passer d’une enquête à base de sondage unique à une enquête à base de sondage double, et nous déterminons les distributions asymptotiques. Des simulations montrent que les deux tests avec correction de type Rao-Scott donnent de bons résultats, et il est donc recommandé de les utiliser dans les enquêtes à base de sondage double. Un exemple sert à illustrer l’utilisation des tests élaborés.

    Date de diffusion : 2014-12-19
Références (2)

Références (2) ((2 résultats))

Date de modification :