Guide de préparation des propositions présentées aux centres de données de recherche à l’intention des utilisateurs de l’Enquête sur les dépenses des ménages

Le présent guide a été conçu dans le but d’aider les chercheurs à préparer leurs propositions en vue d’utiliser les microdonnées de l’Enquête sur les dépenses des ménages (EDM). Il donne un aperçu des considérations dont les chercheurs doivent tenir compte lorsqu’ils formulent leurs propositions, s’appuyant sur les principales raisons pour lesquelles des révisions aux propositions sont exigées.

Les chercheurs sont invités à consulter, en plus du présent document, le Guide de l’utilisateur, Enquête sur les dépenses des ménages pour obtenir de plus amples renseignements sur les méthodes et les concepts utilisés dans l’EDM.

1. Taille de l’échantillon

La raison la plus courante d’une demande de révision d’une proposition adressée aux chercheurs est que la taille de l’échantillon explicite ou implicite ou la sous-population d’intérêt établie dans la proposition est trop restreinte pour qu’il soit possible d’atteindre les objectifs de la recherche. Cela peut se produire lorsque le projet de recherche proposé comporte un ou plusieurs des cas de figure suivants :

  • l’examen de catégories de dépenses détaillées d’après des zones géographiques  d’une taille inférieure à ce que le plan d’enquête prévoyait (une province ou une région métropolitaine de recensement, par exemple);
  • l’analyse d’une catégorie de dépenses pour laquelle le nombre de ménages répondants est faible (p. ex., les services de garde d’enfants);
  • l’examen d’un sous-groupe de la population (p. ex., les ménages à faible revenu);
  • la création de sous-groupes ou de données de classement à l’aide d’autres variables (comme les caractéristiques démographiques ou des ménages) dans un échantillon qui est déjà restreint;
  • une analyse de régression à l’aide de variables de dépenses qui ne sont utilisables que dans le fichier du journal (applicable aux années 2012 et suivantes), puisque la taille de l’échantillon pour le journal est égale à 50 % de l’échantillon total depuis 2012 (voir le point 3 plus loin).

Les utilisateurs peuvent constituer un bassin à partir de multiples années de données (les combiner) pour obtenir un échantillon de plus grande taille.

2. Remaniement de l’EDM en 2010

L’EDM a subi un remaniement important en 2010. Les catégories de dépenses dans la version remaniée de l’EDM sont semblables à celles des années précédentes. Cependant, il existe d’importantes différences entre les données antérieures à 2010 et celles qui ont suivi, en raison de modifications dans les méthodes de collecte, de traitement et d’estimation de données. Par conséquent, les comparaisons entre les données de l’EDM de 2010 et des années suivantes et celles de l’EDM de 2009 et des années antérieures doivent être faites avec prudence.

En particulier, les chercheurs doivent prendre en considération que deux modes de collecte sont utilisés pour l’EDM depuis 2010 : le questionnaire (administré au moyen d’une interview sur place assistée par ordinateur) et le journal des dépenses. Le questionnaire est utilisé pour recueillir des renseignements sur les dépenses avec des périodes de rappel adaptées aux types de dépenses (dernier mois, trois derniers mois, 12 derniers mois, quatre dernières semaines ou dernier paiement). Le journal des dépenses est rempli par les ménages sélectionnés pendant les deux semaines qui suivent l’interview.

De plus, depuis 2010, la collecte de données est continue de janvier à décembre de l’année d’enquête. C’est à dire que les données sont recueillies chaque mois à partir d’un douzième de l’échantillon. Les périodes de référence des montants déclarés diffèrent donc d’un ménage à l’autre. Par exemple, pour les ménages de l’échantillon de janvier 2013, « les 12 derniers mois » signifie la période allant de janvier 2012 à décembre 2012, tandis que pour les ménages de l’échantillon de décembre 2013, il s’agit plutôt de la période s’étalant de décembre 2012 à novembre 2013.

Avec le précédent modèle de l’EDM (avant 2010), la collecte avait lieu entre janvier et mars pour toutes les dépenses faites pendant l’année civile précédente.

La comparaison de données de 2010 et des années suivantes avec celles des années antérieures est plus problématique dans le cas des dépenses recueillies avec une période de rappel infra-annuelle dans le cadre du nouveau plan (mois précédent, trois mois précédents, quatre semaines précédentes ou dernier paiement). Le problème de la comparabilité est moins important pour les dépenses recueillies avec une période de rappel de 12 mois, puisque les dépenses étaient déclarées sur une période de 12 mois en vertu de l’ancien plan d’enquête. Cependant, il faut tout de même faire preuve de prudence dans la comparaison des données de 2010 et des années suivantes avec celles de 2009 et des années antérieures en raison de l’adoption de la collecte en continu en vertu du nouveau plan d’enquête.

Pour obtenir de plus amples renseignements sur le remaniement de l’enquête, consulter la Note aux utilisateurs de données de l’Enquête sur les dépenses des ménages de 2010.

3. Analyse de régression touchant les postes de dépenses recueillis dans le journal

Depuis le remaniement de 2010, certains renseignements sur les dépenses sont recueillis au moyen d’un questionnaire, et d’autres, au moyen d’un journal rempli par des ménages sélectionnés pendant une période de deux semaines après l’interview. À partir de 2012, la taille de l’échantillon pour le journal est de 50 % de l’échantillon total.

Comme seul un sous-échantillon de répondants à l’interview est sélectionné pour remplir le journal, deux ensembles de pondérations sont calculés – un pour l’interview et un pour le journal. Une analyse au niveau micro qui exige des variables pour les dépenses recueillies au moyen du journal (p. ex. l’essence) ou des variables pour les catégories de dépenses qui comprennent des sous-catégories recueillies au moyen du journal (p. ex. les transports) doit se limiter aux ménages qui ont répondu à l’interview et ont rempli le journal (c.-à-d. les dossiers dans le « fichier du journal » au CDR). Sinon, deux ensembles de pondérations devraient être appliqués simultanément, ce qui n’est pas possible avec les logiciels statistiques standard.

Les chercheurs doivent savoir si leur analyse doit se restreindre à l’échantillon des ménages qui ont rempli le journal, puisque cela limite la taille de l’échantillon.

Les dictionnaires de données indiquant les variables utilisables dans le fichier du journal et le fichier de l’interview seront fournis sur demande.

4. Annualisation des montants déclarés pour une période inférieure à 12 mois

Les dépenses recueillies avec une période de rappel de moins de 12 mois sont annualisées de manière que tous les montants de dépenses couvrent une période de 12 mois. Les valeurs annualisées pour les catégories ayant des périodes de référence infra-annuelles (dernier mois, trois derniers mois, deux ou quatre dernières semaines) ne sont pas conçues pour une utilisation dans les analyses au niveau micro.

Par exemple, les ménages qui ont été sélectionnés pour remplir le journal doivent inscrire leurs dépenses en carburant pour leur véhicule pendant les deux semaines qui suivent l’interview. Le montant total dépensé par le ménage en carburant pour le véhicule pendant la période de deux semaines est multiplié par un facteur d’annualisation, toutes les périodes de référence étant ramenées à une période de 12 mois aux fins d’uniformisation. Le facteur d’annualisation de référence est 26 (52 semaines/2); d’autres ajustements sont effectués pour tenir compte, s’il y a lieu, des journées de non-réponse dans le journal ainsi que des cas influents (extrêmes). Le montant des dépenses annuelles n’est pas destiné à être représentatif des dépenses d’un ménage en carburant pour son véhicule sur une période de 12 mois (et pourrait bien ne pas l’être), puisque le facteur d’annualisation ne tient pas compte des variations saisonnières dans les dépenses du ménage en carburant pour le véhicule. Les dépenses en carburant annualisées peuvent être sous-estimées pour certains ménages et surestimées pour d’autres.

Les dépenses annuelles estimatives en carburant pour le véhicule, pour un groupe de ménages (par opposition à celles d’un ménage individuel), tiennent compte de la variabilité saisonnière des dépenses, parce que les dépenses sont recueillies à partir du douzième de l’échantillon chaque mois (c’est-à-dire, puisque les ménages déclarent leurs dépenses à différents mois de l’année).

5. Variables au niveau des ménages et variables au niveau des personnes

La plupart des variables de dépenses ne sont utilisables qu’au niveau des ménages (à l’exception des dépenses pour les vêtements, de l’impôt sur le revenu, des paiements d’assurance individuelle et des dons d’argent, qui sont recueillies au niveau individuel).

Certaines variables démographiques ne sont pas disponibles pour chacune des personnes du ménage (p. ex., le niveau de scolarité n’est recueilli que pour la personne repère du ménage et son partenaire).

Les chercheurs devraient passer en revue le questionnaire de l’EDM pour s’assurer que l’enquête collecte les variables nécessaires à leur analyse.

6. Variables relatives à la période de revenu de référence

Depuis 2010, la période de référence en ce qui a trait au revenu et à l’impôt sur le revenu est l’année précédant l’année de l’enquête. Par exemple, dans le cas de l’EDM de 2013, l’année de référence pour le revenu est 2012. Ce délai est attribuable au fait que ces valeurs proviennent désormais principalement des fichiers de données administratives T1 (déclarations de revenus des particuliers) de l’Agence du revenu du Canada, qui sont généralement produits neuf à douze mois après la fin de l’année civile.

7. Variables relatives aux flux monétaires

Depuis 2010, l’EDM ne collecte pas de variables relatives aux flux monétaires (p. ex. les économies). De plus, les taux d’épargne ne peuvent pas être calculés en vertu du nouveau plan puisque la période de référence pour le revenu est l’année précédant l’année de référence de l’enquête.

8. Médianes et coefficients de Gini

Depuis 2010, les médianes et les coefficients de Gini ne peuvent pas être calculés pour les dépenses recueillies en utilisant une période de rappel de moins de 12 mois. Ce calcul est impossible parce que l’utilisation de périodes de rappel infra-annuelles modifie la répartition des variables de dépenses entre les ménages (voir le point 4 ci-dessus).

Documents de référence