En elle-même, la vérification apporte peu à l'amélioration générale des résultats réels de l'enquête si aucune mesure corrective n'est prise lorsque les articles ne respectent pas les règles établies durant la vérification. Lorsqu'il manque des données à un fichier, l'imputation a lieu en général après le traitement des données en fonction des règles de vérification.
Les non-réponses et les données invalides influent définitivement sur la qualité des résultats de l'enquête. L'imputation résout les problèmes des réponses manquantes, invalides ou incomplètes relevées durant la vérification, ainsi que les erreurs de vérification qui peuvent survenir. À ce stade, toutes les données font l'objet d'une recherche d'erreurs parce que les répondants ne sont pas les seuls à commettre des erreurs, qui risquent aussi de se glisser durant le codage et la vérification.
Les procédures d'imputation visent à combler les lacunes. Ainsi, les modifications sont apportées au nombre minimal de champs jusqu'à ce que les enregistrements aient fait l'objet de toutes les vérifications. À la détection de ces erreurs, les données des entrées invalides, manquantes ou incomplètes sont imputées ou remplacées par des valeurs appropriées. Nous attribuons aussi des réponses aux questions non répondues. Cette procédure relève de personnes qui ont un accès complet aux microdonnées et qui détiennent de bons renseignements auxiliaires.
Les procédures d'imputation sont établies lors de la planification et de l'élaboration de l'enquête. Certains problèmes sont éliminés plus tôt par une communication avec le répondant ou par l'examen manuel du questionnaire, mais en général il est impossible de résoudre tous les problèmes en raison du fardeau de réponse, du coût et des contraintes de temps. Ainsi, l'imputation sert à combler les lacunes de la vérification.
Bien que l'imputation puisse améliorer la qualité des données finales, il importe de choisir avec soin la méthodologie d'imputation pertinente. Certaines méthodes d'imputation ne préservent pas la relation entre les variables. En fait, certaines introduisent même une distorsion dans la répartition sous-jacente.
L'imputation des données exige que nous tenions compte de plusieurs facteurs. En général, l'imputation déductive est la première méthode utilisée. Cette méthode est utilisée lorsqu’on peut déduire une valeur avec certitude. Elle peut avoir lieu durant la collecte, la saisie, la vérification ou les étapes ultérieures du traitement des données. L'imputation déductive sert lorsqu'il n'y a qu'une seule réponse possible à la question (p. ex., toutes les valeurs sont données mais il manque le total ou le sous-total).
Voici d'autres méthodes d'imputation :
La méthode d'imputation peut varier d'une enquête à l'autre et, dans des circonstances uniques ou particulières, à l'intérieur d'une même enquête. Ces méthodes peuvent être appliquées manuellement ou au moyen d'un système automatisé. La valeur imputée est déterminée à la suite d'une communication avec le répondant ou par le jugement d'un spécialiste du sujet. Pour faciliter l'imputation, Statistique Canada a écrit des programmes spécialisés d'imputation de données à la suite de commentaires sur la méthodologie formulés par des statisticiens d'expérience qui ont analysé l'enquête et suggéré des approches pour imputer avec la plus grande justesse des données significatives.
Les méthodes d'imputation peuvent être effectuées automatiquement, manuellement ou en combinaison. Bien réalisée, l'imputation restreint les écarts causés par l'absence d'enregistrements complets et précis, offre une piste de vérification destinée à l'évaluation et veille à uniformiser à l'interne les enregistrements imputés. Une bonne procédure d'imputation est automatisée, objective et efficiente.