Impute les valeurs manquantes d'un dataset selon la méthode spécifiée. Supporte l'imputation simple (statistiques descriptives), hot-deck et par régression. Produit un rapport de traçabilité.
Utilisation
imputer_valeurs(
data,
vars = NULL,
methode = c("mediane", "moyenne", "mode", "hot_deck", "regression"),
vars_auxiliaires = NULL,
graine = 42L,
rapport = TRUE
)Arguments
- data
data.frame ou tibble — Données avec valeurs manquantes
- vars
character ou NULL — Variables à imputer. Si NULL, toutes les variables avec valeurs manquantes. Défaut : NULL.
- methode
character — Méthode d'imputation :
"mediane","moyenne","mode","hot_deck","regression". Défaut : "mediane".- vars_auxiliaires
character ou NULL — Variables auxiliaires pour l'imputation par régression ou hot-deck. Défaut : NULL.
- graine
integer — Graine aléatoire pour la reproductibilité. Défaut : 42.
- rapport
logical — Retourner un rapport d'imputation. Défaut : TRUE.
Valeur de retour
Si rapport = FALSE : tibble imputé.
Si rapport = TRUE : liste avec $donnees et $rapport.
Exemples
if (FALSE) { # \dontrun{
resultat <- imputer_valeurs(
data = donnees_enquete,
vars = c("revenu_mensuel", "age"),
methode = "mediane"
)
donnees_propres <- resultat$donnees
} # }