Identifie et supprime les enregistrements dupliqués selon une ou plusieurs clés d'identification. Produit un rapport des doublons détectés.
Utilisation
supprimer_doublons(
data,
cles = NULL,
garder = c("premier", "dernier", "aucun"),
rapport = TRUE
)Arguments
- data
data.frame ou tibble — Données à dédupliquer
- cles
character ou NULL — Variables clés pour la détection. Si NULL, utilise toutes les colonnes. Défaut : NULL.
- garder
character — Quel doublon conserver :
"premier"(première occurrence),"dernier"(dernière occurrence),"aucun"(supprimer tous les doublons). Défaut : "premier".- rapport
logical — Retourner un rapport des doublons. Défaut : TRUE.