Passer au contenu

Normalise les chaînes de caractères : suppression des espaces superflus, normalisation de la casse, gestion des caractères spéciaux, correction des encodages. Préserve les caractères accentués africains et francophones.

Utilisation

nettoyer_libelles(
  data,
  vars = NULL,
  casse = c("titre", "majuscule", "minuscule", "aucune"),
  supprimer_espaces = TRUE,
  supprimer_ponctuation = FALSE,
  encodage = "UTF-8"
)

Arguments

data

data.frame ou tibble — Données à nettoyer

vars

character ou NULL — Variables à nettoyer. Si NULL, toutes les variables de type character. Défaut : NULL.

casse

character — Normalisation de la casse : "titre" (Première Lettre Majuscule), "majuscule", "minuscule", "aucune". Défaut : "titre".

supprimer_espaces

logical — Supprimer les espaces multiples et les espaces en début/fin. Défaut : TRUE.

supprimer_ponctuation

logical — Supprimer la ponctuation superflue. Défaut : FALSE.

encodage

character — Encodage cible. Défaut : "UTF-8".

Valeur de retour

Un tibble avec les variables textuelles nettoyées.

Exemples

if (FALSE) { # \dontrun{
  donnees_propres <- nettoyer_libelles(donnees_enquete)
  donnees_propres <- nettoyer_libelles(
    donnees_enquete,
    vars  = c("region", "commune"),
    casse = "majuscule"
  )
} # }