nettoyage des données est le processus de fixation des données et de suppression des données inutiles afin d' optimiser les opérations de datawarehousing quotidiennes. Datawarehousing est le stockage de données dans un référentiel central afin que toute personne dans une organisation peut y accéder. Pour datawarehouse , pour réussir, les informations de base de données doivent être exactes . Toutefois, étant donné la grande quantité de données que les entreprises travaillent, ces données ne peuvent pas toujours être corrigées manuellement . Par conséquent , le nettoyage automatisé de données est nécessaire. Disponibilité nettoyage des données doit rendre les données plus pertinentes rapidement accessibles à ceux qui sont à la recherche pour elle. Le temps perdu à chercher dans l'information non pertinente peut perdre du temps aux employés et aux ressources de l'entreprise de déchets. L'information qui est redondant peut perdre de l'espace de stockage de l'entreprise. Intégrité nettoyage des données ne doit pas supprimer ou modifier les données à l'endroit où les données deviennent inexacts. Des données inexactes peuvent causer aux entreprises de faire des erreurs telles que l'envoi d'une facture à la mauvaise adresse , ce qui peut clients de la colère et de l'argent des déchets. Les données doivent également être mis à jour tout au long des bases de données. Si les mises à jour d'un client une adresse de facturation, cette mise à jour devrait être distribuée aux bases de données dans tous les départements concernés . Organisation nettoyage des données doit prendre des données pertinentes provenant de différentes sources et de les déplacer automatiquement ces données à des endroits appropriés afin que les données peuvent être facilement trouvés en cas de besoin . Ceci élimine la nécessité de créer de nouvelles données lorsque les données existent déjà . Correcteur d'erreur erreurs et des incohérences , comme un nom mal orthographié , doit être situé et corrigées par les données nettoyage processus . Les erreurs doivent être corrigées en particulier dans la programmation de logiciels , car ces erreurs peuvent causer des systèmes informatiques ne fonctionnent pas correctement . Automatisation données des outils de nettoyage devraient réduire au minimum la quantité de manuel entrée qui est nécessaire. En d'autres termes , les administrateurs de bases de données ne devraient pas avoir à lancer continuellement les processus eux-mêmes , mais ces processus devraient se faire automatiquement . Il devrait également y avoir un effort de programmation minimal nécessaire. Les programmeurs ne devraient pas avoir à coder chaque fois une action de routine est effectuée . Simplicité données des outils de nettoyage doivent simplifier l'information dès que possible. Déchets données ressources de l'entreprise complexes et les forces également aux employés de passer plus de temps à la recherche de certaines informations . Analyse analyse post- processus est l'examen manuel des données après que les données a été nettoyée. Peu importe comment les données efficace des processus de nettoyage sont inévitables erreurs peuvent se produire. Les administrateurs de bases doivent encore vérifier régulièrement les données manuellement afin de s'assurer que les données sont exactes . Les données des outils de nettoyage devraient permettre aux administrateurs de visualiser les données dans un format facilement compréhensible afin que les corrections puissent être apportées rapidement . Efficacité nettoyage des données peut être longue et coûteuse . Tout ce qui peut accélérer le long processus de nettoyage des données ou de réduire les coûts associés avec le nettoyage des données est nécessaire afin de maximiser la rentabilité de l'entreprise.
|