Les données peuvent être endommagées dans un certain nombre de façons, à des erreurs de saisie de l'utilisateur à des incohérences de mise en forme . Les doublons sont un des problèmes de données les plus courantes dans les bases de données de la plupart des entreprises. La meilleure façon de s'assurer de l'exactitude des données consiste à prévenir la corruption, mais il est sage d'avoir un plan pour faire face aux problèmes de données en cas de problème . Duplication doublons peut être une chose frustrant de voir que le vérificateur de données. Souvent, un écran de données frontal ne peut pas attraper certains types de doublons , par exemple , dans une table d'adresses , 123, rue Main et 123 rue peut sembler être deux adresses distinctes , alors qu'en fait ils sont la même adresse < . br> Ceci peut être résolu en utilisant une des deux méthodes : l'enlèvement ou de données correction des données. Suppression de données signifierait la suppression de tous les cas sauf un d'une série de doublons, tandis que la correction des données mettrait à jour toutes les instances de duplication à un seul convenus valeur . Les logiciels sont disponibles qui utilisent un algorithme pour identifier les valeurs aberrantes basé sur l'écart type , les clusters ou d'autres critères , puis les valeurs aberrantes sont évaluées par un expert en la matière qui détermine le destin de l'entrée inattendue. Extrait , Transform, Load extraire, transformer , charger , ou ETF , est une méthode couramment utilisée pour se déplacer et nettoyer les données . Même si aucun nettoyage manuel se produit, il ya des tâches automatisées dans la phase de traduction. Par exemple, si la source magasins de table «M» et «F» et la table de destination stocke "mâle " et " femelle ", un script est exécuté pour traduire les données pour les nouvelles valeurs. Une fois les données est nettoyé et validé, il peut être importé dans la table de destination . Il peut également être importé sur les anciennes données à écrire sur les données . Cela fonctionne bien quand une colonne entière de données dans une table qui doit être changé . Mise à jour Héritage Systems Mise à jour un ancien système implique généralement le déplacement des données à un emplacement intermédiaire , ou zone de transit , où il subit alors un système automatisé ainsi que les données manuelles nettoyage ronde. Ceci est fait pour éviter de faire des erreurs irréversibles aux données existantes avant de l'importer dans le nouveau système . Il convient de noter que les données existantes ne devraient pas être mis à jour , selon les informations -management.com , afin d'éviter le maintien de deux bases de données distinctes. Il doit être retiré à la place et le nouveau système devrait être la seule en usage à l'avenir.
|