Données d'entrée source (SID) correspondent aux données que vous souhaitez utiliser comme entrée pour votre modèle. Il peut s'agir de tout type de données, notamment :
* Données structurées : Ce type de données est stocké dans un format structuré, tel qu'une feuille de calcul ou une base de données.
* Données non structurées : Ce type de données n'est pas stocké dans un format structuré, tel que du texte ou des images.
Le SID peut provenir de diverses sources, notamment :
* Données internes : Ces données sont générées au sein de votre organisation et sont généralement stockées dans une base de données ou un système de planification des ressources d'entreprise (ERP).
* Données externes : Ces données sont générées en dehors de votre organisation et peuvent être trouvées sur le Web, sur les réseaux sociaux ou dans les bases de données gouvernementales.
La qualité de votre SID est essentielle au succès de votre modèle. De mauvaises données entraîneront de mauvais résultats. Il est donc important de prendre le temps de nettoyer et de préparer votre SID avant de l’utiliser pour la modélisation.
Voici quelques conseils pour préparer votre SID :
* Nettoyez vos données : Cela implique de supprimer toutes les données en double ou erronées.
* Standardisez vos données : Cela implique de convertir toutes vos données dans un format cohérent.
* Enrichissez vos données : Cela implique d'ajouter des données supplémentaires à votre SID, telles que des informations démographiques ou des données météorologiques.
Une fois que vous avez préparé votre SID, vous pouvez commencer à l'utiliser pour construire votre modèle.
|