|
L'annotation d'images est le processus d'ajout d'informations aux images pour les rendre plus compréhensibles par les ordinateurs. Ces informations se présentent généralement sous la forme d'étiquettes, de cadres de délimitation, de polygones, de masques de segmentation sémantique ou d'autres métadonnées. L'objectif est de former des modèles de vision par ordinateur pour reconnaître des objets, des scènes et des activités dans les images.
Voici une présentation des différents types d'annotations d'images :
* Boîtes de délimitation : Une boîte rectangulaire dessinée autour d'un objet d'intérêt. Il s’agit d’une forme d’annotation courante et relativement simple. Il identifie l'emplacement de l'objet mais ne fournit pas d'informations détaillées sur sa forme.
* Polygones : Plus précis que les cadres de délimitation, les polygones tracent le contour d'un objet, capturant sa forme avec plus de précision. Ceci est utile pour les objets de formes irrégulières.
* Segmentation sémantique : Cela attribue une étiquette à chaque pixel de l'image, classant chaque pixel comme appartenant à un objet ou une classe spécifique. Cela fournit les informations les plus détaillées sur le contenu de l’image.
* Monuments/Points clés : Cela implique de marquer des points spécifiques sur un objet (par exemple, les coins d'une voiture, les yeux et le nez d'un visage). Ceci est souvent utilisé pour l’estimation de pose et la reconnaissance faciale.
* Cuboïdes (boîtes de délimitation 3D) : Utilisé pour la détection d'objets 3D, en spécifiant l'emplacement et les dimensions de l'objet dans un espace tridimensionnel.
* Sous-titrage/Transcription : Ajouter des descriptions textuelles aux images, résumer le contenu ou fournir un contexte.
* Classification des images : Attribuer une seule étiquette à une image entière, décrivant son contenu global.
Le type d'annotation utilisé dépend de l'application spécifique et du niveau de détail souhaité. Par exemple, une voiture autonome peut nécessiter une segmentation sémantique pour identifier avec précision les marquages routiers et les piétons, tandis qu'une recherche d'images de produits peut nécessiter uniquement des cadres de délimitation. Les images annotées deviennent ensuite les données de formation pour les algorithmes d'apprentissage automatique utilisés dans la détection d'objets, la classification d'images et d'autres tâches de vision par ordinateur.
|