Image to Text
Extraire du texte et des descriptions d'images grâce à l'IA
À quoi sert ce node ?
Le node Image to Text utilise des modèles de vision par IA pour analyser des images et en extraire du texte, des descriptions ou des données structurées. Il peut lire le texte dans les images (OCR), décrire le contenu d’une image ou répondre à des questions sur une image.
Usages courants :
- Extraire du texte à partir de captures d’écran ou de documents
- Générer des descriptions d’images pour l’accessibilité
- Analyser des images de produits
- Extraire des données de graphiques ou d’infographies
Configuration rapide
Ajouter le node Image to Text
Trouvez-le dans AI Nodes → Image to Text
Fournir l’image
URLs ou entrées de type fichier
Rédiger votre prompt
Indiquez à l’IA quoi extraire ou décrire
Configuration
Champs obligatoires
image string required L’image à analyser.
Formats :
- URL :
https://example.com/image.jpg
prompt string required Instructions sur ce qu’il faut extraire ou décrire.
Exemples :
- “Extrais tout le texte de cette image”
- “Décris cette image produit en détail”
- “Quelles marques sont visibles ?”
- “Lis le graphique et fournis les données”
Sortie
{
"response": "L'image montre un reçu du magasin Acme daté du 15 janvier 2024. Articles : Café 4,50 €, Sandwich 8,99 €. Total : 13,49 €.",
"confidence": 0.95
}
Exemples
OCR – Extraire du texte
Prompt : “Extrais tout le texte de cette image tel qu’il apparaît”
Description de produit
Prompt : “Décris ce produit pour une fiche e-commerce. Inclus couleur, matière et caractéristiques principales.”
Extraction de données d’un graphique
Prompt : “Lis les données de ce graphique en barres et renvoie-les en JSON avec les libellés et les valeurs.”