Image to Video
Transformer des images statiques en vidéos dynamiques avec l'IA
v1.1 — AI Video
Nouveautés — Avril 2026 — Ajout des modèles Seedance 2.0 et Seedance 2.0 Reference. Seedance 2.0 supporte l’image de fin, la génération audio, des rapports d’aspect flexibles (dont 21:9, 4:3, 3:4) et la durée automatique. Seedance 2.0 Reference génère des vidéos à partir de références multi-modales — jusqu’à 9 images, 3 vidéos et 3 fichiers audio référencés dans le prompt via @Image1, @Video1, @Audio1. Pas d’image de départ nécessaire en mode Reference.
Mises à jour précédentes
Avril 2026 (v1.1) — Support multi-fournisseurs
Support multi-fournisseurs (Veo 3.1, Sora 2/Pro, Kling v3/o3/o3 Ref), génération audio IA, amélioration automatique du prompt, support des images de fin et de référence, système d’éléments pour la cohérence de sujet/style, mode multi-prompt pour les vidéos multi-plans, résolution jusqu’à 4K et support du prompt négatif.
À quoi sert ce node ?
Le node Image to Video transforme des images statiques en vidéos dynamiques grâce à l’IA. Il supporte plusieurs fournisseurs de modèles, chacun offrant des capacités différentes comme la génération audio, le contrôle de l’image de fin, les images de référence et les narrations multi-plans.
Utilisations courantes :
- Animer des photos de produits en vidéos de présentation soignées
- Créer des vidéos engageantes pour les réseaux sociaux à partir de visuels statiques
- Générer des clips cinématiques avec mouvements de caméra et effets
- Construire des narrations multi-plans à partir d’une série d’images grâce au mode multi-prompt
Configuration rapide
Ajouter le node Image to Video
Trouvez-le dans AI Nodes → AI_VIDEO → Image to Video
Connecter une image de départ
Connectez une sortie image à l’entrée input_start_frame. C’est l’image qui sera animée.
Sélectionner un modèle et décrire le mouvement
Choisissez un modèle (ex. Veo 3.1, Sora 2, Kling v3, Seedance 2.0) et rédigez un prompt décrivant le mouvement et l’animation souhaités.
Exécuter le workflow
Lancez le workflow. Le node produit un fichier vidéo en sortie.
Configuration
Modèle
modelName LLM selection required Le modèle IA à utiliser pour la génération vidéo. Chaque famille de modèles offre des capacités différentes — consultez le tableau comparatif ci-dessous.
Prompt
prompt string required Description du mouvement et de l’animation souhaités. Supporte les {{variables}} pour le contenu dynamique. Vous pouvez référencer les entrées connectées avec @Element1, @Element2 (Kling), ou @Image1, @Video1, @Audio1 (Seedance 2.0 Reference).
Exemples :
- “Zoom cinématique lent, transitions de lumière douces”
- “Le produit tourne à 360 degrés sur un fond blanc”
- “La caméra panoramique de gauche à droite sur le paysage, les nuages bougent”
- “@Image1 marche dans une forêt dans le style de @Image2. La bande son de @Audio1 accompagne la scène.” (Seedance 2.0 Ref)
Audio
generate_audio boolean default: true Activer la génération audio IA pour la vidéo. Supporté par Veo 3.1 et les modèles Seedance 2.0 (activé par défaut sur Seedance).
Amélioration du prompt
enhance_prompt boolean default: true Laisser l’IA améliorer votre prompt pour de meilleurs résultats. Le modèle réécrit votre prompt avec plus de détails et de direction cinématique.
Ratio d’aspect
aspect_ratio string default: 16:9 Ratio d’aspect de la vidéo en sortie. Les options disponibles varient selon le modèle :
- Veo 3.1 : 16:9, 9:16
- Sora 2 / Sora 2 Pro : Auto, 9:16, 16:9
- Kling v3 / o3 / o3 Ref : 16:9, 9:16, 1:1
- Seedance 2.0 / 2.0 Ref : Auto, 21:9, 16:9, 4:3, 1:1, 3:4, 9:16
Durée
duration_seconds number default: 8 Durée de la vidéo en secondes. La plage varie selon le modèle :
- Veo 3.1 : 4–8s
- Sora 2 / Sora 2 Pro : 4, 8 ou 12s
- Kling v3 / o3 / o3 Ref : 3–15s
- Seedance 2.0 / 2.0 Ref : Auto, ou 4–15s
Nombre de vidéos
num_videos number default: 1 Nombre de vidéos à générer (1–2).
Résolution
resolution string default: 1080p Résolution de la vidéo en sortie. Les options disponibles varient selon le modèle (jusqu’à 4K sur les modèles supportés).
Prompt négatif
negative_prompt string Décrivez ce que vous souhaitez éviter dans la vidéo générée. Supporté uniquement par les modèles Kling.
Exemple : “flou, basse qualité, visages déformés, filigrane”
Image de fin
use_end_frame boolean default: false Activer le support de l’image de fin. Lorsqu’activé, une entrée dynamique input_end_frame apparaît. Connectez une image pour définir comment la vidéo doit se terminer. Supporté par Veo 3.1, les modèles Kling et Seedance 2.0.
Images de référence
use_reference_images boolean default: false Activer les images de référence pour la cohérence visuelle. Lorsqu’activé, une entrée dynamique input_reference_images apparaît. Supporté par Veo 3.1 (jusqu’à 3 images) et Kling o3 Ref (jusqu’à 4 images).
Éléments
elements_config json Tableau de configurations d’éléments, chacun avec un id et un type (image ou vidéo). Les entrées d’éléments connectés peuvent être référencées dans le prompt via @Element1, @Element2, etc. pour maintenir la cohérence de sujet ou de style dans la vidéo. Supporté par Kling v3 (jusqu’à 4) et Kling o3 Ref (jusqu’à 4).
Références Seedance
seedance_refs_config json Configurer les entrées de référence multi-modales pour Seedance 2.0 Reference. Ce modèle n’utilise pas d’image de départ — tous les médias sont fournis comme références nommées et cités dans le prompt.
Utilisez les compteurs dans le panneau de configuration pour ajouter des références :
- Images (
@Image1–@Image9) : Jusqu’à 9 images de référence. JPEG, PNG ou WebP. Max 30 Mo chacune. - Vidéos (
@Video1–@Video3) : Jusqu’à 3 vidéos de référence. MP4 ou MOV. Résolution 480p–720p, durée combinée 2–15s, taille totale inférieure à 50 Mo. - Audio (
@Audio1–@Audio3) : Jusqu’à 3 fichiers audio. MP3 ou WAV. Max 15 Mo chacun, durée combinée max 15s. Nécessite au moins 1 image ou vidéo.
Le total toutes modalités confondues ne doit pas dépasser 12. Chaque référence crée un connecteur d’entrée sur le node. Référencez-les dans votre prompt avec @Image1, @Video1, @Audio1, etc.
Exemple de prompt :
@Image1 marche dans une forêt dans le style de @Image2.
La caméra la suit par derrière le long du chemin montré dans @Video1.
La bande son de @Audio1 accompagne la scène avec des chants d'oiseaux. Multi-Prompt
multi_prompt_enabled boolean default: false Activer la génération vidéo multi-plans. Lorsqu’activé, la vidéo est composée de plusieurs plans séquentiels, chacun avec son propre prompt et sa durée.
multi_prompt_config json Tableau de définitions de plans, chacun contenant un prompt et une duration. Utilisé lorsque multi_prompt_enabled est activé. Supporté par Kling v3 et Kling o3 Ref.
Exemple :
[
{ "prompt": "Gros plan du produit sur une table", "duration": 5 },
{ "prompt": "La caméra recule pour révéler la scène complète", "duration": 5 }
] Comparaison des modèles
| Fonctionnalité | Veo 3.1 | Sora 2 | Sora 2 Pro | Kling v3 | Kling o3 | Kling o3 Ref | Seedance 2.0 | Seedance 2.0 Ref |
|---|---|---|---|---|---|---|---|---|
| Image de départ | Optionnelle | Optionnelle | Optionnelle | Requise | Requise | Optionnelle | Requise | Non |
| Ratios d’aspect | 16:9, 9:16 | Auto, 9:16, 16:9 | Auto, 9:16, 16:9 | 16:9, 9:16, 1:1 | 16:9, 9:16, 1:1 | 16:9, 9:16, 1:1 | Auto, 21:9, 16:9, 4:3, 1:1, 3:4, 9:16 | Auto, 21:9, 16:9, 4:3, 1:1, 3:4, 9:16 |
| Durée | 4–8s | 4, 8, 12s | 4, 8, 12s | 3–15s | 3–15s | 3–15s | Auto, 4–15s | Auto, 4–15s |
| Résolution | 4K, 1080p, 720p | Auto, 720p | Auto, 1080p, 720p | 1080p | 1080p | 1080p | 720p, 480p | 720p, 480p |
| Audio | Oui | Non | Non | Oui | Oui | Non | Oui | Oui |
| Image de fin | Oui | Non | Non | Oui | Oui | Oui | Oui | Non |
| Références | 3 images | Non | Non | Non | Non | 4 images | Non | 9 images, 3 vidéos, 3 audio |
| Éléments | Non | Non | Non | 4 max | Non | 4 max | Non | Non |
| Multi-Prompt | Non | Non | Non | Oui | Non | Oui | Non | Non |
Sortie
output video Le fichier vidéo généré.
Exemples
Animation produit avec Veo 3.1
Modèle : Veo 3.1 Image de départ : Photo de produit sur fond neutre Prompt : “Le produit tourne lentement avec un éclairage studio doux, reflets subtils sur la surface, musique d’ambiance en fond” Audio : Activé Durée : 6s
Le node génère une vidéo de présentation produit soignée avec audio IA synchronisé.
Clip pour les réseaux sociaux avec Sora 2
Modèle : Sora 2 Image de départ : Photographie de paysage Prompt : “Panoramique cinématique de gauche à droite, nuages dérivant dans le ciel, rayons de soleil perçant à travers” Ratio d’aspect : 9:16 Durée : 8s
Produit une vidéo verticale prête pour les plateformes de réseaux sociaux.
Narration multi-plans avec Kling v3
Modèle : Kling v3 Image de départ : Portrait d’un personnage Multi-prompt activé : oui Plans :
- “Gros plan du personnage regardant la caméra, sourire subtil” — 5s
- “La caméra recule pour révéler un skyline de ville au coucher du soleil derrière le personnage” — 5s
- “Plan aérien large de la ville au coucher du soleil” — 5s
Crée une vidéo narrative de 15 secondes en trois plans séquentiels, en maintenant la cohérence visuelle.
Vidéo à partir de références avec Seedance 2.0 Reference
Modèle : Seedance 2.0 Reference Références : 2 images, 1 vidéo, 1 audio Prompt : “@Image1 marche dans une forêt dans le style de @Image2. La caméra la suit par derrière le long du chemin montré dans @Video1. La bande son de @Audio1 accompagne la scène avec des chants d’oiseaux.” Durée : Auto Audio : Activé
Aucune image de départ n’est nécessaire. Le modèle compose la vidéo entièrement à partir des médias référencés et de la description du prompt. Chaque balise @Image, @Video et @Audio correspond à un connecteur d’entrée sur le node.
Bonnes pratiques
- Commencez avec des images de haute qualité. La qualité du résultat dépend directement de la résolution et de la netteté de l’image source.
- Soyez précis dans vos prompts. Décrivez les mouvements de caméra, les changements de lumière et les mouvements du sujet explicitement plutôt qu’avec des termes vagues.
- Choisissez le modèle adapté à vos besoins. Utilisez Veo 3.1 pour la haute résolution, Sora 2 pour les clips plus longs, Kling pour les narrations multi-plans ou la cohérence d’éléments, et Seedance 2.0 Reference pour les références multi-modales (images + vidéos + audio).
- Utilisez les images de fin pour des transitions contrôlées. Lorsque vous avez besoin que la vidéo arrive à un état final précis, fournissez une image de fin.
- Gardez les plans multi-prompt cohérents. Chaque plan doit s’enchaîner naturellement avec le suivant. Décrivez les transitions dans les prompts.
Problèmes courants
La qualité vidéo est faible ou floue Utilisez une image source de résolution plus élevée et augmentez le paramètre de résolution en sortie. Évitez d’upscaler de petites images avant de les utiliser en entrée.
Le mouvement ne correspond pas au prompt Soyez plus explicite sur le type de mouvement. Au lieu de “faire bouger”, décrivez exactement le mouvement de caméra ou l’action du sujet. Activez l’amélioration du prompt pour laisser le modèle affiner votre description.
L’audio est absent de la sortie
La génération audio IA est uniquement supportée par Veo 3.1. Vérifiez que generate_audio est activé et que vous utilisez un modèle Veo.
Les éléments ne sont pas reflétés dans la vidéo
Assurez-vous de référencer les éléments dans le prompt avec @Element1, @Element2, etc. Les éléments sont uniquement supportés par Kling v3 et Kling o3 Ref.
Seedance 2.0 Reference : l’audio est ignoré
Les références audio nécessitent au moins une image ou vidéo de référence. Assurez-vous d’avoir ajouté au moins un @Image ou @Video avant d’ajouter des entrées @Audio.
Nodes associés
Générer des images source à partir de prompts texte
Transformer et préparer les images avant l’animation
Combiner plusieurs clips vidéo en un seul
Extraire des images de vidéos pour les utiliser en entrée
Utiliser une image statique comme source vidéo