Ouvrir le Studio

Image to Video

Transformer des images statiques en vidéos dynamiques avec l'IA

v1.1 — AI Video

Info

Nouveautés — Avril 2026 — Ajout des modèles Seedance 2.0 et Seedance 2.0 Reference. Seedance 2.0 supporte l’image de fin, la génération audio, des rapports d’aspect flexibles (dont 21:9, 4:3, 3:4) et la durée automatique. Seedance 2.0 Reference génère des vidéos à partir de références multi-modales — jusqu’à 9 images, 3 vidéos et 3 fichiers audio référencés dans le prompt via @Image1, @Video1, @Audio1. Pas d’image de départ nécessaire en mode Reference.

Mises à jour précédentes

Avril 2026 (v1.1) — Support multi-fournisseurs

Support multi-fournisseurs (Veo 3.1, Sora 2/Pro, Kling v3/o3/o3 Ref), génération audio IA, amélioration automatique du prompt, support des images de fin et de référence, système d’éléments pour la cohérence de sujet/style, mode multi-prompt pour les vidéos multi-plans, résolution jusqu’à 4K et support du prompt négatif.

À quoi sert ce node ?

Le node Image to Video transforme des images statiques en vidéos dynamiques grâce à l’IA. Il supporte plusieurs fournisseurs de modèles, chacun offrant des capacités différentes comme la génération audio, le contrôle de l’image de fin, les images de référence et les narrations multi-plans.

Utilisations courantes :

  • Animer des photos de produits en vidéos de présentation soignées
  • Créer des vidéos engageantes pour les réseaux sociaux à partir de visuels statiques
  • Générer des clips cinématiques avec mouvements de caméra et effets
  • Construire des narrations multi-plans à partir d’une série d’images grâce au mode multi-prompt

Configuration rapide

Ajouter le node Image to Video

Trouvez-le dans AI NodesAI_VIDEOImage to Video

Connecter une image de départ

Connectez une sortie image à l’entrée input_start_frame. C’est l’image qui sera animée.

Sélectionner un modèle et décrire le mouvement

Choisissez un modèle (ex. Veo 3.1, Sora 2, Kling v3, Seedance 2.0) et rédigez un prompt décrivant le mouvement et l’animation souhaités.

Exécuter le workflow

Lancez le workflow. Le node produit un fichier vidéo en sortie.

Configuration

Modèle

modelName LLM selection required

Le modèle IA à utiliser pour la génération vidéo. Chaque famille de modèles offre des capacités différentes — consultez le tableau comparatif ci-dessous.

Prompt

prompt string required

Description du mouvement et de l’animation souhaités. Supporte les {{variables}} pour le contenu dynamique. Vous pouvez référencer les entrées connectées avec @Element1, @Element2 (Kling), ou @Image1, @Video1, @Audio1 (Seedance 2.0 Reference).

Exemples :

  • “Zoom cinématique lent, transitions de lumière douces”
  • “Le produit tourne à 360 degrés sur un fond blanc”
  • “La caméra panoramique de gauche à droite sur le paysage, les nuages bougent”
  • “@Image1 marche dans une forêt dans le style de @Image2. La bande son de @Audio1 accompagne la scène.” (Seedance 2.0 Ref)

Audio

generate_audio boolean default: true

Activer la génération audio IA pour la vidéo. Supporté par Veo 3.1 et les modèles Seedance 2.0 (activé par défaut sur Seedance).

Amélioration du prompt

enhance_prompt boolean default: true

Laisser l’IA améliorer votre prompt pour de meilleurs résultats. Le modèle réécrit votre prompt avec plus de détails et de direction cinématique.

Ratio d’aspect

aspect_ratio string default: 16:9

Ratio d’aspect de la vidéo en sortie. Les options disponibles varient selon le modèle :

  • Veo 3.1 : 16:9, 9:16
  • Sora 2 / Sora 2 Pro : Auto, 9:16, 16:9
  • Kling v3 / o3 / o3 Ref : 16:9, 9:16, 1:1
  • Seedance 2.0 / 2.0 Ref : Auto, 21:9, 16:9, 4:3, 1:1, 3:4, 9:16

Durée

duration_seconds number default: 8

Durée de la vidéo en secondes. La plage varie selon le modèle :

  • Veo 3.1 : 4–8s
  • Sora 2 / Sora 2 Pro : 4, 8 ou 12s
  • Kling v3 / o3 / o3 Ref : 3–15s
  • Seedance 2.0 / 2.0 Ref : Auto, ou 4–15s

Nombre de vidéos

num_videos number default: 1

Nombre de vidéos à générer (1–2).

Résolution

resolution string default: 1080p

Résolution de la vidéo en sortie. Les options disponibles varient selon le modèle (jusqu’à 4K sur les modèles supportés).

Prompt négatif

negative_prompt string

Décrivez ce que vous souhaitez éviter dans la vidéo générée. Supporté uniquement par les modèles Kling.

Exemple : “flou, basse qualité, visages déformés, filigrane”

Image de fin

use_end_frame boolean default: false

Activer le support de l’image de fin. Lorsqu’activé, une entrée dynamique input_end_frame apparaît. Connectez une image pour définir comment la vidéo doit se terminer. Supporté par Veo 3.1, les modèles Kling et Seedance 2.0.

Images de référence

use_reference_images boolean default: false

Activer les images de référence pour la cohérence visuelle. Lorsqu’activé, une entrée dynamique input_reference_images apparaît. Supporté par Veo 3.1 (jusqu’à 3 images) et Kling o3 Ref (jusqu’à 4 images).

Éléments

elements_config json

Tableau de configurations d’éléments, chacun avec un id et un type (image ou vidéo). Les entrées d’éléments connectés peuvent être référencées dans le prompt via @Element1, @Element2, etc. pour maintenir la cohérence de sujet ou de style dans la vidéo. Supporté par Kling v3 (jusqu’à 4) et Kling o3 Ref (jusqu’à 4).

Références Seedance

seedance_refs_config json

Configurer les entrées de référence multi-modales pour Seedance 2.0 Reference. Ce modèle n’utilise pas d’image de départ — tous les médias sont fournis comme références nommées et cités dans le prompt.

Utilisez les compteurs dans le panneau de configuration pour ajouter des références :

  • Images (@Image1@Image9) : Jusqu’à 9 images de référence. JPEG, PNG ou WebP. Max 30 Mo chacune.
  • Vidéos (@Video1@Video3) : Jusqu’à 3 vidéos de référence. MP4 ou MOV. Résolution 480p–720p, durée combinée 2–15s, taille totale inférieure à 50 Mo.
  • Audio (@Audio1@Audio3) : Jusqu’à 3 fichiers audio. MP3 ou WAV. Max 15 Mo chacun, durée combinée max 15s. Nécessite au moins 1 image ou vidéo.

Le total toutes modalités confondues ne doit pas dépasser 12. Chaque référence crée un connecteur d’entrée sur le node. Référencez-les dans votre prompt avec @Image1, @Video1, @Audio1, etc.

Exemple de prompt :

@Image1 marche dans une forêt dans le style de @Image2.
La caméra la suit par derrière le long du chemin montré dans @Video1.
La bande son de @Audio1 accompagne la scène avec des chants d'oiseaux.

Multi-Prompt

multi_prompt_enabled boolean default: false

Activer la génération vidéo multi-plans. Lorsqu’activé, la vidéo est composée de plusieurs plans séquentiels, chacun avec son propre prompt et sa durée.

multi_prompt_config json

Tableau de définitions de plans, chacun contenant un prompt et une duration. Utilisé lorsque multi_prompt_enabled est activé. Supporté par Kling v3 et Kling o3 Ref.

Exemple :

[
  { "prompt": "Gros plan du produit sur une table", "duration": 5 },
  { "prompt": "La caméra recule pour révéler la scène complète", "duration": 5 }
]

Comparaison des modèles

FonctionnalitéVeo 3.1Sora 2Sora 2 ProKling v3Kling o3Kling o3 RefSeedance 2.0Seedance 2.0 Ref
Image de départOptionnelleOptionnelleOptionnelleRequiseRequiseOptionnelleRequiseNon
Ratios d’aspect16:9, 9:16Auto, 9:16, 16:9Auto, 9:16, 16:916:9, 9:16, 1:116:9, 9:16, 1:116:9, 9:16, 1:1Auto, 21:9, 16:9, 4:3, 1:1, 3:4, 9:16Auto, 21:9, 16:9, 4:3, 1:1, 3:4, 9:16
Durée4–8s4, 8, 12s4, 8, 12s3–15s3–15s3–15sAuto, 4–15sAuto, 4–15s
Résolution4K, 1080p, 720pAuto, 720pAuto, 1080p, 720p1080p1080p1080p720p, 480p720p, 480p
AudioOuiNonNonOuiOuiNonOuiOui
Image de finOuiNonNonOuiOuiOuiOuiNon
Références3 imagesNonNonNonNon4 imagesNon9 images, 3 vidéos, 3 audio
ÉlémentsNonNonNon4 maxNon4 maxNonNon
Multi-PromptNonNonNonOuiNonOuiNonNon

Sortie

output video

Le fichier vidéo généré.

Exemples

Animation produit avec Veo 3.1

Modèle : Veo 3.1 Image de départ : Photo de produit sur fond neutre Prompt : “Le produit tourne lentement avec un éclairage studio doux, reflets subtils sur la surface, musique d’ambiance en fond” Audio : Activé Durée : 6s

Le node génère une vidéo de présentation produit soignée avec audio IA synchronisé.

Clip pour les réseaux sociaux avec Sora 2

Modèle : Sora 2 Image de départ : Photographie de paysage Prompt : “Panoramique cinématique de gauche à droite, nuages dérivant dans le ciel, rayons de soleil perçant à travers” Ratio d’aspect : 9:16 Durée : 8s

Produit une vidéo verticale prête pour les plateformes de réseaux sociaux.

Narration multi-plans avec Kling v3

Modèle : Kling v3 Image de départ : Portrait d’un personnage Multi-prompt activé : oui Plans :

  1. “Gros plan du personnage regardant la caméra, sourire subtil” — 5s
  2. “La caméra recule pour révéler un skyline de ville au coucher du soleil derrière le personnage” — 5s
  3. “Plan aérien large de la ville au coucher du soleil” — 5s

Crée une vidéo narrative de 15 secondes en trois plans séquentiels, en maintenant la cohérence visuelle.

Vidéo à partir de références avec Seedance 2.0 Reference

Modèle : Seedance 2.0 Reference Références : 2 images, 1 vidéo, 1 audio Prompt : “@Image1 marche dans une forêt dans le style de @Image2. La caméra la suit par derrière le long du chemin montré dans @Video1. La bande son de @Audio1 accompagne la scène avec des chants d’oiseaux.” Durée : Auto Audio : Activé

Aucune image de départ n’est nécessaire. Le modèle compose la vidéo entièrement à partir des médias référencés et de la description du prompt. Chaque balise @Image, @Video et @Audio correspond à un connecteur d’entrée sur le node.

Bonnes pratiques

  • Commencez avec des images de haute qualité. La qualité du résultat dépend directement de la résolution et de la netteté de l’image source.
  • Soyez précis dans vos prompts. Décrivez les mouvements de caméra, les changements de lumière et les mouvements du sujet explicitement plutôt qu’avec des termes vagues.
  • Choisissez le modèle adapté à vos besoins. Utilisez Veo 3.1 pour la haute résolution, Sora 2 pour les clips plus longs, Kling pour les narrations multi-plans ou la cohérence d’éléments, et Seedance 2.0 Reference pour les références multi-modales (images + vidéos + audio).
  • Utilisez les images de fin pour des transitions contrôlées. Lorsque vous avez besoin que la vidéo arrive à un état final précis, fournissez une image de fin.
  • Gardez les plans multi-prompt cohérents. Chaque plan doit s’enchaîner naturellement avec le suivant. Décrivez les transitions dans les prompts.

Problèmes courants

La qualité vidéo est faible ou floue Utilisez une image source de résolution plus élevée et augmentez le paramètre de résolution en sortie. Évitez d’upscaler de petites images avant de les utiliser en entrée.

Le mouvement ne correspond pas au prompt Soyez plus explicite sur le type de mouvement. Au lieu de “faire bouger”, décrivez exactement le mouvement de caméra ou l’action du sujet. Activez l’amélioration du prompt pour laisser le modèle affiner votre description.

L’audio est absent de la sortie La génération audio IA est uniquement supportée par Veo 3.1. Vérifiez que generate_audio est activé et que vous utilisez un modèle Veo.

Les éléments ne sont pas reflétés dans la vidéo Assurez-vous de référencer les éléments dans le prompt avec @Element1, @Element2, etc. Les éléments sont uniquement supportés par Kling v3 et Kling o3 Ref.

Seedance 2.0 Reference : l’audio est ignoré Les références audio nécessitent au moins une image ou vidéo de référence. Assurez-vous d’avoir ajouté au moins un @Image ou @Video avant d’ajouter des entrées @Audio.

Nodes associés