Ouvrir le Studio

Image to Video

Le node Image to Video anime une image statique en clip vidéo dynamique grâce à l'IA, avec support de plusieurs familles de modèles (Veo 3.1, Sora 2/Pro, Kling, Seedance 2.0).

Node Image to Video reliant image départ mouvement et sortie vidéo générée

À quoi sert le node Image to Video ?

Le node Image to Video transforme une image statique en un court clip vidéo animé à l’aide de modèles IA de génération vidéo. Il prend en charge plusieurs familles de modèles — chacune offrant des capacités différentes en matière de génération audio, contrôle de l’image de fin, médias de référence, narrations multi-plans et ratios d’aspect — et expose ces capacités via la même configuration canonique.

Cas d’usage typiques :

  • Animer une photo de produit en clip de présentation soigné, avec mouvement et audio.
  • Produire des vidéos verticales pour les réseaux sociaux à partir d’une seule image.
  • Construire des narrations multi-plans à partir d’une image de départ avec le mode multi-prompt de Kling.
  • Composer un clip à partir de références multi-modales (images + vidéos + audio) avec Seedance 2.0 Reference, sans aucune image de départ.

Configuration rapide

Suivez ces étapes pour ajouter et configurer le node Image to Video dans votre workflow :

Ajouter le node au canevas

Ouvrez la bibliothèque de nodes (Node Library), naviguez dans AI Nodes > AI_VIDEO, puis glissez-déposez le node Image to Video sur votre espace de travail.

Choisir un fournisseur et un modèle

Ouvrez les paramètres du node. Sélectionnez un Provider LLM, puis un Model spécifique (Veo 3.1, Sora 2 / Sora 2 Pro, Kling v3 / o3 / o3 Ref, Seedance 2.0, ou Seedance 2.0 Reference). Changer de famille de modèles réinitialise le ratio d’aspect, la durée, la résolution et les valeurs audio par défaut à celles de la nouvelle famille.

Connecter une image de départ (si requise)

Reliez une sortie image en amont au port input_start_frame. Requis pour Kling v3, Kling o3, Seedance 2.0. Optionnel pour Veo 3.1, Sora 2 / Pro, Kling o3 Ref. Entièrement masqué pour Seedance 2.0 Reference, qui utilise les références de seedance_refs_config à la place.

Rédiger le prompt

Dans la zone de prompt, décrivez le mouvement, la caméra, l’éclairage et le comportement du sujet. Utilisez {{variables}} pour le contenu dynamique. Référencez les entrées via @Element1, @Element2 (Kling) ou @Image1, @Video1, @Audio1 (Seedance 2.0 Reference).

Exécuter le workflow

Lancez le workflow. Le node renvoie le fichier vidéo généré sur le port output.

Paramètres de configuration

Panneau paramètres Image to Video famille modèle durée résolution références seedance kling veo sora

Le node expose un jeu de paramètres unifié ; le panneau de paramètres masque automatiquement ceux que la famille de modèles sélectionnée ne supporte pas.

Champs requis

Name string required default: Image to Video

Nom du node — Utile pour identifier ce node dans le canevas (ex : « Veo product clip » ou « Kling multi-shot intro »).

Description string required default: Transform static images into dynamic videos using AI models.

Description du node — Une courte phrase décrivant ce que ce node génère.

modelName LLM selection required

Modèle vidéo IA — Le modèle utilisé pour générer le clip. Chaque famille supporte des capacités différentes — voir le tableau comparatif ci-dessous.

prompt string required

Prompt — Description du mouvement et de l’animation à appliquer. Supporte {{variables}}, @Element1..N (Kling) et @Image1..9 / @Video1..3 / @Audio1..3 (Seedance 2.0 Reference). Requis sauf si multi_prompt_enabled est activé (auquel cas multi_prompt_config fournit un prompt par plan).

Champs optionnels

aspect_ratio string default: 16:9

Ratio d’aspect — Ratio d’aspect de la vidéo en sortie. Les valeurs autorisées varient selon la famille :

  • Veo 3.1 : 16:9, 9:16
  • Sora 2 / Sora 2 Pro : auto, 9:16, 16:9
  • Kling v3 / o3 / o3 Ref : 16:9, 9:16, 1:1
  • Seedance 2.0 / 2.0 Ref : auto, 21:9, 16:9, 4:3, 1:1, 3:4, 9:16
duration_seconds number default: 8

Durée en secondes — Plage/valeurs autorisées selon la famille :

  • Veo 3.1 : 4, 6 ou 8
  • Sora 2 / Sora 2 Pro : 4, 8 ou 12
  • Kling v3 / o3 / o3 Ref : entier 315
  • Seedance 2.0 / 2.0 Ref : 0 (Auto) ou entier 415
resolution string default: 1080p

Résolution de sortie — Valeurs autorisées par famille :

  • Veo 3.1 : 4K, 1080p, 720p
  • Sora 2 : auto, 720p
  • Sora 2 Pro : auto, 1080p, 720p
  • Kling v3 / o3 / o3 Ref : 1080p
  • Seedance 2.0 / 2.0 Ref : 720p, 480p
num_videos number default: 1

Nombre de vidéos — Combien de clips générer par exécution. Plage 12.

generate_audio boolean default: true

Génération audio — Ajouter une piste audio générée par IA au clip. Effectif uniquement sur Veo 3.1 et Seedance 2.0 / 2.0 Ref.

enhance_prompt boolean default: true

Amélioration du prompt — Laisser le fournisseur réécrire votre prompt avec plus de détail cinématique avant la génération.

negative_prompt string

Prompt négatif — Ce qu’il faut éviter dans la vidéo générée. Effectif uniquement sur les modèles Kling.

use_end_frame boolean default: false

Activer l’image de fin — Lorsqu’activé, expose un port dynamique input_end_frame. Connectez une image pour fixer le dernier plan. Supporté par Veo 3.1, Kling v3 / o3 / o3 Ref, Seedance 2.0.

use_reference_images boolean default: false

Activer les images de référence — Lorsqu’activé, expose un port dynamique input_reference_images pour la cohérence visuelle. Supporté par Veo 3.1 (jusqu’à 3) et Kling o3 Ref (jusqu’à 4).

elements_config json default: []

Éléments — Tableau JSON de définitions d’éléments, chacune { id, type: "image" | "video" }. Chaque élément expose son propre port d’entrée (input_element_<id>_frontal + input_element_<id>_references pour les images, input_element_<id>_video pour les vidéos) et est référencé dans le prompt par @Element<id>. Supporté par Kling v3 (max 4) et Kling o3 Ref (max 4).

seedance_refs_config json default: {"images":0,"videos":0,"audios":0}

Références Seedance — Objet JSON avec les nombres d’images, vidéos et audios de référence pour Seedance 2.0 Reference. Limites : 9 images, 3 vidéos, 3 audios, 12 au total. Chaque emplacement expose un connecteur d’entrée (input_seedance_image_N, input_seedance_video_N, input_seedance_audio_N) référencé via @Image1..9, @Video1..3, @Audio1..3 dans le prompt. Les références audio nécessitent au moins une référence image ou vidéo.

multi_prompt_enabled boolean default: false

Activer le multi-prompt — Composer le clip à partir de plusieurs plans séquentiels, chacun avec son propre prompt et sa durée. Supporté par Kling v3 et Kling o3 Ref.

multi_prompt_config json default: []

Plans multi-prompt — Tableau JSON de plans { prompt, duration }. Utilisé lorsque multi_prompt_enabled est activé. La durée totale cumulée ne doit pas dépasser 15s. Au moins un plan doit avoir un prompt non vide.

Tip

Changer de famille de modèles réinitialise aspect_ratio, duration_seconds, resolution, generate_audio, enhance_prompt, num_videos et negative_prompt aux valeurs par défaut de cette famille, et efface use_end_frame / use_reference_images / les éléments non supportés / le multi-prompt / les refs Seedance. Reconfigurez après le changement.

Que renvoie le node ?

Le node produit un ou plusieurs fichiers vidéo sur le port output. Vous pouvez connecter cette sortie à n’importe quel node aval acceptant une entrée vidéo ou fichier.

output video

Le clip vidéo généré (ou le tableau de clips lorsque num_videos > 1).

Comment récupérer l’output ?

Dans Draft & Goal, vous n’avez pas besoin de connaître un nom de variable généré par le système :

  1. Tirez un lien depuis le port output du node Image to Video.
  2. Connectez-le à l’entrée d’un node aval (Video Merger, Extract Video Frame, un node de stockage, etc.).
  3. Dans ce node suivant, créez et nommez votre propre variable (par exemple, intro_clip). La vidéo générée y sera automatiquement injectée.

Comparaison des modèles

FonctionnalitéVeo 3.1Sora 2Sora 2 ProKling v3Kling o3Kling o3 RefSeedance 2.0Seedance 2.0 Ref
Image de départOptionnelleOptionnelleOptionnelleRequiseRequiseOptionnelleRequiseMasquée
Ratios d’aspect16:9, 9:16auto, 9:16, 16:9auto, 9:16, 16:916:9, 9:16, 1:116:9, 9:16, 1:116:9, 9:16, 1:1auto, 21:9, 16:9, 4:3, 1:1, 3:4, 9:16auto, 21:9, 16:9, 4:3, 1:1, 3:4, 9:16
Durée4, 6, 8s4, 8, 12s4, 8, 12s3–15s3–15s3–15sAuto / 4–15sAuto / 4–15s
Résolution4K, 1080p, 720pauto, 720pauto, 1080p, 720p1080p1080p1080p720p, 480p720p, 480p
AudioOuiNonNonNonNonNonOuiOui
Image de finOuiNonNonOuiOuiOuiOuiNon
Images de référence3NonNonNonNon4NonNon
ÉlémentsNonNonNon4Non4NonNon
Multi-PromptNonNonNonOuiNonOuiNonNon
Refs SeedanceNonNonNonNonNonNonNon9 img + 3 vid + 3 audio (12 total)

Exemples d’utilisation

Cas 1 : Présentation produit avec Veo 3.1 et audio

Animer une photo de produit nette en clip de présentation de six secondes avec audio IA synchronisé.

Configuration :

  • modelName : Veo 3.1
  • input_start_frame : photo de produit sur fond blanc
  • prompt : Product slowly rotates with soft studio lighting, gentle reflections on surface, ambient background music
  • aspect_ratio : 16:9
  • duration_seconds : 6
  • resolution : 1080p
  • generate_audio : true
  • enhance_prompt : true

Le port output émet le clip MP4 soigné, prêt à être injecté dans un CMS ou un Video Merger.

Cas 2 : Narration multi-plans avec Kling v3

Construire une narration de trois plans de 15 secondes à partir d’un seul portrait de personnage.

Configuration :

  • modelName : Kling v3
  • input_start_frame : portrait du personnage
  • multi_prompt_enabled : true
  • multi_prompt_config :
[
  { "prompt": "Close-up of the character looking at the camera, subtle smile", "duration": 5 },
  { "prompt": "Camera pulls back to reveal a city skyline at sunset behind the character", "duration": 5 },
  { "prompt": "Wide aerial shot of the city as the sun sets", "duration": 5 }
]
  • aspect_ratio : 16:9
  • resolution : 1080p

Chaque plan hérite de l’identité visuelle de l’image de départ. La durée totale (15s) atteint exactement le plafond KLING_MAX_TOTAL_DURATION — ajouter un quatrième plan ferait échouer la validation.

Cas 3 : Composition multi-modale avec Seedance 2.0 Reference

Composer une scène en forêt à partir de deux images de référence, une vidéo de référence et une piste audio d’ambiance — sans aucune image de départ.

Configuration :

  • modelName : Seedance 2.0 Reference
  • seedance_refs_config : { "images": 2, "videos": 1, "audios": 1 }
  • Connecter les entrées : input_seedance_image_1, input_seedance_image_2, input_seedance_video_1, input_seedance_audio_1
  • prompt :
@Image1 is walking through a forest in the style of @Image2.
The camera follows her from behind as she moves along the path shown in @Video1.
The ambient soundtrack from @Audio1 plays throughout the scene with birds chirping.
  • duration_seconds : 0 (Auto)
  • generate_audio : true

Le port input_start_frame est masqué dans ce mode. Les quatre entrées de référence pèsent ensemble 4 / 12 du plafond Seedance.

Problèmes courants

Erreur de validation : « Image to Video requires a model to be selected »

Cause : Aucun modelName n’a été choisi, ou le LLM enregistré n’est plus disponible pour votre workspace.

Solution : Ouvrez le panneau de paramètres, choisissez un fournisseur, puis un modèle. Le node sélectionne automatiquement le premier LLM disponible au premier chargement si aucun modèle n’est enregistré.

Erreur de validation : « Total shot duration (Xs) exceeds maximum of 15s »

Cause : En mode multi-prompt, la somme des duration dans multi_prompt_config dépasse KLING_MAX_TOTAL_DURATION (15s).

Solution : Réduisez les durées des plans ou supprimez un plan jusqu’à ce que le total soit ≤ 15s.

Erreur de validation : « At least one shot prompt is required in multi-prompt mode »

Cause : multi_prompt_enabled est activé mais tous les plans dans multi_prompt_config ont un prompt vide.

Solution : Renseignez au moins un prompt de plan, ou désactivez multi_prompt_enabled et utilisez le champ prompt simple.

L'audio généré est absent

Cause : L’audio n’est produit que par Veo 3.1 et Seedance 2.0 / 2.0 Ref. Sur les autres familles, generate_audio est silencieusement ignoré.

Solution : Passez à un modèle Veo ou Seedance, et vérifiez que generate_audio est activé (Seedance l’active par défaut).

Les éléments ne se reflètent pas dans la sortie

Cause : Les références d’éléments dans le prompt ne correspondent pas aux id de elements_config, ou la famille de modèles courante ne supporte pas les éléments.

Solution : Référencez chaque élément exactement comme @Element1, @Element2, etc., en faisant correspondre les valeurs id de elements_config. Les éléments sont supportés uniquement par Kling v3 et Kling o3 Ref.

Seedance Reference : l'audio est ignoré

Cause : Seedance 2.0 Reference rejette les références audio si aucune référence image ou vidéo n’est fournie.

Solution : Ajoutez au moins une référence image (@Image1) ou vidéo (@Video1) avant d’ajouter des références @Audio.

Le port d'image de départ a disparu après changement de modèle

Cause : Vous êtes passé à Seedance 2.0 Reference, qui masque input_start_frame et utilise les références de seedance_refs_config à la place.

Solution : Utilisez les compteurs Seedance refs dans le panneau de paramètres pour ajouter des images/vidéos/audios de référence, et connectez ces entrées à la place.

Bonnes pratiques et pièges à éviter

Tip

Adaptez le modèle à l’objectif : Veo 3.1 pour la plus haute résolution et l’audio intégré, Sora 2 / Pro pour des clips uniques plus longs, Kling pour les narrations multi-plans ou la cohérence d’éléments, Seedance 2.0 pour des ratios d’aspect flexibles avec audio, Seedance 2.0 Reference lorsque vous avez besoin de véritables références multi-modales sans image de départ.

Warning

Attention au reset au changement de famille. Changer de famille de modèles réinitialise le ratio d’aspect, la durée, la résolution, l’audio, l’amélioration du prompt, num_videos et le prompt négatif aux valeurs par défaut de la nouvelle famille, et efface les bascules image de fin / images de référence, les éléments non supportés, le multi-prompt et les refs Seedance. Verrouillez d’abord le modèle, puis ajustez les paramètres — pas l’inverse.

Comment s’intègre-t-il dans un workflow ?

Image to Video se place typiquement entre une étape produisant une image et une étape consommant la vidéo :

graph LR
    Source[Text to Image / Static Image / photo scrapée] --> I2V[Image to Video]
    I2V --> Merger[Video Merger]
    I2V --> Frame[Extract Video Frame]
    Merger --> Storage[Stockage / CMS]

Nodes complémentaires