Tutoriel : comment avoir le même visage sur plusieurs images IA différentes ?
Personnages cohérents dans une série d’images : quels outils utilisent le « face consistency », comment les utiliser, et les limites à connaître.
Tu veux créer une série. Une bande dessinée. Un storyboard. Des visuels pour une marque. Le personnage doit avoir le même visage d’une image à l’autre. Or, en générant image par image avec un prompt classique, l’IA invente un nouveau visage à chaque fois. La solution : utiliser des outils qui gèrent la cohérence du visage (face consistency, character reference) : tu fournis une photo ou une image de référence, et les générations suivantes réutilisent ce visage. Ce tutoriel t’explique quels outils le font, comment les utiliser, et ce qu’on peut en attendre.
C’est un des défis les plus demandés : garder une identité à travers plusieurs scènes. En cinéma, c’est l’acteur. En IA, c’est une référence (photo ou image générée) que le moteur utilise comme « ancrage ». Les techniques varient selon les outils : certains ont un champ « reference image » ou « character », d’autres demandent d’inclure la référence dans le prompt avec une image jointe.
Typiquement : image 1, le personnage dans un café ; image 2, le même dans un parc ; image 3, le même dans un bureau. Si tu génères chaque image séparément avec « femme brune, 30 ans », tu obtiendras trois visages différents. Pour garder le même, tu dois ancrer l’identité : une image de référence que le moteur utilisera comme modèle. Ce n’est pas encore parfait à 100 % — selon l’angle, l’éclairage, le visage peut légèrement dériver — mais c’est déjà une nette amélioration. Plus la référence est nette et de face, plus la cohérence tient.
Une référence claire (visage de face, bien éclairé) donne de bien meilleurs résultats. Flou, de profil ou mal recadré = cohérence fragile.
On va faire : quels outils proposent la cohérence de visage, comment fournir la référence, comment générer les images suivantes, et les pièges à éviter.
Quels outils permettent d’avoir le même visage
| Outil | Fonctionnalité | Comment ça marche |
|---|---|---|
| ChatGPT (DALL·E) | Image + prompt « garde ce visage » | Envoyer une image du visage + demander une nouvelle scène en gardant le personnage |
| Midjourney | Référence avec --cref ou image dans le prompt | Image de référence + prompt ; ou caractère sauvegardé (selon versions) |
| Runway / Pika (vidéo) | Personnage cohérent en vidéo | Référence image pour le personnage |
| Stable Diffusion (ComfyUI, etc.) | IP-Adapter, InstantID, LoRA visage | Image de référence + modèle ; plus technique |
| Outils dédiés (Replicate, Fal.ai) | APIs « face swap » ou « character consistency » | Upload référence + prompt pour chaque image |
En débutant : ChatGPT (DALL·E) avec image de référence dans la conversation, ou Midjourney avec une image de référence (--cref ou équivalent selon la version). Les autres options demandent plus de mise en place.
Méthode 1 : ChatGPT (DALL·E) — référence dans la conversation
Principe : Tu envoies une image du visage (ou du personnage) dans le chat. Tu demandes : « Génère une nouvelle image avec ce même personnage dans [nouvelle scène]. Garde le visage identique. » DALL·E s’appuie sur l’image fournie pour maintenir une certaine cohérence. Ce n’est pas parfait à 100 %, mais c’est simple et accessible.
Étapes :
- Prépare une photo de référence : visage de face, bien éclairé, si possible seul (pas cinq personnes).
- Ouvre ChatGPT (avec accès image / DALL·E). Envoie l’image dans le chat avec un message du type : « Voici la référence du personnage. Garde ce visage pour les prochaines images. »
- Pour chaque nouvelle image, demande par exemple : « Génère une image de ce même personnage en train de lire dans un café, style photo réaliste. »
- Si le visage dérive trop, renvoie la référence + la dernière image correcte et précise : « Corrige en gardant exactement ce visage. »
Tu n’as pas besoin de commande spéciale. Tu peux aussi envoyer d’abord une image de référence et demander dans le message suivant : « Génère une nouvelle image avec ce même personnage dans [autre scène]. Garde le visage identique. »
Exemple de message :
Voici une photo de référence du personnage. Génère maintenant une image de ce même personnage (même visage) debout devant une bibliothèque, tenue décontractée, lumière douce. Style photo réaliste.
Plus la référence est claire et plus le prompt insiste sur « même visage », mieux c’est.
Méthode 2 : Midjourney — image de référence (--cref)
Midjourney propose (selon les versions) une option pour attacher une image de référence au prompt. Tu uploades une image du personnage, tu la joins à ta commande /imagine, et tu ajoutes éventuellement --cref (character reference) si disponible. La syntaxe évolue ; consulte la doc officielle. En général : /imagine + [lien ou pièce jointe de l’image de référence] + ta description de scène. Le bot génère une image en s’inspirant du visage de la référence. Pour les images suivantes, tu réutilises la même référence.
Workflow type : génère ou choisis une première image du personnage (portrait de face). Uploade-la comme référence. Pour l’image 2 : /imagine [référence] personnage dans un parc, style photo. Pour l’image 3 : /imagine [même référence] personnage au bureau. Tu gardes la référence identique à chaque fois.
Workflow pas à pas : première série cohérente
Étape 1 : Créer ou choisir l’image de référence
Idéal : un portrait de face ou trois-quarts, bien éclairé, fond simple. Une seule personne. Évite le flou, le profil extrême, les lunettes opaques. Si tu n’as pas de photo, génère d’abord une image « portrait, femme 30 ans, sourire, fond neutre » et utilise cette image comme référence pour la suite.
Étape 2 : Envoyer la référence à l’outil
ChatGPT : envoie l’image dans le chat avec un court message (« Référence du personnage pour les prochaines images »). Midjourney : uploade l’image sur le serveur (drag & drop dans un canal), récupère le lien, ou utilise l’option de pièce jointe si disponible dans /imagine.
Étape 3 : Générer la première « scène » avec le personnage
Demande une image avec le même personnage dans une scène précise. Exemple : « Ce même personnage dans un café, assis à une table, lumière du matin, style photo réaliste. » Vérifie le résultat. Si le visage est proche de la référence, tu as ancré l’identité. Si non, renvoie la référence et précise « garde exactement ce visage ».
Étape 4 : Enchaîner les images suivantes
Pour chaque nouvelle image, réutilise la même référence (ou la même conversation avec la référence déjà envoyée). Change uniquement la scène dans le prompt. « Même personnage, dans un parc, automne, feuilles au sol. » « Même personnage, au bureau, ordinateur portable, lumière naturelle. » Plus tu gardes la référence active, plus la cohérence tient.
Scénarios réels
Scénario 1 — Série de posts pour une marque. Julie crée un personnage « ambassadeur » pour des visuels lifestyle. Elle génère d’abord un portrait de face avec DALL·E. Elle l’envoie dans ChatGPT avec : « Garde ce visage pour les prochaines images. » Elle demande : même personnage dans un salon, puis dans une cuisine, puis en extérieur. Elle récupère trois images avec un visage cohérent. Elle les utilise pour la campagne. Une dérive légère sur une image ; elle la refait en renvoyant la référence.
Scénario 2 — Mini-bande dessinée. Thomas veut quatre cases avec le même héros. Il utilise Midjourney avec une image de référence (portrait du personnage). Il génère case 1 : personnage en colère. Case 2 : même personnage surpris. Case 3 : même personnage qui court. Case 4 : même personnage qui sourit. Il garde la même référence à chaque /imagine. Les visages restent reconnaissables ; les expressions varient grâce au prompt.
Scénario 3 — Storyboard pour un client. Sophie doit proposer trois visuels « même personne, trois situations ». Elle n’a pas de photo du client. Elle génère une première image « femme professionnelle, 40 ans, sourire, tenue business, fond neutre ». Elle utilise cette image comme référence. Elle demande : même personnage en réunion ; même personnage au téléphone ; même personnage devant un tableau. Le client valide la direction ; la cohérence du visage renforce la série.
Ce que les débutants se trompent (et comment corriger)
Erreur 1 : Référence de mauvaise qualité. Image floue, de profil, ou avec plusieurs visages. Correction : une seule personne, face ou trois-quarts, nette, bien éclairée. Si tu n’as qu’une photo de profil, génère d’abord un « portrait de face » à partir d’une description et utilise-le comme référence.
Erreur 2 : Changer de référence à chaque image. Tu uploades une image différente pour l’image 1 et l’image 2. Les visages ne matchent pas. Correction : garde une référence pour toute la série. Ne la change que si tu introduis un nouveau personnage.
Erreur 3 : Ne pas préciser « même visage » ou « same character ». » L’IA peut interpréter uniquement la scène. Correction : ajoute « garde ce visage », « same character », « same face » dans chaque demande. Ça renforce l’ancrage.
Erreur 4 : Scènes trop différentes d’un coup. Passer d’un portrait en studio à un plan large en extérieur avec dix personnages peut faire dériver le visage. Correction : enchaîne des scènes progressivement similaires (même type de plan, même éclairage) ou renvoie la référence pour les plans les plus complexes.
Erreur 5 : Abandonner après une dérive. Une image sur trois a un visage un peu différent. Correction : relance avec la référence + « corrige en gardant exactement ce visage ». Choisis la meilleure parmi plusieurs générations.
| Problème | Piste de solution |
|---|---|
| Visage qui dérive | Renvoyer la référence ; préciser « same face », « identical » |
| Référence refusée ou ignorée | Vérifier que l’image est bien jointe ; utiliser une référence plus simple (portrait seul) |
| Plusieurs personnages dans la scène | Préciser « the person on the left » ou décrire lequel garder ; ou une seule personne par image |
| Rendu trop stylisé | Ajouter « photo realist », « natural lighting » pour ancrer le réalisme du visage |

Pour voir la mise en place d’une référence et la génération d’une série cohérente, cette vidéo est une bonne ressource.
CRÉER UN INFLUENCER IA DE A À Z (Tutoriel complet + Outils)
Tu y verras comment ancrer un personnage et enchaîner les scènes sans perdre le visage.
Limites à connaître
La cohérence n’est pas garantie à 100 %. Angles extrêmes (dos, profil serré), éclairage très différent, ou scènes très chargées peuvent faire dériver le visage. Une référence de face, des prompts qui rappellent « same character », et des itérations (relancer si besoin) maximisent les chances. Pour des projets très exigeants (pub, couverture), un passage par un outil dédié (Runway pour la vidéo, ou APIs character consistency) ou un retoucheur peut compléter le travail.

Foire aux questions (FAQ)
Quel outil pour avoir le même visage sur plusieurs images ?
ChatGPT (DALL·E) avec une image de référence dans la conversation est le plus simple pour débuter. Midjourney avec une image de référence (--cref ou pièce jointe) permet aussi de garder un personnage cohérent. Les deux demandent de fournir une référence à chaque série.
Comment fournir la référence avec ChatGPT ?
Envoie l’image dans le chat (bouton trombone ou « + »). Dans le même message ou le suivant, écris que c’est la référence du personnage et demande une nouvelle scène « avec ce même personnage », « garde ce visage ».
La référence doit-elle être une vraie photo ?
Non. Tu peux utiliser une image déjà générée par l’IA (portrait de face) comme référence. L’important est qu’elle soit nette, de face ou trois-quarts, et une seule personne.
Pourquoi le visage change quand même un peu ?
Les modèles ne garantissent pas une cohérence parfaite. L’angle, l’éclairage et la complexité de la scène influencent le rendu. Une référence claire et des prompts explicites (« same face ») limitent la dérive. Tu peux relancer si une image s’éloigne trop.
Puis-je avoir plusieurs personnages cohérents dans une série ?
Oui, mais c’est plus complexe. Il faut une référence par personnage et préciser dans le prompt lequel est lequel (« person on the left », « woman in red »). Beaucoup préfèrent une seule personne par image pour garder le contrôle.
Midjourney --cref, comment ça marche ?
Selon la version, Midjourney permet d’attacher une image de référence (URL ou upload) et d’utiliser --cref pour « character reference ». La doc officielle Midjourney donne la syntaxe à jour. En général : /imagine [référence] + description de la scène.
Les images avec le même visage sont-elles utilisables commercialement ?
Cela dépend des CGU de l’outil (OpenAI, Midjourney) et des droits sur l’image de référence (si c’est une photo de quelqu’un, tu dois avoir son accord). Consulte les conditions d’utilisation.
Que faire si DALL·E ne garde pas le visage ?
Renvoyer la référence dans le même message que la demande. Préciser « exact same face », « identical face to the reference ». Si ça échoue encore, simplifier la scène (moins de personnages, plan plus serré) ou essayer une autre référence (portrait encore plus net).
Continuer la lecture
- Apprendre à agrandir une image floue avec l'IA sans perdre en qualité (tuto)
Upscaling et défloutage : quels outils utiliser, comment les utiliser, et ce qu’on peut vraiment attendre (et ne pas attendre) de l’IA.
- Tutoriel débutant : comment créer sa toute première image par IA (gratuitement)
Aucun logiciel à installer, aucune carte bancaire. Un navigateur, un compte gratuit et une phrase : voici comment obtenir votre première image générée par IA, pas à pas.
- Tutoriel : comment enlever le fond d'une image en 2 secondes avec l'IA
Sujet isolé, fond transparent ou nouveau fond : les outils gratuits et la marche à suivre pour enlever le fond d’une image en quelques clics.
