L'art du prompt engineering pour les photographes professionnels
Passer de la prise de vue à la génération IA sans perdre ton œil de photographe : vocabulaire, structure des prompts et pièges à éviter pour des rendus pro.
Tu passes des heures à choisir ton objectif, ta lumière, ton cadrage. Puis tu ouvres un générateur d’images IA, tu écris « beautiful portrait » et tu obtiens quelque chose de plat, de générique, qui ne ressemble en rien à ce que tu aurais shooté. Ce n’est pas l’IA qui est nulle , c’est qu’on ne lui a pas parlé en photographe. Le prompt engineering pour un pro de l’image, c’est exactement ça : traduire tes décisions de prise de vue en mots que le moteur comprend. Pas des formules magiques. Des choix lisibles.
Ici, on ne te vend pas de « tips & tricks » en trois lignes. On pose les bases pour que tu gardes ton œil, ta logique de cadrage et d’éclairage, et que tes rendus IA deviennent reproductibles et intentionnels. Comme en studio, mais en texte.
Pourquoi un photographe a un avantage (et un piège)
Tu connais déjà la direction de la lumière, le ratio key/fill, les plans (large, medium, close-up), la profondeur de champ. Tu sais ce qu’est un Rembrandt, un butterfly, un contre-jour. Tout ça, les modèles d’IA ont été entraînés sur des millions d’images qui respectent ces règles. Donc quand tu écris « key light from upper left, 45°, soft fill 2:1 », tu parles la même langue que les données. L’avantage : tu n’as pas à tout apprendre. Le piège : croire que « ça ressemble à une photo » suffit. L’IA produit souvent des images trop propres, sans accident, sans grain, sans la petite imperfection qui fait vrai. Ton job devient d’ajouter ces contraintes dans le prompt et en post-traitement.
Pour structurer tes prompts comme un vrai brief, la structuration en 5 règles façon directeur artistique te donne un cadre : sujet, cadrage, lumière, style, cohérence. Même logique qu’en photo , appliquée au texte.
Le vocabulaire que l’IA reconnaît (et celui qu’elle ignore)
Les moteurs (Midjourney, Flux, Stable Diffusion, DALL·E) ont été nourris de métadonnées de photos : termes techniques en anglais. « Beautiful », « amazing », « professional » sont trop vagues ; ils diluent l’intention. En revanche, ces termes-là pèsent lourd :
Cadrage et échelle.
« Wide shot », « medium close-up », « extreme close-up », « full body », « Dutch angle », « over the shoulder ». « Subject in lower third », « rule of thirds », « centered ». Si tu ne les mets pas, le moteur choisit , souvent un plan moyen, centré.
Lumière.
« Key light from upper left », « soft fill », « rim light on the right shoulder », « backlit », « Rembrandt lighting », « butterfly lighting », « low key », « high key ». « Hard light » vs « soft light ». « Golden hour », « blue hour », « tungsten », « daylight ». Pour une liste complète exploitable en pub et cinéma, l’éclairage cinématographique en prompt détaille direction, qualité, ratio et couleur.
Objectif et rendu.
« 35mm », « 85mm », « 24mm wide », « anamorphic », « shallow depth of field », « bokeh ». « Film grain », « natural skin texture », « cinematic stills », « cinema photography ». Ces mots ancrent le rendu dans une grammaire photo/cinéma au lieu d’un look « rendu 3D » ou smartphone.
Ce qui ne marche pas (ou mal).
« Artistic », « creative », « stunning » , flou. « Like a Nikon » , trop vague. « Symétrique » sans préciser « centered, symmetrical composition » , souvent ignoré. Et surtout : un seul sujet et une seule action par prompt. « Woman in red dress and man in suit in a car at sunset » donne des mélanges bizarres. Un plan = une idée.
Scénarios concrets : du brief client au prompt final
Scénario 1 , Portrait éditorial pour un magazine.
Le client veut une femme, 30–40 ans, regard caméra, ambiance sobre, lumière naturelle. Tu penses : fenêtre à gauche, fill doux, peu d’ombres dures, 85mm pour le flou. En prompt : « Woman, 30s, direct gaze at camera, medium close-up, soft key light from frame left (window), minimal fill, natural skin texture, 85mm, shallow DOF, neutral background, cinematic stills, cinema photography, film grain, no makeup look. » Tu évites « beautiful » ; tu décris la physique de la scène.
Scénario 2 , Packshot cosmétique, fond noir.
Un flacon, reflets maîtrisés, une seule source pour sculpter les bords. « Perfume bottle on black surface, single soft key from top left, subtle rim left edge, controlled reflections, 85mm, shallow DOF, luxury product photography, cinematic stills, no text. » Chaque élément correspond à une décision que tu aurais prise en studio.
Scénario 3 , Série lifestyle pour une marque outdoor.
Il faut cinq images cohérentes : même lumière, même palette, mêmes échelles. Tu rédiges un squelette et tu ne changes que le sujet ou l’action. Squelette : « [SUJET], [ACTION], medium shot, golden hour backlit, warm key cool fill, 35mm, cinematic stills, film grain, outdoor. » Image 1 : « Hiker with backpack, walking on ridge ». Image 2 : « Woman in windbreaker, looking at horizon ». Etc. La génération de visuels publicitaires cohérents et l’usage d’une style reference (--sref) t’aident à figer l’esthétique sur toute la série.
Workflow en 5 étapes : de l’intention au rendu
-
Définir l’intention en une phrase.
Ex. : « Portrait sobre, lumière fenêtre gauche, 85mm, fond neutre. » Si tu ne peux pas la résumer, le prompt sera flou. -
Traduire en ordre : sujet → cadrage → lumière → technique.
Sujet et action en premier (le moteur pondère le début). Puis cadrage, puis lumière, puis objectif et style. Ex. : « Woman, direct gaze, medium close-up, soft key left, 85mm, cinematic stills, film grain. » -
Ajouter les « anti-générique ».
Pour casser le côté lisse IA : « natural skin texture », « film grain », « practical light », « subtle imperfections ». Une seule source de lumière (« single key ») aide aussi à éviter le tout-éclairé plat. -
Négatif si besoin.
Sur Stable Diffusion (et autres) : « blurry, oversaturated, cartoon, 3D render, plastic skin, symmetrical face ». Pour aller plus loin sur les negative prompts et les aberrations, un article dédié couvre les formulations qui évitent les échecs courants. -
Itérer un paramètre à la fois.
Si la lumière est trop dure, change seulement « hard key » en « soft key ». Si le plan est trop large, ajoute « medium close-up ». Ne pas tout modifier d’un coup , sinon tu ne sais pas ce qui a marché.
> Un bon prompt de photographe, c’est un brief de plateau : qui, quoi, comment c’est éclairé, avec quoi c’est tourné.
Ce que les débutants se trompent (et comment corriger)
Trop de mots vagues en début de prompt.
« Beautiful professional cinematic portrait of a woman » , « beautiful » et « professional » n’apportent pas d’info. Correction : Mettre en premier le sujet et l’action : « Woman, direct gaze, medium close-up », puis la lumière et la technique.
Mélanger plusieurs idées dans une phrase.
« Wide shot of a car and close-up of the driver’s face » , le moteur mélange. Correction : Un prompt = un plan. Une image pour la voiture, une autre pour le visage.
Oublier la lumière.
Sans indication, tu obtiens un éclairage « par défaut », souvent plat. Correction : Au minimum une direction (« key from left ») et une qualité (« soft » ou « hard »). Réutilise la même logique que pour l’éclairage cinéma : source, direction, ratio.
Négliger la cohérence en série.
Chaque image est belle seule mais ne matche pas avec les autres. Correction : Même phrase lumière et mêmes termes technique (focale, grain, style) dans tous les prompts. Ou utiliser une image de référence (--sref sur Midjourney) pour verrouiller le look.
Accepter le rendu « IA ».
Peau lisse, pas de grain, éclairage trop parfait. Correction : Ajouter « natural skin texture », « film grain », « subtle bokeh », « single key light ». Et en post, un grain ou un léger teinte peuvent rapprocher du rendu film.
| Problème | Piste de solution |
|---|---|
| Rendu trop lisse, « plastique » | « Natural skin texture », « film grain », « practical light », « shallow DOF ». |
| Cadrage jamais respecté | Mettre le plan en début : « Medium close-up, woman… » ou « Wide shot, car… ». |
| Lumière incohérente entre images | Copier-coller la même phrase lumière ; ou utiliser --sref / image reference. |
| Moteur invente des détails | Être plus précis sur le sujet ; utiliser le negative prompt pour interdire « extra limbs », « text ». |

Outils et où aller plus loin
Midjourney, Flux (Pro, Schnell), Stable Diffusion, DALL·E : chacun a ses forces. Pour du photorealisme et de la cohérence de personnage, Flux et les workflows Midjourney V8 (dont --sref) sont précieux. Pour du contrôle total (negative prompt, modèles custom), Stable Diffusion reste roi. Le guide pour devenir prompt engineer en autodidacte et l’article sur quand le prompt ne fonctionne pas t’aident à débloquer les cas difficiles.
Ressource vidéo : Pour voir un photographe ajuster ses prompts en direct (sujet, lumière, style), recherchez sur YouTube « prompt engineering photography » ou « Midjourney portrait workflow » ; une démo en conditions réelles complète bien la lecture.
Questions fréquentes (FAQ)
En français ou en anglais ?
Anglais pour les prompts. Les modèles sont entraînés majoritairement sur du texte anglais. Garde le français pour tes briefs et tes notes ; le prompt final, en anglais.
Faut-il tout écrire en une seule ligne ?
Non. Tu peux aller à la ligne pour te relire ; beaucoup d’interfaces concatènent. L’important est l’ordre : sujet → cadrage → lumière → technique.
Comment garder le même visage sur plusieurs images ?
C’est encore la limite la plus dure. Sur Midjourney, --sref (style reference) et parfois --cref (character reference) aident. Sur Flux ou SD, des LoRAs ou images de référence donnent de meilleurs résultats. On détaille la cohérence visuelle et la régularité du visage dans un article dédié.
Mon rendu est toujours trop « IA ». Que faire ?
Ajoute systématiquement : « natural skin texture », « film grain », « cinematic stills », « cinema photography ». Privilégie « single key light » ou « practical light » pour éviter l’éclairage uniforme. En post, un grain 35mm et un léger grade rapprochent du film.
Les références à des objectifs (Canon, Nikon, Arri) marchent-elles ?
« 35mm », « 85mm », « anamorphic » marchent bien. « Shot on Arri » peut aider comme style global. Pour simuler vraiment des optiques de cinéma (flare, bokeh), voir notre simulation objectifs Arri/Panavision.
Combien de paramètres dans un prompt ?
En pratique : sujet + cadrage + lumière + 2–3 termes technique (focale, grain, style). Au-delà de 5–6 indications fortes, le moteur peut tout mélanger. Reste lisible et hiérarchisé.
Comment éviter les erreurs qui trahissent l’IA (mains, texte, symétrie) ?
Negative prompt : « extra fingers, deformed hands, text, watermark ». Pour les visages, éviter « symmetrical » si tu ne veux pas de rendu bizarre. On liste les erreurs typiques des débutants et comment les corriger dans un guide dédié.


Frank Houbre - expert IA vidéo et Image
Frank Houbre est un expert en IA vidéo et image, artiste IA et filmmaker récompensé aux Seoul International AI Film Festival et aux Mondial Chroma Awards. Avec plus de 10 ans d'expérience en entrepreneuriat digital, il crée des courts-métrages et animés entièrement générés par IA (Midjourney, Kling, Adobe Firefly). Co-Fondateur de Screenweaver et de la communauté #AIStudios, il partage des tutoriels gratuits et avis d'outils sur Business Dynamite pour aider les créateurs à automatiser leur production.
Continuer la lecture
- Analyse d'image , Comment l'IA interprète le poids des références visuelles
Image reference, style reference, ControlNet : comprendre comment le moteur combine ton image et ton texte pour ne plus avoir de surprises.
- Génération d'images par lots (Batch prompting) pour les agences de publicité
Produire des dizaines de visuels cohérents pour une campagne : structure des prompts, variables, style reference et pipelines pour les agences.
- Forcer la composition mathématique (Nombre d'or, Tiers) dans l'IA visuelle
Imposer la règle des tiers, le nombre d’or ou une composition précise en prompt : ce qui marche, ce qui ne marche pas, et les contournements.
