Il n’est pas toujours évident d’obtenir le résultat attendu avec la génération d’images avec les LLM
La génération d’images par intelligence artificielle connaît une révolution silencieuse. Si les outils comme Midjourney, DALL·E ou Stable Diffusion sont désormais accessibles au grand public, beaucoup d’utilisateurs peinent encore à obtenir des résultats cohérents et reproductibles. Chez Agence CIA Bourges, nous accompagnons les entreprises dans la maîtrise concrète de ces technologies. Et aujourd’hui, nous partageons une méthode simple, puissante et souvent ignorée : utiliser le format JSON pour piloter la génération d’images avec les LLM.
Pourquoi le JSON est la clé de la génération d’images avec l’intelligence artificielle
La plupart des utilisateurs rédigent leurs prompts en langage naturel, de manière approximative. Le résultat ? Des images qui varient d’une génération à l’autre, difficiles à reproduire ou à modifier précisément.
Le format JSON (JavaScript Object Notation) change la donne. C’est un format de données structuré, lisible par les humains et les machines, qui permet de décrire une image comme un ensemble de paramètres précis : sujet, décor, lumière, ambiance, style visuel, météo, etc. En structurant ainsi vos instructions, vous gagnez en précision, en reproductibilité et en contrôle créatif.
C’est exactement l’approche que l’Agence de conseil en IA CIA Bourges recommande à ses clients pour industrialiser leur production visuelle assistée par intelligence artificielle.
Étape 1 — Fournir une image modèle et la faire décrire par le LLM
La première étape consiste à ancrer le LLM dans une référence visuelle concrète.
Prenez une image qui correspond à l’atmosphère, au style ou à la composition que vous souhaitez reproduire ou transformer. Importez-la dans ChatGPT (ou tout autre LLM multimodal) et demandez-lui simplement :
« Décris cette image de manière détaillée : le sujet principal, le décor, la lumière, les couleurs dominantes, l’ambiance, le style photographique ou illustratif, et tout élément visuel notable. »
Le LLM va produire une description textuelle riche et précise. Cette description devient votre base de travail. Vous disposez maintenant d’une « empreinte visuelle » de votre image de référence.
Cette étape est fondamentale : elle évite les approximations et garantit que vos modifications futures s’appuient sur une description objective et complète.
Étape 2 — Demander les modifications au format JSON
C’est ici que la méthode prend toute sa puissance. Une fois l’image décrite, vous allez demander au LLM d’intégrer vos souhaits de modification — mais en sortie JSON uniquement.
Qu’est-ce que le format JSON ?
Le JSON est un format de données structuré, organisé en paires clé/valeur. Voici un exemple simplifié de ce à quoi ressemble un prompt d’image structuré en JSON :
{
"sujet": "une femme en costume médiéval",
"décor": "forêt enchantée au coucher du soleil",
"météo": "brouillard léger",
"lumière": "dorée, contre-jour",
"style": "illustration fantasy, détaillée",
"palette": "tons chauds, orangé et vert profond",
"ambiance": "mystérieuse et poétique"
}
Chaque paramètre est isolé, modifiable indépendamment, et réutilisable. Vous pouvez changer uniquement la météo, uniquement le décor, ou uniquement le personnage, sans toucher au reste.
Comment formuler la demande
Après la description de l’image modèle, soumettez ce type d’instruction au LLM :
« En te basant sur la description précédente, génère un prompt JSON pour une version modifiée de cette image avec les changements suivants : le décor passe à une ville futuriste sous la pluie, le personnage devient un robot, la météo est orageuse. Fournis uniquement le JSON, sans texte autour. »
Le LLM produira alors un bloc JSON propre, structuré, directement exploitable.
Cette approche est au cœur de ce que l’Agence CIA Bourges enseigne dans ses formations et missions de conseil en intelligence artificielle : transformer l’IA d’un outil aléatoire en un processus maîtrisé et reproductible.
Étape 3 — Copier-coller le JSON dans votre outil de génération
La dernière étape est la plus simple. Récupérez le JSON généré et copiez-collez le contenu dans votre outil de génération d’images préféré :
- ChatGPT avec DALL·E : collez le JSON dans un nouveau message en demandant de générer l’image à partir de ces paramètres
- Midjourney : transformez les valeurs JSON en prompt textuel en demandant au LLM de « convertir ce JSON en prompt Midjourney »
- Stable Diffusion / ComfyUI : certains workflows acceptent directement des paramètres structurés
- Adobe Firefly, Leonardo.ai : même logique de conversion
Le résultat sera nettement plus fidèle à vos intentions qu’un prompt rédigé à la volée. Et surtout, vous pouvez itérer rapidement : modifiez une seule valeur du JSON, régénérez, comparez.
Exemple : génération d’un paysage précis
Un paysage Aveyronnais que j’aime beaucoup
Je pars d’un paysage que je connais bien : le Puy de Montabez en Aveyron. J’y faisais souvent une halte après 13 km de montées en VTT pour profiter d’une vue à 360° sur l’Aubrac, l’Aveyron et les monts du Cantal.

La description demandée à ChatGPT

L’ia rentre vraiment dans le détail !
Le travail demandé : mettre un peu de neige

J’aurais pu le demander à PERPLEXITY, GEMINI ou tout autre LLM.
Les rendus à partir du JSON



Les résultats sur Night café studio, Gemini et ChatGPT. Alors oui j’aurai pu leur fournir simplement l’image de référence et leur demander des transformation, mais l’idée était de vous démontrer qu’une bonne instruction donne des résultats quasiment similaires.
Bon Meta ai, ne comprend rien au Json et Midjourney se plaind que c’est trop long !
L’intelligence artificielle au service de la créativité structurée
Cette méthode illustre parfaitement la philosophie de l’Agence de conseil en IA : l’intelligence artificielle n’est pas un outil magique qu’on invoque au hasard — c’est une technologie qui donne ses meilleurs résultats quand on l’aborde avec méthode et rigueur.
Le JSON comme langage de prompt est une approche professionnelle, transposable à de nombreux usages : génération de contenus marketing, création de visuels cohérents pour une marque, production de storyboards, prototypage rapide de concepts visuels.
Cet article a été rédigé par l’équipe de l’Agence CIA Bourges, agence de conseil en intelligence artificielle basée à Bourges. Nous accompagnons les entreprises et organisations dans leur transformation numérique par des stratégies IA concrètes, éthiques et adaptées à leurs enjeux métiers.



