Découvrir Stable Diffusion

Savez-vous que selon Marvin Minsky, père fondateur de l’IA, les machines peuvent désormais réaliser des tâches complexes normalement réservées aux humains ?

Grâce à des outils révolutionnaires comme Stable Diffusion, créer des illustrations de qualité n'a jamais été aussi simple, même pour des débutants sans notions de dessin.

Avec Swiftask, le nouvel assistant IA polyvalent, profitez d’une solution efficace pour générer instantanément de superbes visuels personnalisés.

Ce que vous devez savoir à propos de Stable Diffusion

Stable Diffusion : qu’est-ce que c’est ?

Stable Diffusion est un modèle d'intelligence artificielle fonctionnant par apprentissage automatique (machine learning). De ce fait, il permet de générer des images numériques, très réalistes, à partir de simples descriptions textuelles en langage naturel.  Ce générateur d'images, piloté par le langage humain, crée des images photoréalistes en partant de zéro.

Stable diffusion : logiciel libre ?

Malgré la divulgation publique de son code source, Stable Diffusion demeure un outil sous licence CreativeML Open RAIL-M, à la surprise de la concurrence qui préfère habituellement garder secret ses développements.  Le fait d'être open source distingue Stable Diffusion et lui procure de nombreux avantages, tant pour le développement de l'intelligence artificielle que pour ses utilisateurs assidus.

Stable Diffusion : qu’en est-il de la concurrence ?

Parmi les modèles comparables à Stable Diffusion se trouvent DALL-E et Midjourney. Toutefois, par son ampleur et sa diffusion mondiale, Stable Diffusion s'est imposé comme une référence incontournable dans le domaine de la génération d'images par intelligence artificielle.

Quelles sont les capacités de Stable Diffusion ?

Génération d’images à partir d’un texte descriptif : text2image

Ce qui a contribué au succès des IA auprès du grand public, c'est leur aptitude à comprendre des demandes formulées en langage naturel. Stable Diffusion repose sur ce même principe pour interpréter les requêtes des utilisateurs.  Néanmoins, la formulation du prompt revêt une importance cruciale. Un prompt mal rédigé risque d'engendrer une image ne correspondant pas aux attentes de l'utilisateur.

Personnalisation des images générées

Plus vous vous habituez à utiliser Stable diffusion, plus vous comprenez comment il réagit à votre requête. Après avoir obtenu une image IA, vous pouvez rester sur la même thématique et peaufiner votre prompt jusqu’à obtenir l’image qui vous satisfait. L'optimisation de l’image peut se faire sur trois plans : premier, second et arrière-plan.

Stable Diffusion sur Swiftask

Swiftask donne accès à Stable Diffusion via son interface

Swiftask est une application qui regroupe plusieurs outils d'IA sur une seule et même plateforme. C'est pourquoi on la surnomme souvent l'assistant IA tout-en-un. Elle donne donc un accès facile à Stable Diffusion et permet de générer rapidement une image de synthèse. 

➕ Une fois sur la plateforme Swiftask, vous pouvez utiliser le bot image en mentionnant "@Stable..." dans la barre de texte d'invite.

Ouvrir Stable Diffusion sur Swiftask

➕ Il suffit ensuite d'écrire la description textuelle de l'image souhaitée pour que Stable Diffusion génère l'image correspondante.

prompt pour Stable Diffusion

➕ Et voici le résultat attendu, pas mal non ? Il faut laisser libre cours à l’imagination.

Cheval noir sur un matelas

Accès à d’autres outils pour image IA

Ce qui est génial avec Swiftask, c'est la possibilité de passer d'un bot à l'autre sans avoir à ouvrir une nouvelle fenêtre. Si vous voulez continuer à générer des images, vous avez le choix entre : 

  • DALL-E 3,
  • Face Restoration
  • Image Upscaler 
  • et Magic Color. En prenant l’exemple du cheval, la couleur peut être facilement changée : 
Image colorisé par Magic color de Swiftask

Comment faire un bon prompt pour Stable Diffusion ?

Le prompt est le texte que vous saisissez dans la barre de commande avant de générer une image. Pour maximiser vos chances d'obtenir une image de qualité, il est recommandé de suivre une structure précise dans la rédaction de votre prompt. Ensuite, avec de l'entraînement pour maîtriser le vocabulaire adapté à l'intelligence artificielle, vous augmenterez vos chances d'obtenir un résultat satisfaisant. 

Idée de structure d’un prompt efficace

Le style

  • Réaliste : des images qui ressemblent à des photos, avec un haut niveau de détails et de réalisme.
  • Dessin au crayon : imitation d'un dessin réaliste fait au crayon. Les traits sont doux et l'ombrage est réaliste. 
  • Peinture à l'huile : rendu qui imite la peinture traditionnelle avec des coups de pinceau visibles.
  • Aquarelle : style léger et transparent comme une vraie aquarelle, avec des bords diffus.
  • Bandes dessinées : utilisation de couleurs primaires, contours noirs épais et style graphique simplifié.
  • Manga : style de bande dessinée japonaise avec de grands yeux, des visages stylisés.
  • Pixel art : images faites de pixels apparents comme dans les vieux jeux vidéo.
  • Impressionnisme : style qui capture la lumière et les couleurs comme les peintres impressionnistes. 
  • Cubisme : déconstruction géométrique de la perspective.
  • Surréaliste : images oniriques avec des éléments imaginaires. 
  • Abstrait : formes, couleurs et textures non-figuratives.

Le sujet

  • Êtres humains : portraits, personnages imaginaires, auto-portraits, silhouettes, etc. L'IA peut générer des visages, expressions, poses, vêtements et accessoires réalistes ou stylisés.
  • Animaux : chiens, chats, chevaux, oiseaux, poissons, reptiles, etc. Réalistes ou fantaisistes, dans n'importe quelle pose ou contexte. 
  • Objets du quotidien : voitures, meubles, appareils électroniques, vêtements, nourriture. L'IA permet de visualiser des objets sous tous les angles.
  • Architecture et paysages : maisons, immeubles, monuments, intérieurs, villes, montagnes, forêts, plages, planètes... Tous les environnements réels ou imaginaires.
  • Illustrations scientifiques et techniques : molécules, cellules, schémas, graphs, diagrammes, croquis techniques, storyboards, etc. 
  • Œuvres d'art : peintures, dessins, sculptures dans différents styles et mouvements artistiques.
  • Logos et designs graphiques : pour des projets marketing, sites web, emballages produits, etc.

Les détails sur le sujet

  • Pour un portrait : expression du visage (sourire, regard), âge aparent, couleur et style des cheveux, couleur des yeux, forme du visage, traits distinctifs, accessoires (lunettes, chapeau, bijoux...), habillement, arrière-plan.
  • Pour un animal : race, couleur et texture du pelage/plumes, patrons de coloration uniques, expression, posture, accessoires, arrière-plan/environnement.
  • Pour un objet : forme générale, matériaux, texture, couleurs, reflets, ombres, détails spécifiques, logo, texte, position dans l'espace.
  • Pour un paysage : premier plan, arrière-plan, ligne d'horizon, éléments centraux, végétation, relief, conditions météo, éclairage, saison.
  • Pour une architecture : style (moderne, classique...), matériaux, couleurs, textures, éléments distinctifs (dôme, colonnes...), environnement.

L’environnement

  • Naturel : forêt, jungle, désert, montagne, plage, océan, lacs, rivières, prairies, toundra, etc.
  • Urbain : ville, centre-ville, banlieue, rues, immeubles, maisons, monuments, ponts, etc.
  • Intérieur : maison, appartement, bureau, usine, laboratoire, hôpital, école, bibliothèque, musée, etc.
  • Fantastique/futuriste : paysages sur d'autres planètes, cités futuristes, univers de science-fiction, royaumes imaginaires, etc.
  • Historique : époque médiévale, far-west, égyptienne, préhistorique, antiquité romaine/grecque, etc. 
  • Micro-environnements : surface d'une feuille, goutte d'eau, intérieur d'un atome, etc.
  • Extrême : volcanique, désert de glace, fonds marins, tornades, ouragan, etc.
  • Stylisés : cel-shading, low-poly, matte painting, impressionnisme, etc.

Les détails sur l’environnement

  • Éléments naturels : arbres, végétation, rochers, rivière, mer, neige, glace, sable, etc. Vous pouvez décrire la densité, la variété, la couleur.
  • Éléments construits par l'homme : bâtiments, ponts, routes, voitures, mobilier urbain. Décrivez le style architectural, les matériaux. 
  • Conditions météorologiques : ensoleillé, nuageux, pluvieux, neigeux, brumeux. Précisez l'intensité.
  • Sources de lumière : soleil levant/couchant, lune, lanternes, néons, feu, etc. 
  • Couleurs dominantes : tons chauds, tons froids, contrastes, saturation.
  • Style artistique : réaliste, dessin animé, peinture à l'huile, aquarelle, pixel art, etc.
  • Époque : contemporaine, futuriste, médiévale, préhistorique etc.
  • Échelle : microscopique, vue aérienne, gros plan sur un détail.
  • Mouvements : feuilles qui volent, nuages qui défilent, voitures qui roulent, personnages en action.

Ajout des modificateurs

  • Style portrait professionnel 
  • Style photo de rue
  • Style nature morte artistique
  • Style publicité vintage 
  • Objectif grand angle : 14 à 35 mm
  • Objectif téléobjectif : plus de 135 mm
  • Objectif fisheye
  • Flou d'objectif 
  • Appareil photo reflex argentique 
  • Effet caméra miniature
  • Effet caméra jetable
  • Effet caméra Lomo
  • Éclairage doux en lumière naturelle 
  • Contre-jour dramatique 
  • Éclairage latéral prononcé
  • Éclairage artificiel bleuté

Artistes

  • Picasso - Pour un style cubiste/surréaliste avec déconstruction des formes.
  • Van Gogh - Pour un style expressionniste avec traits épais et couleurs vives.
  • Monet/Renoir - Pour un style impressionniste, flou et lumière tamisée. 
  • Dali - Pour des images oniriques et des perspectives déformées.
  • Hokusai - Pour un style estampe japonaise avec contours noirs et aplats de couleurs.
  • Keith Haring - Pour un style graphique simpliste avec personnages stylisés.
  • Frida Kahlo - Pour des portraits réalistes aux couleurs intenses.
  • Basquiat - Pour un style brut et des effets de matière comme le dripping.
  • Klimt - Pour un style Art Nouveau sophistiqué et ornemental.
  • Banksy - Pour un style street art épuré avec pochoirs.
  • Mondrian - Pour des compositions géométriques primaires.

2 images générées par Stable diffusion avec cette structure

Prompt 1 : "Un chien Labrador courant dans une prairie ensoleillée du Far West américain, représenté dans un style de dessin au crayon réaliste."

Labrador généré par Stable diffusion

Prompt 2 : "Un grand requin blanc nageant dans un récif corallien, style d'art pixel 16 bits."

Requin dessiné par Stable Diffusion

Avantages de Stable Diffusion pour les utilisateurs de Swiftask

Qualité d'image

Stable Diffusion produit des images réalistes et détaillées grâce à son architecture de diffusion. La qualité est supérieure à des modèles antérieurs comme DALL-E 3.

Flexibilité

On peut générer une grande variété d'images en fonction du texte prompt fourni. Le modèle est entraîné sur un très vaste ensemble de données.

Rapidité

Le modèle génère des images de haute qualité en seulement quelques secondes grâce à l'optimisation du code et du matériel.

Créativité

Stable Diffusion permet d'explorer sa créativité et d'itérer rapidement en générant de nombreuses variations d'images à partir d'un même prompt.

Communauté

Une large communauté contribue à l'amélioration constante de Stable Diffusion et partage des conseils, astuces et créations.

  • Bon à savoir

Petite astuce insoupçonnée :

préférez l'anglais à toute autre langue pour la formulation de vos consignes textuelles avec Stable Diffusion.

  • À retenir :

Swiftask est une plateforme unique regroupant plusieurs intelligences artificielles spécialisées dans la génération d'images.

Cet assistant IA polyvalent donne accès à une variété de bots capables de créer toutes sortes de visuels à la demande. Avec Swiftask, vous centralisez la puissance de différentes IA en un seul endroit.

Logo Swiftask

Like what you read? Share with a friend

author

OSNI

Osni is a professional content writer

Published

November 21, 2023

Ready to try Swiftask.ai?

Recent Articles