Générateur d'images par Intelligence Artificielle

Comparatif de modèles de génération d'images par Intelligence Artificielle

Publié par sur 23rd Oct 2024

Voici un petit comparatif entre 4 familles de générateurs d'images.

  1. La famille des Stable Diffusion : SDXL, SD 1.6, SD Image, SD Ultra et SD 3.5 Large
  2. La famille des Flux : Flux 1.1 Pro, Flux 1.dev et Flux 1.schnell
  3. La famille des DALL-E 3 d'OpenAI
  4. La famille des Sana, un petit nouveau ultra rapide et ultra léger, Sana 1.6b, développé par Nvidia

Prompt

Créez une image d'un paysage nocturne représentant un petit village de Noël niché dans les hautes terres d'une montagne recouverte d'un épais manteau de neige. Le village est situé dans une petite vallée, entouré de murs de pierre et de toits en tuiles rouges qui semblent brûler d'un feu intérieur. Au centre du village, sur la place principale, se dresse un grand sapin décoré. Ses branches sont illuminées par des milliers de petites lanternes en cristal qui dansent dans la nuit, projetant des reflets dorés sur les façades environnantes. Le ciel est rempli d'étoiles scintillantes et le soleil n'est plus qu'un petit disque rouge caché derrière les sommets enneigés. Les rues étroites du village sont désertes, mais on peut apercevoir des silhouettes penchées sur des chaudrons fumants qui s'élèvent des cheminées. L'atmosphère est magique et chargée d'une ambiance festive, comme si le temps s'était arrêté pour laisser place à un moment suspendu. Le village de Noël ressemble à une île enchantée, coupée du monde extérieur par sa beauté onirique. (en anglais)

Je vous laisse admirer les rendus et vous faire votre propre idée. Personnellement, mon préféré est celui réalisé par Flux 1.1 Pro.

Stable diffusion

test_stable_diffusion_3.5-large test_stable_diffusion_image_core test_stable_diffusion_ultra test_stable_diffusion_1.6 test_stable_diffusion_sdxl

Flux

test_flux1_schnell test_flux1_dev test_flux1-1pro

Dall-E

test_dalle3

Sana (nouveau modèle sorti en octobre 2024 par Nvidia)

La famille Sana pourra tourner sur un GPU d'ordinateur portable, voire sur un smartphone, quand ils seront disponibles.

test_sana1-6b

Conclusion

Il semble que le seul modèle qui sera véritablement open-source soit le projet Sana quand il sera publié. Les nouveaux modèles de Stable Diffusion n'étant plus open source. Flux 1 dev et schnell peuvent être téléchargés, mais ils sont propriétaires et demandent énormément de ressources en calcul, mais ce sont eux qui ont un superbe rendement. Stable Diffusion devient vieux, l'avantage c'est que les modèles sont plus légers que ceux de Flux, mais il faut souvent plusieurs inférences avant d'obtenir le résultat souhaité.

Liens pour tester soi-même