[TEST] Comparons les IA Midjourney et Dall-E 2

La lutte pour la meilleure intelligence artificielle capable de créer des images à partir d’un texte fait rage. Découvrons aujourd’hui Midjourney, l’un des précurseurs et, pour le moment, le plus sérieux concurrent à Dall-E 2.

Qu’est-ce que l’intelligence artificielle Midjourney ?

Midjourney est un programme basé sur l’intelligence artificielle pour reproduire une demande textuelle en image. Lancé au début de l’année 2022, il a été conçu par une équipe de chercheurs et d’experts en tous genres, dirigée par David Holz, le cofondateur de l’ancien dispositif de capture de mouvement des mains pour la réalité virtuelle, Leap Motion. David Holz est aussi chercheur pour la NASA et l’institut Max Planck. C’est donc un gros bonnet !

Parmi d’autres conseillers qui interviennent pour Midjourney, on peut citer le patron de GitHub, Nat Friedman ou encore le fondateur de Second Life, Philip Rosedale. 

Depuis juillet 2022, Midjourney est ouvert au grand public en version beta. Mais auparavant déjà, quelques personnes pouvaient le tester. D’ailleurs, des grands noms de la presse, comme The Economist, ont fait leur une avec une image provenant de Midjourney pour des numéros spéciaux sur l’intelligence artificielle.

Comment tester Midjourney et créer une image sortie de notre imagination ?

Midjourney est désormais accessible à tous, à condition d’avoir un compte Discord. Car c’est sur ce réseau social que tout se passe pour nous autres “testeurs”. Sur le site de Midjourney, nous sommes donc invités à rejoindre le Discord créé pour l’occasion. 

Les salons du Discord sur lesquels j’ai accès pour faire mes tests sont d’ailleurs souvent appelés “Newbie”… Presque vexant ! Au début, difficile de s’y retrouver mais en lisant les règles et la notification de bienvenue, je me rue donc vers les salons pour les “débutants”. 

Puis c’est très simple, une fois sur le bon salon, il suffit de taper la commande “/imagine” et la suite de notre requête. En moins d’une minute, on découvre quatre images générées par Midjourney. Il est ensuite possible de générer quatre autres nouvelles images ou de demander une variation à partir d’une des quatre images créées.

Alors Midjourney, ça donne quoi par rapport à Dall-E 2 ?

Passons au vif du sujet que vous attendez tous ! J’ai testé l’intelligence artificielle Midjourney. Et bien évidemment après avoir fait le test de Dall-E 2, je n’ai pu m’empêcher de faire exactement les mêmes demandes aux deux programmes pour voir les différences dans les résultats. Je vous donne donc deux descriptions (déjà utilisées pour Dall-E 2) avec les rendus sur l’un et l’autre programme.


“Une peinture impressionniste d’un singe jouant de la trompette sur un cheval la nuit dans un désert”

Source : Dall-E 2
Source : Midjourney

Commentaires : Les images Midjourney sont plus sombres, plus nuancées. Mais on sent une approche plus “artistique”. Les images de Dall-E 2 sont plus colorées, claires et détaillées. Du coup, on a limite l’impression de voir un dessin pour enfants ! En revanche, il n’y a qu’une seule trompette reconnaissable avec l’intelligence artificielle Midjourney… 


“Rendu 3D d’un homme conduisant une formule 1 sur la lune”

Source : Dall-E 2
Source : Midjourney

Commentaires : Même constat sur cette deuxième image. L’impression de qualité est bien là sur Midjourney. On dirait une image haute résolution. Concernant les détails, je reste mitigé. Certes, on a vraiment l’impression d’être sur un terrain lunaire… Mais c’est quoi ce type de formule 1 ???

Conclusion : Midjourney vs Dall-E 2, quelles différences ?

Fondamentalement, les intelligences artificielles utilisent les mêmes principes technologiques pour reconnaître le sens de nos demandes et ainsi produire des images en fonction de leur base de données respective.

Je peux quand même citer quelques différences comme on peut le voir sur les deux exemples ci-dessus et en fonction de ce que j’ai pu voir sur Discord. Car oui, un avantage de Midjourney, c’est la possibilité de voir les demandes de nombreux “Newbies” et donc apprécier les rendus générés par l’IA pour des tiers.

En plus dès l’envoi du “prompt”, on voit l’évolution de la création des quatre images, du plus flou au moins flou, du moins détaillé au plus détaillé jusqu’au rendu final… Et c’est assez fascinant !

Autre différence, Midjourney semble créer des images de plus haute qualité au niveau de la résolution. Le programme semble être plus performant sur les paysages et les portraits par exemple. Il fait vraiment plus “artistique”. 

En revanche, au niveau des détails et de la fidélité par rapport aux requêtes, Dall-E 2 remporte le match selon moi. Avec une demande assez longue comportant plusieurs critères, le programme d’OpenAI fait bien le boulot et ne néglige (presque) aucun élément. Là où Midjourney en oublie carrément selon les demandes.

Dernier élément (et pas le moins important), l’aspect des choix de réglementation, surtout au sujet de l’utilisation des visages. Sur Dall-E 2, il est strictement interdit de demander notamment un portrait de Michael Jackson avec des cheveux blonds. Alors que sur Midjourney par exemple… Tadam ! 

Source : Midjourney

Certes, on voit bien que c’est un dessin 3D et que ce n’est pas un montage sur une vraie photo de Michael Jackson. Mais avouons-le, on reconnaît plutôt bien le King de la Pop sur certains de ces exemples ! Pour exactement la même demande, Dall-E 2 nous affiche lui un message d’erreur, indiquant que la requête ne respecte pas leur politique de confidentialité. 

On peut se demander si Midjourney ne sera pas obligé de se plier à cette règle. En effet, la Commission européenne a prévu un projet de réglementations sur l’intelligence artificielle qui devrait être établi en 2023. 

En tout cas, les progrès du machine learning sont impressionnants. Et j’ai hâte de voir (et surtout tester) le programme similaire à Dall-E 2 et Midjourney que nous concocte Google, le fameux Imagen

Si vous souhaitez me faire part de vos commentaires ou me demander une requête pour la transposer sur Dall-E 2 ou Midjourney, faites-moi signe rapidement ! 

Laisser un commentaire