OpenAI, dont Elon Musk est l’un des présidents, a enfin ouvert l’accès en version beta à son générateur d’images DALL-E 2. Je l’ai testé et vous pouvez en voir les résultats dans cet article. Bienvenue dans le futur !
DALL-E 2, pour créer des images artificielles uniques
Je vous avais déjà parlé du générateur d’images DALL-E 2 sur mon blog. Je ne vais donc pas trop m’étendre sur le sujet. En très gros, on écrit une phrase détaillée et l’intelligence artificielle d’OpenAI fait le reste pour générer plusieurs images correspondant à la description.
On débute donc avec 50 crédits. Chaque crédit nous permet d’effectuer une génération d’images, une retouche ou des variations d’une image existante. Ensuite, notre compte se verra ajouter 15 crédits supplémentaires chaque mois. On peut bien évidemment ajouter des crédits en payant (115 crédits pour le prix de 15$).
Concernant la génération d’images à partir d’une simple description, DALL-E 2 nous propose exactement 4 visuels téléchargeables en format PNG.
Voici quelques exemples de résultats… C’est énorme ! Dites-vous bien que ces images n’existent pas. Les descriptions sortent tout droit de mon imagination dans un premier temps. Puis l’intelligence artificielle fait le travail pour créer des images totalement inédites à partir des connaissances apprises avec le temps et de la base de données qu’elle utilise.
Mes premiers tests de création d’images avec DALL-E 2
En toute transparence, je vais vous montrer les résultats de mes premiers tests de DALL-E 2. Je vous donne la description (traduite en français) et vous propose les 4 images que l’intelligence artificielle d’OpenAI a créées. C’est parti !
“Une peinture impressionniste d’un singe jouant de la trompette sur un cheval la nuit dans un désert”
Commentaires : même si plusieurs singes ont été ajoutés sur chaque photo, le résultat est plutôt satisfaisant. Bon par contre le singe remplace même le cheval sur l’une d’entre elles !
“Rendu 3D d’un homme conduisant une formule 1 sur la lune”
Commentaires : certains détails et les échelles de grandeurs ne sont pas forcément impeccables, mais c’est toujours aussi satisfaisant ! Belle astuce du robot qui a mis une planète (la Terre sûrement…) en arrière plan sans que je lui demande, pour contextualiser au mieux.
“Un Shiba Inu avec des lunettes de soleil dans le style Andy Warhol”
Commentaires : en un coup d’œil, on reconnaît le style du génie du Pop Art. Les finitions pourraient être un peu mieux tracées mais dans l’ensemble, la demande est respectée !
“Des souris mangeant une raclette en bande dessinée”
Commentaires : même constat ici avec des finitions qui mériteraient d’être un peu revues. Mais dans l’ensemble le critère de la bande dessinée est respecté. L’appareil à raclette n’est pas tout à fait celui qu’on connait mais on ne va pas blâmer l’intelligence artificielle américaine !
“Rendu 3D d’un petit garçon faisant du vélo rouge dans un champ”
Commentaires : j’ai choisi de vous montrer cette proposition car, comme dit dans mon premier article sur DALL-E 2, la génération des images impliquant des visages peut poser problème. En effet, pour des raisons de vie privée, de confidentialité et pour éviter les abus, il est impossible de créer des images avec le visage de personnes existantes. C’est pourquoi certains détails sur la face de ce petit garçon sont assez mal faits (il faut bien l’avouer !).
Pour conclure, je dois bien avouer que je suis à la fois intrigué et positivement surpris par le travail de DALL-E 2. Comme vous pouvez le voir, on peut lui demander n’importe quoi à partir du moment où cela ne compromet pas la vie privée d’une personne et n’évoque pas des sujets tendancieux (violence, torture, sexe, etc.).
Je vous invite à tester vous aussi DALL-E 2 !
Si vous ne souhaitez pas perdre de temps avec tout ça, faites-moi vos propositions d’images en commentaire et je les testerai pour vous ! On verra bien ce que DALL-E 2 nous propose…
Et découvrez également un de ses concurrents sur l’article : [TEST] Comparons IA Midjourney et Dall-E 2 !
Bonjour,
Je m’occupe du site d’une association locale. Pour chaque article publié, j’ajoute une photo illustrative que je cherche dans les banques d’images et ce type d’ia pourrait être utile pour moi pour générer une image qui corresponde à mes souhaits et que je ne trouve pas toujours dans les banques d’images.
Malheureusement, j’ai testé l’outil et je n’ai pas été totalement convaincu.
J’ai fait un article sur la shrinkflation. Pour l’illustrer, je voulais une photo présentant “2 pots de yaourts identiques transparents, le premier contenant plus de yaourt à l’intérieur que le second”. C’est la description que j’ai donnée. En anglais, cela donnait “photo of 2 identical transparent yoghurt pots, the left one being full of yoghurt and the right one being only half full of yoghurt”.
J’ai généré 4 * 4 images mais aucune n’a “matché” avec mes attentes. Beaucoup de photos présentaient les pots vus du dessus. L’IA n’est pas assez intelligente pour comprendre que pour comparer 2 niveau de remplissage, c’est mieux de voir le produit de profil que du dessus. Dans une des desciptions, j’ai ajouté que les pots de yaourts devaient être transparents mais de même marque… Bon ben là il bugue, il met des pots en plastique opaque, il est pas capable de générer des pots en verre transparents avec une étiquette de marque. Et aucun résultat n’a réellement montré un pot totalement rempli de yaourt et un pot moins rempli. A chque fois le remplissage est sensiblement le même, on ne voit pas trop de différence.
Du coup, pour conclure, sur le papier c’est un outil génial mais en pratique, il me semble encore très perfectible
Bonjour Christophe,
Merci pour votre retour. Je comprends votre problématique. Elle est sans doute trop précise pour l’IA.
Vous parlez de marque aussi, normalement Dall-E 2 n’aime pas trop ça, car en termes de droit une marque est protégée.
Je pense donc qu’il faut tenter de revoir vos attentes et de simplifier au maximum votre demande, il est intelligent, mais tout de même ce n’est pas un magicien 😀
Je vous renvoie aussi sur mon article https://michaeldri.com/blog/marketing-digital/test-comparaison-ia-dall-e-2-midjourney/ qui évoque le concurrent de Dall-E 2 qui s’appelle Midjourney. Si vous avez Discord, vous pourrez le tester.
Si vous souhaitez que je fasse le test pour vous, indiquez-moi la phrase exacte en anglais et je la soumettrai sur Discord.