Google utilise de nouveaux outils pour créer une intelligence artificielle plus moderne, plus efficace et plus rapide. LIMoE est un algorithme, ou plutôt modèle, qui fera partie intégrante de cette IA.
Qu’est-ce que le LIMoE ?
LIMoE signifie en anglais Language-Image Mixture of Experts. Vous n’avez rien compris ? C’est normal. Traduisons en français donc : le mélange langage-image d’experts. Bon, ce n’est pas plus compréhensible, mais on va tenter de définir brièvement tout ça.
Des ingénieurs et chercheurs de Google ont annoncé se pencher cette nouvelle technologie au début du mois de juin 2022. Le modèle de cette technologie repose sur un système technique de réseau neuronal. Il est appelé Sparse Mixture of Experts Model (Modèle de mélange clairsemé d’experts, en français). Oui, mais en clair, ça veut dire quoi ?
Eh bien pour vulgariser au maximum, on peut dire que LIMoE est un algorithme capable d’apprendre plusieurs modèles, là où d’habitude, il faut le travail et l’intervention de plusieurs algorithmes.
Dans son processus d’analyse et d’apprentissage, LIMoE fait appel à divers “experts” ayant une tâche bien précise pour permettre d’analyser à la fois du texte et de l’image. Par exemple, si vous donnez une image de chat à LIMoE, un expert va comprendre que c’est un chat, un autre expert va définir quelle est la race chat, un autre expert va reconnaître la couleur de son pelage et ainsi de suite.
Ce modèle “clairsemé” s’oppose ainsi au modèle “dense” qui doit accomplir une tâche en analysant plusieurs fois chaque partie d’une image ou d’une phrase et ce, indépendamment. Mais cette illustration issue du blog Google AI sera sans doute plus parlante :
Avec le travail des experts spécifiquement configurés, LIMoE offre des résultats plus intéressants que les technologies actuelles. Cela demande à la fois moins de ressources et moins de temps. C’est un outil parfait pour Google qui l’utilisera au sein de l’intelligence artificielle nommée Pathways.
Une nouvelle architecture d’IA avec Google Pathways
Pathways est le nom d’une intelligence artificielle nouvelle génération. Elle pourra gérer plusieurs tâches individuelles et surtout apprendre en construisant une base de données solides qui pourra resservir (comme une sorte de correcteur orthographique par exemple). Alors qu’aujourd’hui les IA doivent sans cesse réapprendre à chaque tâche demandée.
Comme expliqué sur le Blog Google :
Les modèles d’IA d’aujourd’hui sont généralement formés pour ne faire qu’une seule chose. Pathways nous permettra de former un modèle unique pour faire des milliers ou des millions de choses.
Avec la technologie LIMoE, Pathways sera ainsi basé sur ce qu’on appelle l’apprentissage automatique avec modèles multimodaux. Ce dernier mot signifie que la technologie comprend à la fois l’écrit, l’image ou même le parler. Au son d’un aboiement ou en analysant une photo de Rantanplan, il saura directement qu’il s’agit d’un chien (et même reconnaître Rantanplan !).
Une intelligence artificielle toujours plus rapide et toujours plus compréhensive en somme.
Découvrez aussi Dall-E 2 l’intelligence artificielle d’Open AI qui permet de créer des images inédites !