Open Ai vient d’officialiser la sortie du nouveau modèle de génération par intelligence artificielle dénommée ChatGPT -4o mini. Elle remplace ainsi l’ancienne version gratuite GPT -3.5 qui montrait déjà quelques limites face à la concurrence féroce que lui livre Gemeni 1.5 Flash de Google ou Claude 3 Haiku d’Anthropic.
Despetits modèles d’intelligence artificielle générative qui rencontre un grand succès
C’est en mai 2024 qu’Open AI présentait pour la première fois les possibilités innovantes de son assistant de langage IA, Chat GPT-4o. Ce modèle payant remplaçait lui aussi Chat GPT-4. Il est aujourd’hui l’assistant IA générative le plus abouti du marché avec une fluidité et une rapidité étonnante des données. Le temps d’attente est seulement de 320 millisecondes, il n’y a donc aucune latence, c’est classique à un dialogue humain. Pour ce modèle, il faudra débourser 20 $ par mois.
Alors, tout le monde n’a pas 20 $ par mois pour payer la version payante. Il n’est donc pas étonnant qu’on rencontre de plus en plus des modèles d’intelligence artificielle gratuits. Il n’y a pas que GPT -4o Mini, il fait face aux concurrents que sont Gemeni 1.5 Flash de Google, Claude 3 Haiku ou Llama 3. Tous tout aussi gratuits. On pourrait donc logiquement se demander les raisons qui poussent autant de particuliers et de développeurs à préférer ces petits modèles d’IA de langage.
Dans les faits, ils sont adaptés aux petites tâches et sont tout aussi rapides que les modèles payants trop performants que sont ChatGPT -4o ou Claude 3.5 Sonnet. En effectuant des centaines de requêtes, on obtient approximativement les mêmes résultats. C’est donc moins cher et efficace.
Un ChatGPT -4o mini bien plus performant que GPT 3.5 et gratuit en plus
D’après les tests qui ont déjà été effectués, ChatGPT -4o serait deux fois plus rapides que GPT 3.5 et Open AI ne compte s’arrêter en si bon chemin. L’entreprise affirme que son modèle gratuit qui prend en charge le texte et la vision, devra à terme d’ici à quelques années être capable de lire et d’écrire du texte, de l’image, de la vidéo et de l’audio.
Pour donner une idée de sa rapidité, il peut prendre en charge 128 000 tokens avec 16 000 tokens en sortie. Il faut cependant être réaliste, même s’il comprend assez bien la langue de molière, il n’est pas à la hauteur de GPT -4o qui est plus adapté aux prompts nécessitant de grosses ressources. De plus, sa base de connaissance s’arrête en octobre 2023. Il ne pourra donc pas fournir les résultats des requêtes de l’Euro 2024 ou encore des résultats législatifs en France en juin 2024.
Par ailleurs, les développeurs devront fournir 15 centimes pour 1 million de tokens d’entrée et 60 centimes pour 1 million de jetons de sortie. Cela représente un livre de 2500 pages selon les dires d’Open AI. D’après les résultats de MMLU (Massive Multitask Language Understanding), la référence pour évaluer les capacités des modèles de langage IA, CHATGPT -4o Mini obtient 82 %. Quant à Gemeni 1.5 Flash et Claude 3 Haiku, ils obtiennent respectivement 79 % et 75 %.