OpenAI vient de mettre à jour ses deux nouveaux modèles d’IA dédiés au raisonnement : o3 et o4-mini. Ces derniers peuvent utiliser, de manière combinée, tous les outils disponibles dans ChatGPT, notamment la recherche web, l’analyse d’images, l’interprétation de fichiers, la génération d’images, l’exécution de code Python, etc.
Découvrez aussi : Transformer vos photos en style du Studio Ghibli avec ChatGPT
Le modèle o3 d’OpenAI peut désormais analyser des images pour raisonner
OpenAI affirme sur son blog officiel que o3 et o4-mini intègrent les images directement dans leur processus de raisonnement et seront capables d’ajuster les images en les zoomant ou en les faisant pivoter.
Cette annonce intervient alors que Gemini 2.5 Pro de Google propose déjà des fonctionnalités similaires d’intégration d’outils et de manipulation d’images.
La firme précise aussi que ses modèles représentent encore une avancée significative dans la perception visuelle. Ils peuvent, par exemple, traiter des photos de tableaux blancs, des diagrammes de manuels scolaires ou des croquis, en les manipulant (zoom, rotation) pour en extraire des informations pertinentes.
Enfin, ces outils seront disponibles dès aujourd’hui pour les abonnés de ChatGPT Plus et Pro utilisant les modèles o3, o4-mini et o4-mini-high, et seront déployés sur o3-pro dans les semaines à venir.
Source : OpenAI