Les actus IA en bref
Partager la publication
OpenAI lance un SDK pour les agents IA
OpenAI a lancé une série d’outils pour simplifier la construction d’agents d’intelligence artificielle, notamment la nouvelle API « Responses » qui combine la simplicité de « Chat Completions » avec les capacités de l’outil API « Assistants ». Cette nouveauté comprend des outils intégrés tels que la recherche web, la recherche de fichiers et les capacités de pilotage de l’ordinateur, ainsi qu’un nouveau Kit de développement (SDK) d’agents open source pour orchestrer les flux de travail multi-agents. Ces outils visent à rationaliser le développement d’agents en répondant aux principaux défis en matière de logique, d’orchestration et d’interactions, aidant les développeurs à créer des systèmes qui peuvent accomplir des tâches de manière indépendante pour les utilisateurs.
Gemini : Deep Research et Gems désormais gratuits pour tous les utilisateurs de Google
Google annonce une série d’améliorations pour son assistant IA Gemini, avec notamment l’extension de fonctionnalités premium à tous les utilisateurs, y compris ceux disposant de comptes gratuits.
Parmi ces mises à jour figurent deux fonctionnalités particulièrement appréciées : Deep Research et Gems. Deep Research est un outil sophistiqué capable d’effectuer des recherches approfondies en élaborant un plan méthodique en plusieurs étapes. Le système explore le web pendant quelques minutes avant de présenter un rapport détaillé et complet.
Cette technologie permet de réaliser en quelques minutes seulement des recherches qui nécessiteraient normalement plusieurs heures de travail. Pour améliorer davantage les performances, Google a récemment mis à niveau Deep Research en intégrant Gemini 2.0 Flash Thinking Experimental.
Désormais, tous les utilisateurs pourront accéder gratuitement à cette fonctionnalité en la sélectionnant depuis la nouvelle barre d’invite ou via le menu déroulant des modèles. Lors de son lancement initial en janvier, cette fonctionnalité était exclusivement réservée aux abonnés Gemini Advanced dans le cadre de l’abonnement Google One AI Premium.
Quant à Gems, cette fonctionnalité permet aux utilisateurs de créer leurs propres experts en intelligence artificielle sur n’importe quel sujet en adaptant les chatbots IA selon leurs besoins spécifiques, sans nécessiter de connaissances avancées en programmation ou en apprentissage automatique. Comme Deep Research, Gems était initialement disponible uniquement pour les abonnés Google One AI Premium, mais est maintenant accessible gratuitement à tous les utilisateurs de l’application Gemini.
La configuration d’un Gem est simple : il suffit de lui fournir une
Elon Musk échoue en justice contre OpenAI
Un juge fédéral a rejeté la demande d’Elon Musk visant à bloquer la transformation d’OpenAI en entreprise à but lucratif. La restructuration peut donc se poursuivre, bien que Musk puisse toujours contester sa légalité lors d’un procès prévu à l’automne 2025.
🔹 Le tribunal a refusé de suspendre la transition d’OpenAI vers un modèle « capped-profit », attirant des investisseurs tout en limitant leurs rendements.
🔹 Musk accuse OpenAI de privilégier le profit au détriment de l’éthique et des principes initiaux de l’IA.
🔹 Son offre de rachat de 97,4 milliards de dollars pour prendre le contrôle d’OpenAI avait déjà été rejetée.
Le procès à venir pourrait encore rebattre les cartes. Affaire à suivre…
Anthropic (Claude IA) lève 3,5 milliards d’euros
La start-up en intelligence artificielle Anthropic a levé 3,5 milliards de dollars lors de sa dernière levée de fonds, atteignant une valorisation de 61,5 milliards de dollars. La ronde, menée par Lightspeed Venture Partners, inclut des investisseurs comme Bessemer Venture Partners et Salesforce Ventures.
Anthropic utilisera les fonds pour développer de nouvelles générations de systèmes d’IA, augmenter ses capacités de calcul, approfondir ses recherches et accélérer son expansion en Asie et en Europe. Le financement fait suite au lancement des modèles Claude 3.7 Sonnet et Claude Code, ce dernier ayant établi de nouvelles normes en matière de codage.
OpenAI lance le modèle vidéo Sora en Europe
Les utilisateurs américains peuvent déjà depuis plusieurs semaines générer des vidéos avec l’intelligence artificielle d’OpenAI. Désormais, Sora est également disponible en Europe.
Depuis la semaine dernière, le modèle d’IA vidéo d’OpenAI, sora.com, est également disponible dans l’UE et au Royaume-Uni. Auparavant, le modèle, qui génère des vidéos à partir de textes saisis, n’était utilisable qu’aux Etats-Unis et dans un groupe sélectionné d’autres pays.
Sora a été lancé en décembre 2024 dans le cadre du programme « 12 Days of OpenAI », au cours duquel l’entreprise a mis en ligne chaque jour, pendant les douze jours précédant Noël, de nouvelles fonctionnalités de son populaire chatbot ChatGPT. Cependant, ceux qui souhaitaient accéder à Sora depuis la France ont été informés jusqu’à la semaine dernière que le modèle n’y était pas disponible. OpenAI l’a maintenant débloqué, à la surprise générale.
sora.com est exclusivement disponible pour les abonnés payants à la version Plus ou Pro de ChatGPT. Ils peuvent se connecter à sora.com avec leur compte ChatGPT. Ils doivent ensuite indiquer leur date de naissance et choisir un nom d’utilisateur.
Anthropic sort son nouveau modèle Claude Sonnet 3.7
Anthropic, le concurrent d’OpenAI, a dévoilé cette semaine son nouveau modèle d’IA, Claude Sonnet 3.7, un modèle dit de raisonnement. Contrairement aux modèles traditionnels qui fournissent des réponses instantanées, ces modèles raisonnent étape par étape. La méthode, appelée « Chain-of-thought » (chaîne de pensée), présente un avantage majeur : l’IA peut s’autocontrôler en résolvant des sous-tâches, tout en rendant son processus de réflexion plus transparent pour l’utilisateur. Cela rend Claude Sonnet 3.7 particulièrement adapté pour les tâches mathématiques, logiques et de programmation.
Le modèle de base, Claude Sonnet 3.7, est accessible gratuitement. Cependant, pour profiter de la fonctionnalité de raisonnement (Reasoning), un compte Pro est nécessaire. Une fois que vous êtes un client payant et que votre compte est activé, vous pouvez sélectionner le mode « Extended » dans le menu déroulant situé dans le coin inférieur gauche du champ de saisie.
Lovable : l’IA qui démocratise la création d’applications
Lovable, le start-up suédois, révolutionne la création d’applications avec son intelligence artificielle « GPT Engineer ». En seulement trois mois, l’entreprise a séduit 30 000 clients payants et généré 17 millions de dollars de revenus annuels. Une levée de fonds de 15 millions de dollars va accélérer son développement. Lovable promet de rendre la création d’applications accessible à tous, transformant de simples descriptions textuelles en logiciels fonctionnels.
Alibaba’s Wan2.1 : Le challenger de Sora
Le laboratoire Tongyi d’Alibaba vient de dévoiler Wan2.1, un modèle open source de génération de vidéos qui fait sensation. Ce modèle surpasse tant les solutions ouvertes que les systèmes propriétaires – y compris Sora d’OpenAI – sur des indicateurs clés, générant des vidéos 2,5 fois plus rapidement. Avec ses 14 milliards de paramètres, Wan2.1 excelle dans la simulation de la physique du mouvement et offre un rendu optimal du texte, en anglais comme en chinois.
Grâce à ses capacités de conversion de texte en vidéo, d’image en vidéo et même de vidéo en audio, ce modèle vient renforcer la dynamique déjà effervescente de la course à l’IA open source en Chine. Certaines sources indiquent par ailleurs que Wan2.1 repose sur une architecture Transformer optimisée pour la vidéo, ce qui améliore considérablement la fluidité des séquences et la cohérence entre le contenu visuel et textuel. Entre Qwen, dédié aux applications linguistiques, et Wan pour la vidéo, 2025 s’annonce potentiellement comme l’année décisive pour l’essor de l’IA chez Alibaba.
Perplexity développe un navigateur web basé sur l’IA appelé Comet
Les intéressés peuvent déjà s’inscrire sur une liste d’attente, mais l’entreprise n’a pas encore révélé de détails sur la date de sortie ou les fonctionnalités. Perplexity mise sur sa base d’utilisateurs existante pour un lancement rapide.
Le navigateur sera probablement basé sur Chromium, avec des fonctionnalités qui pourraient être réalisées via une extension. En janvier, Perplexity avait déjà lancé un assistant IA pour Android et une API pour les recherches assistées par IA. Comet intégrera probablement l’IA de Perplexity pour offrir un assistant conversationnel.
Gemini de Google rend désormais possible le téléchargement de fichiers dans sa version gratuite
Cette fonction de Gemini, qui n’était auparavant disponible que pour les utilisateurs payants ayant souscrit un abonnement « Gemini Advanced », est désormais également accessible dans la version gratuite de l’outil. Les utilisateurs peuvent désormais télécharger différents documents, les analyser et les résumer. La fonction prend en charge un grand nombre de types de fichiers, notamment DOC, PDF, TXT et PPTX, et peut également créer des tableaux et des graphiques à partir des documents téléchargés.
La fonction est disponible dans les applications Gemini pour Android et iOS ainsi que dans la version navigateur. Les fichiers peuvent être ajoutés simplement en cliquant sur le symbole « + » dans le chat. Google souligne que cette fonction augmente la productivité, car les notes ou les textes ne doivent plus être copiés et collés manuellement. Bien que d’autres chatbots d’intelligence artificielle proposent des fonctions similaires, l’intégration dans le service gratuit de Gemini est un complément précieux.
Meta organisera sa première conférence sur l’IA le 29 avril prochain
Meta organise sa première conférence sur l’IA générative, baptisée LlamaCon, le 29 avril. Cet événement vise à présenter les dernières avancées de Meta en matière d’IA open-source et à aider les développeurs à créer des applications innovantes. Bien que les détails sur les intervenants et les produits à présenter ne soient pas encore connus, la conférence devrait notamment mettre en lumière le modèle Llama 4, la quatrième génération d’IA de Meta, prévue pour une sortie ultérieure cette année. Cet événement s’inscrit dans les ambitieux projets de Meta pour 2025, qui incluent également un autre grand rendez-vous plus tard dans l’année.