Les actus IA en bref
Partager la publication
Baidu libère Ernie : la Chine accélère l’ouverture de l’IA
Le géant technologique chinois Baidu rend son modèle de langage Ernie open-source à partir du 30 juin. Cette décision, annoncée en février, marque un tournant dans l'IA chinoise car c'est la première fois qu'un acteur majeur libère sa technologie propriétaire. Les experts comparent cette initiative à l'impact qu'a eu DeepSeek-R1 sur le marché mondial de l'IA.
Baidu procédera de manière progressive, mais on ignore encore si le modèle sera entièrement open-source (avec les valeurs numériques ajustables, méthodes d'entraînement et architecture) ou partiellement (seuls les poids du modèle). La première option permet aux développeurs de modifier et reproduire le modèle, tandis que la seconde limite les possibilités d'usage.
Selon Sean Ren, professeur à l'Université de Californie du Sud, "ce n'est pas qu'une histoire chinoise. Chaque fois qu'un laboratoire majeur rend un modèle puissant open-source, cela élève les standards de toute l'industrie." Cette démarche pourrait démocratiser l'IA à l'échelle mondiale.
Google "Magenta RealTime" : un modèle d'IA pour la génération de musique
Google a présenté Magenta RealTime (Magenta RT), un modèle open source pour la création et le contrôle de la musique en temps réel. Il écoute des commandes textuelles, des exemples audio ou une combinaison pondérée de texte et d'audio. Magenta RT se base sur un modèle de transformation de 800 millions de paramètres, qui a été entraîné sur environ 190.000 heures de musique principalement instrumentale. Une limite technique : le modèle ne peut accéder qu'aux dix dernières secondes de la musique générée, car sa fenêtre contextuelle audio ne dépasse pas dix secondes.
Le modèle et le code source sont disponibles sur Github et HuggingFace sous des licences ouvertes. Les utilisateurs peuvent actuellement tester le modèle gratuitement sur des TPU Colab, l'utilisation locale, les adaptations personnelles et la documentation devraient suivre prochainement.
OpenAI "achète" l'équipe complète de Crossing Minds
OpenAI poursuit sa stratégie de croissance en intégrant l’ensemble de l’équipe du spécialiste des systèmes de recommandation Crossing Minds, sans acquérir l’entreprise elle-même. Fondé il y a huit ans, Crossing Minds développait des solutions d’intelligence artificielle pour personnaliser les recommandations sur les plateformes e-commerce, analysant les comportements des utilisateurs tout en respectant leur vie privée. Soutenu notamment par Shopify et ayant levé plus de 14 millions de dollars, le startup a annoncé officiellement le transfert de ses talents vers OpenAI. Cette dernière ambitionne ainsi de renforcer ses compétences en IA pour améliorer notamment son chatbot ChatGPT, qui vient tout juste d’intégrer une fonction d’achat facilitant la recherche de produits. Si le lien entre cette nouvelle fonctionnalité et l’arrivée des experts de Crossing Minds reste à confirmer, cette opération illustre la volonté d’OpenAI d’approfondir ses services personnalisés et l’expérience utilisateur par l’intelligence artificielle.
ChatGPT-5 : l'IA qui redéfinit l'intelligence arrive en juillet
OpenAI s’apprête à lancer ChatGPT-5 en juillet 2025, une évolution majeure qui promet de redéfinir notre interaction avec l’intelligence artificielle. Ce nouveau modèle repousse les limites avec une fenêtre contextuelle beaucoup plus large, capable de gérer des conversations et documents longs sans perdre le fil.
GPT-5 se distingue aussi par ses capacités multimodales unifiées, intégrant texte, image et voix de façon fluide, sans changer d’outil. Son raisonnement s’améliore nettement : il atteint un taux de réussite de 85 % sur des benchmarks exigeants, dépassant largement GPT-4.
Cette nouvelle génération agit comme un assistant personnel intelligent, s’adaptant à des besoins variés, que ce soit pour coder, analyser des données ou organiser le quotidien.
Dans un marché de plus en plus compétitif, avec des challengers comme Claude ou Gemini, GPT-5 confirme la position de leader d’OpenAI et promet de transformer durablement notre vie professionnelle et personnelle grâce à l’IA.
Avec Claude créer une application devient un jeu d'enfant
Antrhopic révolutionne l'expérience utilisateur avec le lancement de son nouveau constructeur d'applications intégré directement dans Claude. Cette fonctionnalité en version bêta permet désormais à tous les utilisateurs de créer, tester et déployer des applications IA sans écrire une seule ligne de code.
Le principe est d'une simplicité déconcertante : il suffit de décrire ce que vous souhaitez créer, et Claude écrira le code pour vous. L'IA génère instantanément du code fonctionnel et affiche les résultats en temps réel. Les premières créations incluent des jeux, des assistants d'écriture, des outils d'apprentissage et même des workflows d'agents multi-étapes.
Cette innovation s'appuie sur la technologie Artifacts existante de Claude, mais va bien plus loin. La plateforme propose un modèle de facturation unique où l'utilisation partagée est facturée au spectateur, pas au créateur, facilitant ainsi la diffusion d'applications.
Le timing de ce lancement est stratégique. Selon Gartner, 70% des nouvelles applications utiliseront des technologies low-code ou no-code d'ici 2025, contre seulement 25% en 2020. Cette transformation crée une nouvelle génération de "développeurs citoyens" - des utilisateurs professionnels capables de créer des applications sans formation en programmation.
Disponible pour tous les plans (Free, Pro et Max), cette fonctionnalité marque un tournant majeur. Claude ne se contente plus de répondre aux questions : il devient un véritable outil de création qui met le prototypage à la portée de tous. Une démocratisation de l'IA qui pourrait bien redéfinir notre rapport à la technologie.
Gemini CLI : Google met l’IA Gemini dans la ligne de commande, gratuitement et en open source
Google continue d’innover dans le domaine de l’intelligence artificielle avec le lancement de Gemini CLI, un nouvel outil open source qui permet d’intégrer la puissance de Gemini directement dans la ligne de commande des développeurs. Cet outil, entièrement gratuit, s’adresse à tous ceux qui privilégient le terminal pour travailler efficacement et rapidement.
L’une des forces de Gemini CLI réside dans ses limites d’utilisation très généreuses : avec un simple compte Google, les développeurs peuvent effectuer jusqu’à 60 requêtes par minute et 1 000 requêtes par jour, sans aucun frais. Pour ceux qui auraient besoin de plus, des licences payantes via Google AI Studio, Vertex AI ou Gemini Code Assist sont également disponibles.
Gemini CLI donne accès au modèle Gemini 2.5 Pro, capable de gérer un contexte de 1 million de tokens, ce qui permet de travailler sur des bases de code volumineuses ou des projets complexes sans difficulté. Le logiciel est compatible avec Windows, macOS et Linux, et s’intègre parfaitement à l’environnement de travail des développeurs, que ce soit via le terminal natif ou des outils comme Windows Terminal.
Outre la génération de code, Gemini CLI excelle dans la recherche d’erreurs, l’optimisation des flux de travail et la gestion de tâches automatisées grâce à une utilisation non interactive dans les scripts. Le Model Context Protocol (MCP) permet d’étendre ses fonctionnalités, tandis que des configurations personnalisables facilitent l’adaptation aux besoins individuels ou d’équipe.
Le code source, publié sous licence Apache 2.0, est accessible à tous, favorisant la transparence et la contribution communautaire. Gemini CLI partage ses technologies avec Gemini Code Assist, ce qui signifie que les fonctionnalités d’IA sont également disponibles dans des environnements comme Visual Studio Code. L’agent mode de Code Assist permet des solutions à plusieurs niveaux, la correction automatique de bugs
Organiser son quotidien avec WhatsApp : Perplexity lance les rappels et tâches automatisés
Aujourd’hui, WhatsApp n’est plus seulement un outil de messagerie instantanée : il devient aussi un véritable assistant virtuel grâce à l’intégration de chatbots et d’intelligences artificielles. Parmi les solutions les plus récentes, la Meta AI et Perplexity se démarquent particulièrement.
Depuis quelques mois, Perplexity propose son propre service d’IA directement sur WhatsApp. L’utilisateur peut ainsi dialoguer avec une "AI Answering Machine", rechercher des informations, obtenir des sources fiables, et même générer des images grâce à l’intelligence artificielle, le tout sans quitter l’application.
Désormais, Perplexity va encore plus loin : il est possible de programmer des tâches récurrentes et de recevoir des rappels personnalisés directement sur WhatsApp. Que ce soit pour des rappels simples, des habitudes saines à adopter ou des mises à jour quotidiennes sur l’actualité, l’outil s’adapte à tous les besoins, aussi bien personnels que professionnels. Par exemple, il peut vous rappeler de boire de l’eau, de faire une pause ou de préparer une réunion importante.
Pour profiter de ces fonctionnalités, il suffit d’envoyer un message à Perplexity sur WhatsApp au numéro +1 (833) 436-3285 ou via le lien http://wa.me/18334363285. L’utilisateur indique simplement la tâche, sa fréquence et le moment où il souhaite recevoir le rappel.
Si les fonctionnalités d’organisation assistée par l’IA ne sont pas nouvelles (OpenAI a lancé récemment des tâches automatisées pour ChatGPT), l’intégration sur WhatsApp séduira particulièrement ceux qui utilisent déjà massivement ce messager et souhaitent éviter de multiplier les applications. Avec Perplexity, la gestion du quotidien devient plus simple, rapide et centralisée, le tout à portée de main.
Google offre un accès gratuit à Imagen 4 : essayez l’IA qui révolutionne la création d’images
Google vient d’ouvrir gratuitement et pour une durée limitée, son dernier modèle de génération d’images par intelligence artificielle : Imagen 4. Ce modèle se distingue par sa capacité à produire des images d’un réalisme saisissant, avec une gestion des détails, des styles artistiques et même de l’orthographe nettement supérieure à la plupart des concurrents. Une version encore plus puissante, Imagen 4 Ultra, est également disponible pour ceux qui souhaitent tester des prompts plus complexes ou obtenir un contrôle créatif avancé.
Pour accéder à ces outils, il suffit de passer par l’API Gemini ou l’AI Studio de Google, des plateformes pensées à la fois pour les développeurs et le grand public. Aucune inscription complexe n’est nécessaire pour profiter de cette offre temporaire.
Avec cette initiative, Google démocratise l’accès à des technologies de pointe et invite tous les créateurs à explorer les nouveaux horizons de la génération d’images par IA. Une opportunité à ne pas manquer pour tous ceux qui s’intéressent à la créativité numérique et à l’évolution rapide de l’intelligence artificielle visuelle.
