Les actus IA en bref
Partager la publication
Gemini CLI : Google met l’IA Gemini dans la ligne de commande, gratuitement et en open source
Google continue d’innover dans le domaine de l’intelligence artificielle avec le lancement de <a href="Gemini CLI, un nouvel outil open source qui permet d’intégrer la puissance de Gemini directement dans la ligne de commande des développeurs. Cet outil, entièrement gratuit, s’adresse à tous ceux qui privilégient le terminal pour travailler efficacement et rapidement.
L’une des forces de Gemini CLI réside dans ses limites d’utilisation très généreuses : avec un simple compte Google, les développeurs peuvent effectuer jusqu’à 60 requêtes par minute et 1 000 requêtes par jour, sans aucun frais. Pour ceux qui auraient besoin de plus, des licences payantes via Google AI Studio, Vertex AI ou Gemini Code Assist sont également disponibles.
Gemini CLI donne accès au modèle Gemini 2.5 Pro, capable de gérer un contexte de 1 million de tokens, ce qui permet de travailler sur des bases de code volumineuses ou des projets complexes sans difficulté. Le logiciel est compatible avec Windows, macOS et Linux, et s’intègre parfaitement à l’environnement de travail des développeurs, que ce soit via le terminal natif ou des outils comme Windows Terminal.
Outre la génération de code, Gemini CLI excelle dans la recherche d’erreurs, l’optimisation des flux de travail et la gestion de tâches automatisées grâce à une utilisation non interactive dans les scripts. Le Model Context Protocol (MCP) permet d’étendre ses fonctionnalités, tandis que des configurations personnalisables facilitent l’adaptation aux besoins individuels ou d’équipe.
Le code source, publié sous licence Apache 2.0, est accessible
Organiser son quotidien avec WhatsApp : Perplexity lance les rappels et tâches automatisés
Aujourd’hui, WhatsApp n’est plus seulement un outil de messagerie instantanée : il devient aussi un véritable assistant virtuel grâce à l’intégration de chatbots et d’intelligences artificielles. Parmi les solutions les plus récentes, la Meta AI et Perplexity se démarquent particulièrement.
Depuis quelques mois, Perplexity propose son propre service d’IA directement sur WhatsApp. L’utilisateur peut ainsi dialoguer avec une "AI Answering Machine", rechercher des informations, obtenir des sources fiables, et même générer des images grâce à l’intelligence artificielle, le tout sans quitter l’application.
Désormais, Perplexity va encore plus loin : il est possible de programmer des tâches récurrentes et de recevoir des rappels personnalisés directement sur WhatsApp. Que ce soit pour des rappels simples, des habitudes saines à adopter ou des mises à jour quotidiennes sur l’actualité, l’outil s’adapte à tous les besoins, aussi bien personnels que professionnels. Par exemple, il peut vous rappeler de boire de l’eau, de faire une pause ou de préparer une réunion importante.
Pour profiter de ces fonctionnalités, il suffit d’envoyer un message à Perplexity sur WhatsApp au numéro +1 (833) 436-3285 ou via le lien <a href="http://wa.me/18334363285. L’utilisateur indique simplement la tâche, sa fréquence et le moment où il souhaite recevoir le rappel.
Si les fonctionnalités d’organisation assistée par l’IA ne sont pas nouvelles (OpenAI a lancé récemment des tâches automatisées pour ChatGPT), l’intégration sur WhatsApp séduira particulièrement ceux qui utilisent déjà massivement ce messager et souhaitent éviter de multiplier les applications. Avec Perplexity, la gestion du quotidien
Google offre un accès gratuit à Imagen 4 : essayez l’IA qui révolutionne la création d’images
Google vient d’ouvrir au public, gratuitement et pour une durée limitée, son dernier modèle de génération d’images par intelligence artificielle : Imagen 4. Ce modèle se distingue par sa capacité à produire des images d’un réalisme saisissant, avec une gestion des détails, des styles artistiques et même de l’orthographe nettement supérieure à la plupart des concurrents. Une version encore plus puissante, Imagen 4 Ultra, est également disponible pour ceux qui souhaitent tester des prompts plus complexes ou obtenir un contrôle créatif avancé.
Pour accéder à ces outils, il suffit de passer par l’API Gemini ou l’AI Studio de Google, des plateformes pensées à la fois pour les développeurs et le grand public. Aucune inscription complexe n’est nécessaire pour profiter de cette offre temporaire.
Avec cette initiative, Google démocratise l’accès à des technologies de pointe et invite tous les créateurs à explorer les nouveaux horizons de la génération d’images par IA. Une opportunité à ne pas manquer pour tous ceux qui s’intéressent à la créativité numérique et à l’évolution rapide de l’intelligence artificielle visuelle.
Google lance son modèle Gemini Robotics pour les robots autonomes
Google lance son modèle Gemini Robotics pour les robots autonomes
Google DeepMind a dévoilé une version hors ligne de son modèle <a href="Gemini Robotics qui fonctionne sans connexion internet. Cette innovation apporte de puissantes capacités de vision, de langage et d'action aux robots, tout en s'exécutant entièrement sur l'appareil local.
Le modèle est suffisamment compact pour fonctionner directement sur un robot sans support cloud. Il peut gérer des tâches de motricité fine et suivre des commandes, même sans formation spécifique préalable. Particulièrement impressionnant, il apprend de nouvelles tâches à partir d'aussi peu que 50 à 100 démonstrations.
Cette approche locale pour l'IA robotique représente un choix stratégique intelligent pour les environnements où l'accès internet est limité ou où la sécurité constitue un enjeu majeur. Le modèle tire parti de la compréhension du monde de Gemini pour se généraliser à des situations nouvelles et résoudre une grande variété de tâches dès la sortie de la boîte.
Les robots alimentés par ces modèles peuvent apprendre des actions complexes comme préparer des salades ou même plier un renard en origami. Cette évolution laisse entrevoir un avenir où les robots deviennent considérablement plus flexibles et autonomes, marquant une étape importante vers une robotique véritablement généralisable.
ElevenLabs lance 11ai : l'assistant vocal qui défie Siri et Alexa
ElevenLabs, déjà célèbre pour son expertise dans le clonage vocal par intelligence artificielle, vient de dévoiler 11ai, un assistant vocal expérimental qui ambitionne de rivaliser avec Siri et Alexa. Disponible gratuitement en phase alpha, 11ai privilégie une approche "voice-first" : les utilisateurs peuvent interagir entièrement par la voix, pour une expérience naturelle et fluide.
Le point fort de 11ai, c’est son intégration poussée avec des applications populaires comme Slack, Notion, Linear ou Perplexity. L’assistant devient ainsi un véritable centre de productivité, capable de gérer de nombreuses tâches professionnelles par commande vocale. À cela s’ajoute une personnalisation avancée : plus de 5 000 voix sont proposées et il est même possible de créer son propre clone vocal, rendant chaque assistant unique. On peut le voir en fonction ici sur Youtube.
L’interface, simple et intuitive, permet de configurer précisément les autorisations et garantit la confidentialité des données. Avec cette version alpha, ElevenLabs invite la communauté à tester et enrichir la plateforme, tout en posant les bases d’une nouvelle génération d’assistants vocaux intelligents.
L'explosion des vidéos générées par IA sur TikTok : une révolution créative qui redéfinit le contenu viral
Les vidéos créées par intelligence artificielle connaissent un succès phénoménal sur TikTok, avec certaines publications dépassant les 100 millions de vues et transformant radicalement le paysage de la création de contenu sur la plateforme. TikTok a atteint un milliard d'utilisateurs actifs mensuels en 2024, avec une majorité d'utilisateurs dans la tranche d'âge 18-24 ans, créant un terrain fertile pour l'adoption massive de ces nouvelles technologies créatives.
<a href="Mark Gadala-Maria, entrepreneur et observateur des tendances digitales, a identifié les 10 principales tendances qui façonnent cette révolution. Cette analyse arrive à un moment crucial où TikTok lance de nouveaux outils d'IA permettant de générer instantanément des vidéos de marque et des avatars numériques à partir de simples images ou de texte, démocratisant ainsi la création de contenu professionnel.
Le phénomène s'inscrit dans une transformation plus large de l'écosystème TikTok, où les tendances peuvent propulser un contenu de zéro à viral en quelques secondes. Les créateurs exploitent désormais des générateurs d'IA sophistiqués qui automatisent tout, de la génération de scripts à la sélection de scènes, en passant par les voix-off et le montage, révolutionnant ainsi les méthodes traditionnelles de production vidéo.
Cette évolution répond à une demande croissante des créateurs qui cherchent à optimiser leur processus créatif tout en maintenant l'authenticité et l'engagement qui caractérisent le succès sur TikTok. L'impact de ces outils se mesure non seulement en termes de vues, mais aussi par leur capacité à redéfinir les standards de création de contenu sur les réseaux
Apple lorgne sur Perplexity AI pour contrer Google dans la course à l’IA
Apple explore l’acquisition de Perplexity AI, une startup montante de l’intelligence artificielle valorisée à 14 milliards de dollars. L’objectif ? Rattraper son retard dans la course à l’IA générative et préparer l’après-Google. Selon Bloomberg, plusieurs hauts dirigeants d’Apple, dont Adrian Perica (fusions & acquisitions) et Eddy Cue (services), ont évoqué cette possibilité en interne — même si aucun contact formel n’a encore eu lieu avec Perplexity.
Cette acquisition permettrait à Apple de se doter d’un moteur de recherche basé sur l’IA, alors que son partenariat lucratif avec Google (environ 20 milliards de dollars par an pour rester moteur par défaut sur Safari) est menacé par un procès antitrust aux États-Unis. En parallèle, Apple envisage aussi un partenariat stratégique, en intégrant Perplexity dans Safari et Siri.
La startup, déjà convoitée sans succès par Meta, attire les convoitises avec sa technologie de réponse en temps réel. Mais un accord imminent entre Perplexity et Samsung pourrait compliquer les ambitions d’Apple. Dans un marché où les assistants intelligents deviennent la prochaine grande bataille, Apple veut éviter de rater le coche une seconde fois.
La nouvelle pépite de Mira Murati, Thinking Machines Lab, réussit un tour de table à 2 milliards de dollars
La nouvelle pépite de Mira Murati, Thinking Machines Lab, réussit un tour de table à 2 milliards de dollars
Thinking Machines Lab, la startup IA fondée il y a seulement six mois par Mira Murati, ancienne direThinking Machines Labctrice technique d’OpenAI, vient de boucler un tour de table historique de 2 milliards de dollars, valorisant l’entreprise à 10 milliards. Mené par Andreessen Horowitz, ce financement est l’un des plus importants jamais réalisés en phase seed à Silicon Valley. Malgré le secret absolu sur son produit, la startup ambitionne de rendre les systèmes d’IA plus compréhensibles, personnalisables et performants. L’objectif initial d’un milliard a été doublé en moins de deux mois, avec des investisseurs engagés à hauteur d’au moins 50 millions chacun.
Mira Murati détient désormais des droits de vote au conseil d’administration supérieurs à tous les autres membres réunis, garantissant son contrôle total des décisions stratégiques. Ce succès arrive alors que Meta aurait envisagé une acquisition, sans offre formelle, dans le cadre de sa stratégie pour capter les talents et technologies IA les plus prometteurs. Deux tiers des effectifs de Thinking Machines Lab sont des anciens d’OpenAI, confirmant l’appétit des investisseurs pour les projets portés par ces experts.
OpenAI rompt avec Scale AI : la guerre des données est déclarée
Coup de tonnerre dans l’univers de l’intelligence artificielle : OpenAI met fin à son partenariat avec Scale AI, un fournisseur de données annotées jusque-là central pour l’entraînement de ses modèles. Cette décision intervient peu après l’entrée fracassante de Meta (maison mère de Facebook) au capital de Scale AI à hauteur de 49 %, pour un montant de 14,3 milliards de dollars. L’arrivée de ce concurrent direct soulève de sérieuses préoccupations quant à la confidentialité des données.
Derrière cette rupture se cache un double enjeu : d’une part, la crainte qu’un acteur aussi puissant que Meta puisse avoir accès, même indirectement, à des informations sensibles. D’autre part, un besoin croissant de données ultra spécialisées pour entraîner des modèles d’IA toujours plus complexes et autonomes — un domaine dans lequel Scale AI ne semble plus suffisant.
OpenAI n’est pas seul : Google, xAI et Microsoft prennent aussi leurs distances. Cette vague de désengagement bouleverse le marché de l’annotation, poussant les acteurs à internaliser leurs données ou à se tourner vers de nouveaux partenaires comme Mercor ou Labelbox. La neutralité des fournisseurs devient un critère stratégique incontournable.
Midjourney entre dans l’arène de la vidéo avec son modèle V1
Midjourney, célèbre pour ses images générées par IA au style unique, vient de dévoiler V1, son tout premier modèle de génération vidéo. Ce nouvel outil transforme une simple image – qu’elle provienne de l’utilisateur ou d’un rendu Midjourney – en quatre vidéos de cinq secondes, disponibles exclusivement sur Discord via le web.
Contrairement à ses concurrents comme Sora (OpenAI), Gen-4 (Runway), Firefly (Adobe) ou Veo 3 (Google), Midjourney garde une approche très artistique. Son PDG, David Holz, précise que ce modèle n’a pas pour but de fournir du contenu publicitaire, mais de poser les bases d’une IA capable de générer des mondes ouverts en temps réel. Une ambition qui dépasse la simple création de B-roll hollywoodien.
Mais ce lancement intervient dans un contexte tendu : Disney et Universal viennent de poursuivre Midjourney pour utilisation non autorisée de leurs personnages emblématiques. Une affaire qui souligne la ligne fine entre innovation créative et propriété intellectuelle.
Pour essayer V1, comptez 8 fois plus de crédits qu’une image classique, sauf si vous êtes abonné aux plans Pro (60 $/mois) ou Mega (120 $/mois). Des options permettent de contrôler les mouvements de caméra et d’étendre la durée des vidéos jusqu’à 21 secondes.
MiniMax M1 : l’agent open-source avec une fenêtre contextuelle d’1 million de tokens
MiniMax, la startup de Shanghai, vient de lancer M1, un modèle révolutionnaire doté d’une fenêtre contextuelle immense d’un million de tokens. Cette capacité lui permet de traiter un volume d’informations équivalent à une bibliothèque complète, bien au-delà de la limite « roman » de GPT-4o. M1 surpasse même DeepSeek R1, pourtant récemment amélioré, en offrant une polyvalence exceptionnelle. Ce modèle promet de gérer en autonomie des projets complexes, allant de la création d’une plateforme de streaming type Netflix à la conception d’un tableau de bord financier. Cette avancée majeure illustre la montée en puissance des agents IA open-source capables de rivaliser avec les géants du secteur, tout en offrant une flexibilité et une accessibilité accrues pour les développeurs et les entreprises.