Les actus IA en bref
Partager la publication
OpenAI et Microsoft signent un accord préliminaire : OpenAI reste à but non lucratif mais va créer une entité commerciale de grande ampleur
OpenAI et Microsoft ont conclu un memorandum d’entente non contraignant (MOU) pour redéfinir leur partenariat, ouvrant la voie à une réorganisation d’OpenAI vers une structure à but lucratif (public benefit corporation), tout en maintenant un contrôle par l’entité à but non lucratif.
Selon les nouveaux termes, l’OpenAI nonprofit conservera l’autorité décisionnelle et recevra une participation en capital dépassant les 100 milliards de dollars au sein de la future filiale commerciale. Cet ajustement doit permettre à OpenAI de lever plus de fonds pour ses ambitions en intelligence artificielle — tout en affirmant que sa mission de bénéfice pour tous restera inscrite dans sa gouvernance.
Les autorités de Californie et du Delaware sont associées à ce processus pour garantir que le bien commun continue d’être respecté. Le MOU reste non contraignant pour l’instant : les détails contractuels doivent encore être finalisés.
Quand un robot joue 106 échanges de ping-pong : l’IA humanoïde de UC Berkeley défie l’imprévisible
Des chercheurs de l’Université de Californie à Berkeley ont conçu HiTTER ("HumanoId Table TEnnis Robot"), un robot humanoïde capable de tenir un suite de 106 échanges consécutifs contre un adversaire humain — un exploit rare même pour des joueurs amateurs.
HiTTER fonctionne selon une architecture hiérarchique combinant deux volets :
- planification model-based : prédiction de la trajectoire de la balle, détermination du moment, de la position et de la vitesse de frappe.
- contrôle whole-body via apprentissage par renforcement (reinforcement learning) incorporant des données de mouvement humain pour rendre les gestes plus naturels.
Le robot peut réagir à des balles voyageant à plus de 5 m/s (≈ 11 mph), en moins d’une seconde, tout en maintenant son équilibre.
Parmi les défis restants : l’absence de prise en compte du spin élevé (effet de balle), la nécessité d’un système de capture externe (motion capture) pour la détection de la balle, et le fait qu’il ne sert pas encore automatiquement.
Cette avancée met en lumière le potentiel des architectures mêlant planification prédictive et contrôle appris, pour des robots capables d’interagir avec des environnements dynamiques de façon fluide et précise. Regarder HITTER en action.
Comment le Thinking Machines Lab de Mira Murati vise des réponses IA vraiment reproductibles
Thinking Machines Lab, la startup fondée par Mira Murati (ex-CTO d’OpenAI), fait parler d’elle avec sa première publication de recherche, « Defeating Nondeterminism in LLM Inference ». Le laboratoire, financé à hauteur de "2 milliards de dollars" et valorisé autour de "12 milliards", examine pourquoi les grands modèles de langage (LLM) donnent des réponses imprévisibles, même avec le même texte en entrée.
Selon Horace He, chercheur chez Thinking Machines, ce ne sont pas simplement les calculs sur GPU ou la simultanéité de l’exécution qui provoquent cette non-déterminisme, mais une cause concrète : le "paramètre de taille de lot (batch size)" qui varie de manière aléatoire pendant l’inférence. Ils montrent que même des modèles comme Qwen-3-8B peuvent être exécutés de façon "déterministe", entre autres en fournissant des noyaux (kernels) invariants au batch et un code PyTorch adapté.
Les implications sont grandes : pour la recherche, pour les entreprises, et pour l’entraînement par apprentissage par renforcement (RL), où la réduction du bruit dans les données de retour améliore les modèles. Le lab annonce aussi que son premier produit, destiné aux chercheurs et startups, sera dévoilé prochainement.
Micro1 séduit les laboratoires d’IA avec une levée de fonds à 500 M$
Micro1, une startup spécialisée dans le recrutement et la gestion de contractuels humains pour l’étiquetage et l’entraînement de données, vient de lever 35 millions de dollars en série A, atteignant une valorisation de 500 millions. Fondée il y a seulement trois ans, l’entreprise est dirigée par Ali Ansari, 24 ans, et connaît une croissance rapide : son chiffre d’affaires récurrent annuel est passé de 7 à 50 millions de dollars en quelques mois.
Cette progression intervient alors que le marché du data labeling connaît un bouleversement. Après l’investissement massif de Meta dans Scale AI, plusieurs laboratoires comme OpenAI et Google ont pris leurs distances, ouvrant un espace que Micro1 et d’autres concurrents — Mercor et Surge notamment — cherchent à occuper. Contrairement à Scale AI, qui s’appuyait sur une main-d’œuvre peu qualifiée, Micro1 mise sur des experts confirmés, recrutés via son agent IA Zara, capable d’identifier des profils de haut niveau tels que des ingénieurs, médecins ou professeurs d’université.
Le tour de table, mené par 01 Advisors (cofondé par les anciens dirigeants de Twitter Dick Costolo et Adam Bain), renforce la position de Micro1, qui prépare déjà des offres dans les environnements virtuels destinés à entraîner des agents IA. Avec la demande croissante en données spécialisées, l’entreprise s’impose comme un acteur stratégique aux côtés des géants du secteur.
Seedream 4.0 : ByteDance muscle son IA face à DeepMind
ByteDance, la maison mère de TikTok, vient de dévoiler Seedream 4.0, la nouvelle génération de son modèle de génération d’images. Cette version vise à concurrencer directement les modèles les plus avancés de DeepMind et d’autres laboratoires spécialisés dans l’IA visuelle.
Seedream 4.0 mise sur une amélioration significative de la qualité des images produites, avec un meilleur réalisme et une capacité renforcée à suivre des instructions complexes. Le modèle introduit aussi des fonctions de cohérence spatiale et de rendu détaillé, essentielles pour des applications comme la publicité, la création de contenus immersifs et les expériences interactives. ByteDance entend ainsi se positionner non seulement sur le divertissement, mais aussi sur des cas d’usage professionnels, allant du design produit à la mode.
Le lancement de Seedream 4.0 illustre la volonté de ByteDance de s’imposer dans la course mondiale aux modèles génératifs multimodaux, un terrain où DeepMind, OpenAI et Anthropic occupent déjà une place majeure. Avec ses ressources colossales et son écosystème d’applications grand public, l’entreprise espère transformer Seedream en un pilier de la création numérique de demain.
Stability AI lance Stable Audio 2.5 et mise sur l’identité sonore des entreprises
Stability AI vient de dévoiler Stable Audio 2.5, un modèle pensé pour la génération audio à l’échelle des entreprises. Cette nouvelle version combine rapidité, qualité et flexibilité, ouvrant la voie à des identités sonores personnalisées, aussi stratégiques que les visuels dans la communication des marques.
Stable Audio 2.5 réduit drastiquement les délais de création : grâce aux GPU H100, il ne faut plus que deux secondes pour produire des pistes de trois minutes, contre plusieurs dizaines auparavant. L’outil intègre aussi l’« audio inpainting », une fonction d’édition qui permet de modifier ou d’étendre facilement des fichiers existants, offrant plus de contrôle créatif.
La technologie repose sur une méthode d’entraînement baptisée ARC, conçue pour améliorer la qualité sans nécessiter une puissance de calcul excessive. Du côté des entreprises, Stability AI propose des services avancés comme le fine-tuning sur des jeux de données propriétaires, des options de déploiement variées et un accès à des données sous licence.
Pour son lancement, la société s’associe avec Amp, une agence spécialisée dans le branding sonore et membre du groupe WPP. Objectif : proposer aux grandes marques des solutions audio sur mesure et renforcer leur présence auprès du public.
En intégrant l’audio dans sa stratégie, Stability AI confirme une tendance : la voix et le son deviennent des piliers incontournables de l’engagement client.
YouTube déploie le doublage multilingue pour tous et ouvre de nouvelles perspectives aux créateurs
YouTube vient d’annoncer le lancement officiel de sa fonctionnalité audio multilingue, après deux ans de tests limités. Désormais, des millions de créateurs pourront ajouter des pistes audio doublées dans différentes langues à leurs vidéos, élargissant ainsi leur audience mondiale. Le déploiement se fera progressivement dans les prochaines semaines.
Testée depuis 2023 avec des figures comme MrBeast, Mark Rober ou le chef Jamie Oliver, cette option reposait d’abord sur des services externes avant que YouTube n’introduise son propre outil de doublage automatique, propulsé par l’IA Gemini de Google. Cet outil est capable de reproduire le ton et les émotions du créateur, ce qui rend le contenu plus naturel pour les spectateurs étrangers.
Les premiers résultats sont encourageants : selon YouTube, les vidéos utilisant l’audio multilingue enregistrent en moyenne plus de 25 % de leur temps de visionnage dans une langue autre que la langue principale. L’exemple de Jamie Oliver est parlant : ses vues ont été multipliées par trois grâce à cette nouveauté. En parallèle, YouTube teste également des vignettes multilingues pour que les miniatures s’affichent directement dans la langue préférée des utilisateurs.
Avec ces avancées, YouTube confirme sa volonté de soutenir les créateurs dans leur conquête d’un public international, en combinant intelligence artificielle et accessibilité.
OpenAI miserait 300 milliards sur Oracle pour sécuriser sa puissance de calcul
OpenAI et Oraclee auraient conclu un accord d’une ampleur inédite dans le cloud computing. Selon le Wall Street Journal, OpenAI s’engagerait à acheter pour près de 300 milliards de dollars de puissance de calcul auprès d’Oracle sur une période de cinq ans, à partir de 2027. S’il se confirme, ce contrat deviendrait l’un des plus importants jamais signés dans l’histoire du cloud.
Oracle n’a pas commenté l’information et OpenAI n’a pas répondu aux demandes de confirmation. Cette collaboration n’est pourtant pas nouvelle : OpenAI s’appuie déjà sur Oracle depuis 2024 et s’est progressivement éloigné de sa dépendance exclusive à Microsoft Azure. Le virage s’est accentué début 2025, notamment avec le lancement du gigantesque Stargate Project, auquel OpenAI, Oracle et SoftBank ont promis 500 milliards de dollars d’investissements pour bâtir de nouveaux centres de données.
Cette diversification des partenariats reflète une réalité : la demande colossale en puissance de calcul nécessaire aux modèles d’intelligence artificielle de nouvelle génération. En parallèle, OpenAI a aussi conclu un accord avec Google au printemps 2025, malgré la rivalité féroce entre les deux acteurs. Ces alliances croisées montrent que la bataille de l’IA ne se joue pas seulement sur les algorithmes, mais aussi sur la capacité à sécuriser l’accès aux ressources informatiques indispensables pour les entraîner.