Les actus IA en bref
Partager la publication
Suivez le Père Noël en temps réel grâce à l'intelligence artificielle
Cette année, les outils de suivi du Père Noël intègrent l'intelligence artificielle pour enrichir l'expérience des enfants. Le NORAD et Google proposent des plateformes qui permettent de suivre la tournée du Père Noël en direct.
Le NORAD a récemment collaboré avec OpenAI pour ajouter des fonctionnalités innovantes à son traceur. Les familles peuvent désormais transformer leurs photos en personnages d'elfes animés grâce à un générateur d'images, créer des idées de jouets convertibles en pages de coloriage imprimables, et utiliser un outil de création d'histoires personnalisées en ajoutant des noms et lieux.
Le traceur utilise une représentation 3D construite sur la bibliothèque de cartographie open source de Cesium, combinée aux images satellites de Bing Maps pour un rendu réaliste. Cette technologie remplace l'ancienne animation 2D et offre une visualisation immersive du voyage du Père Noël à travers le globe. Une "Santa Cam" diffuse des vidéos du Père Noël livrant ses cadeaux à travers le monde. Le site est disponible en huit langues, dont le français.
Le village du Pôle Nord propose également un compte à rebours, des jeux d'arcade, de la musique festive et une bibliothèque en ligne. Le service est accessible sur noradsanta.org, via l'application mobile (iOS et Android), sur les réseaux sociaux comme Facebook, X (Twitter) et Instagram, ou par téléphone au 1-877-HI-NORAD (USA 1-877-446-6732) où des bénévoles répondent aux questions des enfants.
YouTube lance un outil pour créer des jeux vidéo en quelques clics
YouTube Gaming a annoncé le lancement de Playables Builder, un outil qui permet aux créateurs de concevoir des mini-jeux sans aucune compétence en programmation. Cette application web prototype, développée avec le modèle d'intelligence artificielle Gemini 3, transforme de simples descriptions textuelles, des images ou des vidéos en expériences de jeu fonctionnelles que les créateurs peuvent partager avec leur audience.
Les créateurs sélectionnés peuvent décrire leur idée de jeu en quelques lignes, et l'outil génère automatiquement un jeu jouable en quelques minutes. Cette initiative s'inscrit dans la continuité de YouTube Playables, une fonctionnalité lancée initialement pour les abonnés Premium il y a deux ans, qui proposait des jeux casual sur la plateforme. YouTube a collaboré avec plusieurs créateurs tels que Sambucha, AyChristene, Gohar Khan et Mogswamp pour développer les premiers jeux avec cet outil.
Le programme est actuellement en phase de test bêta fermé et n'est accessible qu'aux créateurs situés aux États-Unis, au Canada, en Grande-Bretagne et en Australie. Pour participer, les candidats doivent posséder une chaîne YouTube active et une adresse électronique valide, puis soumettre leur candidature via le site officiel de Playables Builder. Une fois approuvés, YouTube leur transmet les identifiants de connexion pour accéder à l'outil.
L'intelligence artificielle accélère de 30% le diagnostic du cancer du rein
Une nouvelle avancée dans le domaine de l'imagerie médicale pourrait transformer la détection précoce du cancer du rein. Des chercheurs de l'Université de Tartu en Estonie ont développé BMVision, un outil d'intelligence artificielle basé sur l'apprentissage profond qui assiste les radiologues dans l'analyse des scanners CT (tomodensitométrie). Cette innovation arrive à point nommé face à la pénurie mondiale de radiologues et à la demande croissante d'examens d'imagerie.
L'étude, publiée dans la revue Nature, a testé BMVision auprès de six radiologues analysant 2 400 scanners. Les résultats sont impressionnants : le temps nécessaire pour identifier, mesurer et rapporter les lésions malignes a été réduit de 30%. Dans certains cas, le temps de lecture des scanners a diminué de 52%. La génération automatique de rapports a considérablement réduit le temps de saisie et de dictation, tandis que la sensibilité de détection s'est améliorée de 6%, renforçant la précision et la cohérence entre radiologues.
Dmytro Fishman, cofondateur de Better Medicine, la startup qui commercialise le logiciel, souligne que "le cancer du rein est l'un des cancers les plus fréquents du système urinaire". Selon les chercheurs, l'IA ne remplacera pas les radiologues mais deviendra un assistant précieux, permettant d'offrir aux patients des résultats plus rapides et plus fiables.
SoftBank joue son va-tout pour boucler un financement record d’OpenAI
Le groupe japonais SoftBank tente de réunir 22,5 milliards de dollars avant la fin de l’année 2025 afin de respecter son engagement financier envers OpenAI. Cette somme correspond à la seconde tranche d’un investissement total pouvant atteindre 30 milliards de dollars, après un premier versement effectue plus tôt dans l’année.
Pour tenir ce calendrier serre, SoftBank a engagé une vaste opération de mobilisation de liquidités. Le groupe a notamment vendu l’intégralité de sa participation dans Nvidia, pour un montant estime a 5,8 milliards de dollars, et cède une partie importante de ses actions T-Mobile US, générant environ 4,8 milliards de dollars supplémentaires. D’autres leviers sont également envisagés, comme des emprunts adosses a la participation du groupe dans Arm Holdings, dont la valeur a fortement progressé depuis son introduction en bourse.
En parallèle, SoftBank a quasiment mis à l’arrêt les nouveaux investissements de son Vision Fund. Toute opération supérieure a 50 millions de dollars doit désormais recevoir l’aval direct de Masayoshi Son. Cette stratégie illustre un choix de concentration extrême, le dirigeant japonais misant prioritairement sur OpenAI.
Ce pari repose sur une appréciation rapide de la valeur de l’entreprise, entrée en discussions sur une valorisation proche de 900 milliards de dollars, contre environ 300 milliards quelques mois plus tôt. Un potentiel gain théorique majeur, mais qui s’accompagne de risques élevés tant que la rentabilité d’OpenAI n’est pas atteinte.
Alibaba devoile Qwen-Image-Layered : une IA d'édition d’images en calques RGBA, plus précise et plus contrôlable
Alibaba, via son projet Qwen, met en avant Qwen-Image-Layered, un modèle qui cherche a rapprocher l'édition d’images par intelligence artificielle des usages des logiciels de création classiques. L’enjeu est simple : dans beaucoup de solutions actuelles, une retouche demandée par texte peut entrainer des changements non désirés ailleurs dans l’image, car tout est modifie "en bloc".
Qwen-Image-Layered adopte une approche différente en décomposant l’image en plusieurs calques RGBA (Rouge, Vert, Bleu, Alpha : canal de transparence). Concrètement, chaque calque peut correspondre a une partie de la scène (un personnage, un objet, l’arrière-plan), avec sa propre transparence, ce qui permet de travailler élément par élément plutôt que sur un rendu unique.
Cette organisation en calques rend les instructions plus spécifiques : recolorer un vêtement sans changer la peau, remplacer un objet sans détruire l’éclairage global, supprimer un élément sans "manger" les contours, ou ajuster un détail tout en préservant le reste de la composition. Le résultat attendu est une édition plus fiable, car les modifications sont cantonnées au bon niveau, a la manière des flux de travail des designers.
Sur le plan technique, la publication associe le modèle a une approche de type diffusion et insiste sur l’idée de calques "sémantiquement desentremêlés", afin que chaque couche reste exploitable pour des retouches successives. Cela ouvre aussi la voie a des itérations plus rapides : on peut affiner un seul élément plusieurs fois (couleurs, texture, forme) sans régénérer toute l’image, ce qui facilite le contrôle créatif et la cohérence visuelle.
A court terme, ce type de modèle peut intéresser la création de contenus, le prototypage graphique, ou la production de visuels marketing, car il combine prompt et logique de calques dans un même pipeline.
Mistral OCR-3 : Une précision inédite pour la reconnaissance de documents
L'entreprise française Mistral AI affirme son expertise technologique avec le déploiement de Mistral OCR 3
, son modèle de traitement documentaire le plus avancé à ce jour. Ce nouvel outil repousse les limites de l'OCR (“Optical Character Recognition” ou Reconnaissance Optique de Caractères) en affichant un taux de “victoire” global de 74% face à sa version précédente, Mistral OCR-2, lors de tests de performance internes.
Optimisé pour les défis du monde réel, ce modèle excelle particulièrement dans l'analyse de documents dits difficiles. Il traite avec une aisance remarquable les images de mauvaise qualité, les formulaires administratifs complexes, les tableaux à cellules fusionnées et même l'écriture manuscrite cursive. Au-delà de la simple extraction de texte, il comprend la mise en page, restituant les données sous forme de code Markdown et de tables HTML parfaitement structurées.
Cette capacité de structuration est essentielle pour alimenter les systèmes de RAG (“Retrieval-Augmented Generation” ou Generation Augmentee par la Recuperation), permettant aux assistants IA de comprendre des documents comme un humain le ferait. Accessible notamment via l'interface “Document AI Playground”, cette solution proposée à 2 dollars les 1000 pages positionne fermement la pépite française face aux géants du secteur.
Meta lance SAM Audio, un modèle d'intelligence artificielle pour isoler les sons
Meta a dévoilé SAM Audio le 17 décembre 2025, le premier modèle unifié d'intelligence artificielle capable de segmenter et d'isoler des sons à partir de mélanges audio complexes. Ce modèle, disponible en source ouverte, permet aux utilisateurs d'extraire des sources sonores spécifiques en utilisant trois types d'instructions différentes : textuelles, visuelles ou temporelles.
Avec les instructions textuelles, les utilisateurs peuvent décrire le son souhaité comme "batterie" ou "bruit de fond". Les instructions visuelles permettent de cliquer sur un objet ou une personne dans une vidéo pour isoler le son associé. Enfin, les instructions temporelles, une première dans l'industrie, permettent de marquer un segment de temps spécifique où le son cible se produit.
SAM Audio repose sur une architecture de transformateur de diffusion utilisant la technique "flow-matching" et fonctionne dans un espace latent DAC-VAE (Codage Audio Discret - Auto-Encodeur Variationnel). Le modèle génère deux sorties audio distinctes : la piste cible isolée et le résidu contenant tous les autres sons.
Les applications pratiques incluent la production musicale pour séparer les instruments, le nettoyage de dialogues, l'extraction d'effets sonores spécifiques et l'élimination du bruit de fond. Le modèle traite l'audio plus rapidement que le temps réel avec un facteur de 0,7, et ses performances surpassent l'état de l'art actuel, particulièrement lorsque plusieurs modalités d'instructions sont combinées.
L'IA Mindpeak et le biotechnologue Tubulis s'allient pour guérir les tumeurs
Une alliance stratégique majeure vient d'être scellée entre deux pépites de l'innovation allemande : Tubulis, une biotech munichoise, et Mindpeak, une start-up hambourgeoise spécialisée dans l'intelligence artificielle. Leur objectif commun est d'améliorer l'efficacité des traitements oncologiques en développant de nouveaux biomarqueurs prédictifs.
Au cœur de cette collaboration se trouvent les "Antibody-Drug Conjugates" (ADC, ou conjugués anticorps-médicament). Ces thérapies ciblées agissent comme des missiles guidés, transportant une charge chimiothérapeutique directement vers les cellules cancéreuses tout en épargnant les tissus sains. Tubulis apporte ici son expertise avec une technologie agissant comme une "super-colle" moléculaire, garantissant des ADC ultra-stables.
Pour que ces traitements sophistiqués soient efficaces, il est crucial d'identifier les patients réceptifs. C'est là qu'intervient Mindpeak. Ses algorithmes d'apprentissage profond analysent des images de tissus pathologiques en quelques secondes pour détecter et quantifier des cellules tumorales ou des protéines spécifiques. En combinant ces deux expertises, les partenaires espèrent affiner la sélection des patients lors des essais cliniques et accélérer l'avènement d'une médecine de précision, où chaque malade reçoit le traitement le plus adapté à son profil biologique unique.
