Les actus IA en bref
Partager la publication
GPT-5.1 : la nouvelle version de l’IA de OpenAI qui devient plus chaleureuse et personnalisable
OpenAI a lancé GPT-5.1, une évolution majeure de son modèle phare, pensée pour rendre les échanges plus naturels et plus personnalisés. Cette version introduit deux variantes : "Instant" et "Thinking". La première offre des réponses plus rapides et un ton plus chaleureux, tandis que la seconde se concentre sur les tâches complexes en ajustant automatiquement son "temps de réflexion" pour gagner en précision et en persistance.
Selon OpenAI, GPT-5.1 Instant est "plus chaleureuse, plus intelligente et meilleure pour suivre vos instructions". De son côté, GPT-5.1 Thinking est "plus facile à comprendre, plus rapide sur les tâches simples et plus tenace sur les tâches difficiles". Le système choisit automatiquement la variante la plus adaptée selon la demande.
Autre nouveauté notable : l’arrivée de styles de conversation prédéfinis, permettant de personnaliser l’interaction en mode "Professionnel", "Amical" ou "Efficace". Cette flexibilité fait de GPT-5.1 un outil particulièrement utile pour les créateurs de contenu et les sites spécialisés dans l’intelligence artificielle, qui peuvent ainsi produire aussi bien des textes rapides et engageants que des analyses approfondies.
Une nouvelle fonction pour NotebookLM de Google : "Deep Research" (recherche approfondie)
La plateforme NotebookLM de Google accueille une nouvelle fonctionnalité, baptisée "Deep Research", conçue pour automatiser la recherche en ligne et fournir des rapports structurés. L’utilisateur pose une question, choisit un style de recherche ("Fast Research" pour une exploration rapide ou "Deep Research" pour un travail approfondi), et bénéficie d’un plan de recherche généré par l’IA. Cette dernière parcourt des centaines de sites web, puis génère un document étayé que l’on peut directement insérer dans son carnet de notes.
En parallèle, la compatibilité de NotebookLM avec plusieurs formats de fichiers est étendue : désormais, il est possible d’intégrer directement dans l’outil des fichiers Google Sheets, des fichiers stockés sur Google Drive via URL, des PDF, et même des documents Microsoft Word (.docx).
Pour les créateurs de contenu, les chercheurs ou ceux qui tiennent un blog spécialisé dans l’IA, cette mise à jour permet de centraliser encore davantage les sources, de transformer des données brutes en rapports exploitables, et de gagner du temps dans le flux de travail. Le déploiement complet est annoncé "dans la semaine".
Un tribunal allemand condamne OpenAI pour violation du droit d'auteur
Un tribunal de Munich a jugé qu'OpenAI a violé le droit d'auteur allemand en utilisant des paroles de chansons protégées pour entraîner ChatGPT sans autorisation. Cette décision fait suite à une plainte déposée en novembre 2024 par la GEMA (Société pour l'exploitation et la reproduction mécanique des droits musicaux), l'organisation allemande de gestion collective des droits musicaux, qui représente environ 100 000 membres. Le tribunal a rejeté l'argument d'OpenAI selon lequel l'entreprise bénéficiait du statut d'organisation de recherche privilégiée et que l'exploration de textes et de données justifiait l'utilisation de ces contenus. La juge présidente Elke Schwager a ordonné à OpenAI de cesser ces pratiques et de verser des dommages et intérêts non divulgués à la GEMA, incluant les redevances impayées et les frais juridiques. Le tribunal a également refusé d'accorder à OpenAI un délai de grâce de six mois pour se conformer, estimant que l'entreprise a fait preuve de négligence. OpenAI, représenté par le cabinet Quinn Emanuel Urquhart & Sullivan, a contesté la décision et envisage un appel. La GEMA, assistée par le cabinet Raue, considère ce jugement comme "la première décision historique en matière d'intelligence artificielle en Europe". Le directeur général de la GEMA, Tobias Holzmüller, a déclaré que cette décision protège les moyens de subsistance des créateurs musicaux. OpenAI fait face à d'autres poursuites similaires de la part de créateurs et de groupes médiatiques, notamment Ziff Davis et The New York Times.
Quand la musique artificielle détrône les artistes humains aux États-Unis
Pour la première fois dans l’histoire des classements américains, un morceau généré par une intelligence artificielle (IA) s’est hissé en tête des ventes digitales. Le titre "Walk My Walk" du groupe virtuel Breaking Rust occupe désormais la première place du classement country de Billboard. À première écoute, rien ne trahit son origine artificielle : ce sont surtout l’artwork et les vidéos promotionnelles diffusées sur Instagram qui laissent deviner la génération par IA.
Billboard a confirmé que Breaking Rust est une "groupe country assisté par IA" et a identifié un auteur principal, Aubierre Rivaldo Taylor – sans qu’on sache s’il s’agit d’une véritable personne. Ce succès marque une étape symbolique : l’IA s’impose dans la création musicale populaire. Le magazine Holler évoque cependant une "vision dystopique" de la musique, dénonçant le caractère superficiel de ces morceaux pourtant calibrés pour plaire.
Alors que les projets musicaux issus d’IA se multiplient, la frontière entre artiste et algorithme devient de plus en plus floue. Une évolution que certains comparent déjà à l’émergence de l’autotune dans les années 2000.
Google Photos boosté par l’IA : montage photo, recherche nouvelle génération et modèle Nano Banana
Google Photos vient d’annoncer des nouveautés majeures dopées à l’intelligence artificielle (IA), offrant aux utilisateurs des outils évolués pour modifier leurs images, rechercher des photos et créer de nouveaux formats stylisés. Parmi ces nouveautés, la fonction « Help me edit » permet de donner plusieurs instructions de retouche dans une même image, comme supprimer des lunettes ou illuminer un sourire, grâce à une reconnaissance avancée des visages.
Le modèle IA Nano Banana fait son entrée et élève le montage d’image à un niveau professionnel. Il s’appuie sur des commandes textuelles naturelles pour éditer une photo avec cohérence, préserver les détails des visages et intégrer des objets ou des styles complexes, tels que le portrait Renaissance ou le style BD. Nano Banana excelle dans la fusion des éléments visuels tout en gardant la scène homogène, répondant ainsi parfaitement aux attentes des utilisateurs exigeants et des créateurs de contenu.
En plus de cela, Google Photos élargit sa fonction de recherche intelligente à plus de 100 pays et prend en charge 17 nouvelles langues, rendant la recherche d’images et d’informations beaucoup plus accessible à l’échelle mondiale.
Google Photos devient ainsi un véritable assistant créatif, mixant montage photo avancé et recherche intuitive pour une expérience enrichie.
Meta Omnilingual ASR : la transcription vocale pour plus de 1 600 langues
Meta, via son équipe Fundamental AI Research (FAIR), a lancé Omnilingual ASR, une suite open source innovante capable de transcrire plus de 1 600 langues, dont 500 langues peu couvertes par les systèmes existants. Cette suite se distingue par sa capacité à fournir une reconnaissance automatique de la parole (ASR) native à une échelle jamais atteinte, avec une erreur de caractères inférieure à 10% pour 78% des langues supportées.
Cette technologie combine un modèle multilingue wav2vec 2.0 de 7 milliards de paramètres et un corpus unique appelé Omnilingual ASR Corpus, qui inclut plus de 3 000 heures d’enregistrements de langues peu desservies, collectées directement auprès des communautés locales pour offrir des données plus naturelles et variées. Omnilingual ASR utilise en outre l’apprentissage par contexte (in-context learning) pour s’adapter rapidement à de nouvelles langues avec seulement quelques exemples audio, même si elles ne sont pas présentes dans la base d’entraînement.
L’intégralité des modèles, code et corpus est accessible sous licence Apache 2.0, offrant ainsi un cadre flexible et communautaire pour étendre cette technologie à l’échelle mondiale et réduire la fracture linguistique numérique.
SoftBank vend entièrement sa participation dans Nvidia pour financer ses paris sur l'IA
SoftBank a vendu sa totalité de sa participation dans Nvidia pour un gain de 5,83 milliards de dollars. Le président Masayoshi Son réalise cette opération afin de mobiliser des liquidités pour financer des investissements majeurs dans l'intelligence artificielle, notamment via OpenAI. Depuis son retour sur le titre en 2020, SoftBank avait vu sa position valorisée à environ 3 milliards en mars 2025, avant l'explosion de la valorisation de Nvidia à plus de 5 000 milliards de dollars, faisant d'elle la première entreprise à franchir cette barre historique.
Cet argent servira à soutenir "Stargate," un projet d'infrastructure d'IA à 500 milliards annoncé en février en collaboration avec Donald Trump, Sam Altman et Larry Ellison, destiné à construire des centres de données et sites de fabrication de robots aux États-Unis. SoftBank réorganise ainsi son portefeuille pour capitaliser non seulement sur les composants matériels, mais surtout sur les applications logicielles et plateformes d'IA. Sa participation dans OpenAI a déjà gagné 14,6 milliards de dollars de valeur, tandis que ses résultats trimestriels ont dépassé les attentes avec un bénéfice net de 16,2 milliards de dollars.
Cette stratégie montre la conviction de Son que la croissance d'OpenAI surpassera celle de Nvidia, tout en gardant une position intégrée dans l'ensemble de la chaîne de valeur de l'IA.
Wikipedia somme les entreprises d’IA de payer pour utiliser ses contenus
Alors que le trafic de Wikipedia diminue face à la montée de l’intelligence artificielle, la Wikimedia Foundation tire la sonnette d’alarme. Dans un récent billet de blog, l’organisation à but non lucratif appelle les entreprises d’IA à accéder à ses données via Wikimedia Enterprise, sa plateforme payante, plutôt que par le grattage automatique (scraping). Ce service permet un usage massif de son contenu sans surcharger ses serveurs et garantit que les contributions des bénévoles soient correctement créditées.
Selon la fondation, de nombreux robots d’IA ont récemment contourné ses systèmes de détection pour collecter ses données, provoquant une hausse artificielle du trafic en mai et juin. Parallèlement, les vues humaines ont chuté de 8% sur un an. Wikipedia insiste sur la transparence des sources : chaque contenu généré par l’IA doit mentionner la provenance et encourager les utilisateurs à consulter les pages d’origine.
La Wikimedia Foundation a également dévoilé une stratégie interne intégrant l’IA, non pas pour remplacer les rédacteurs bénévoles, mais pour les assister dans la traduction, la relecture et d’autres tâches répétitives.
