Les actus IA en bref
Partager la publication
OpenAI défie Google et Amazon avec un système d’achat instantané
OpenAI vient d’annoncer “Instant Checkout”, une fonctionnalité qui permet aux utilisateurs de ChatGPT aux Etats-Unis d’acheter sur Etsy et bientôt sur Shopify sans quitter la conversation. Cette nouveauté, accessible aux abonnements Pro, Plus et aux utilisateurs gratuits connectés, intègre le paiement via Apple Pay, Google Pay, Stripe ou carte bancaire. Glossier, Skims, Spanx et Vuori figurent parmi les plus d’un million de marchands Shopify qui seront bientôt disponibles. Instant Checkout s’appuie sur le protocole ACP (agentic commerce protocol) open source, offrant aux développeurs et aux marchands une intégration simplifiée. L’objectif : proposer une expérience d’achat fluide et personnalisée, concurrençant directement Google et Amazon dans la découverte de produits. Par le passé, Google et Amazon ont utilisé leur position dominante pour avantager certains partenaires ; OpenAI promet cependant des résultats “organiques et non sponsorisés” et percevra une petite commission sur chaque achat. Des acteurs tels que Perplexity et Microsoft (via Copilot Merchant Program) ont déjà lancé des fonctions similaires. Google prépare sa réponse avec le protocole AP2 (agent payments protocol). Les commandes, paiements et livraisons sont gérés par les marchands via leurs systèmes existants, garantissant sécurité et respect de la vie privée. Cette initiative pourrait redéfinir les rapports de force dans la distribution en ligne.
Apple teste Veritas le ChatGPT interne qui prépare le Siri 20
Apple conduit des essais internes d’une application nommée Veritas, destinée à préparer une refonte majeure de Siri prévue pour mars 2026. Veritas permet à ses ingénieurs de converser avec une version avancée de Siri, tester des dialogues sur plusieurs tours et exécuter des actions in-app (notamment des retouches photo par commande vocale). Contrairement aux chatbots publics tels que ChatGPT ou Gemini, Veritas ne sera pas disponible aux utilisateurs : ses fonctions seront intégrées directement dans Siri.
Ce report de la sortie de la nouvelle version de Siri a provoqué des remaniements internes et des départs au sein des équipes d’IA d’Apple. L’objectif est d’atteindre une interface de commande vocale plus contextuelle, capable d’interagir avec les données personnelles de l’utilisateur et avec les apps tierces tout en garantissant la confidentialité. Avec Veritas, Apple vise à affiner ses modèles, détecter les bogues et préserver la qualité avant de lancer publiquement ce Siri nouvelle génération.
Meta s’attaque à la robotique et veut devenir "l’Android" des machines
Meta mise gros sur la robotique avec Project Metabot, piloté par Marc Whitten et épaulé par le CTO Andrew Bosworth. L’idée centrale ? Ne pas produire principalement du matériel, mais développer une plateforme logicielle que d’autres entreprises pourraient licencier - à l’instar d’Android pour les smartphones.
L’un des grands défis est la manipulation fine : simuler des mouvements de main complexes, comme prendre un verre sans le casser ou saisir un objet irrégulier. Pour cela, Meta développe un “world model”, un modèle logiciel capable d’anticiper les interactions physiques dans le monde réel.
Meta explore aussi des usages domestiques (nettoyage, pliage du linge), mais ces concepts restent à l’état de recherche.
Le contexte du marché est favorable : les coûts de prototypage robotique chutent rapidement, rendant l’entrée plus accessible. Par ailleurs, des robots humanoïdes sont déjà testés dans les entrepôts et les chaînes d’approvisionnement.
Si Meta parvient à imposer sa plateforme logicielle, elle pourrait dominer l’écosystème robotique sans porter seule le fardeau du hardware - obligeant des concurrents comme Google, Apple ou Tesla à repenser leur stratégie.
L’IA “Alex” lève 17 M$ pour automatiser les entretiens d’embauche
La jeune startup Alex, lancée il y a environ 18 mois, vient de sécuriser 17 millions de dollars en série A, menée par Peak XV Partners avec la participation de Y Combinator et Uncorrelated Ventures. Grâce à sa technologie de recrutement automatisé, elle vise à déléguer les entretiens de présélection souvent redondants - vérification des antécédents, attentes salariales, disponibilité, etc. - à une IA conversationnelle.
Aaron Wang, cofondateur issu de l’univers de Facebook et de la finance quantitative, explique que l’outil vocal d’Alex peut mener des entretiens autonomes peu après le dépôt d’une candidature. « Notre IA effectue des milliers d’entretiens par jour », affirme t il. Parmi les clients - non dévoilés - se trouvent des entreprises du Fortune 100, des institutions financières, des chaînes nationales ou des cabinets du Big 4.
Sur le marché, Alex affronte des concurrents comme HeyMilo, ConverzAI ou Ribbon, qui proposent également des systèmes d’entretien automatisé basés sur l’IA. L’enjeu d’Alex va au delà de la simple automatisation : la startup ambitionne d’interviewer des millions de candidats pour constituer des profils professionnels plus complets que ceux disponibles sur LinkedIn. À terme, elle souhaite libérer les recruteurs des tâches répétitives pour qu’ils se concentrent sur les interactions à forte valeur ajoutée.
Anthropic publie Claude Sonnet 4.5, son IA la plus performante pour coder
Anthropic vient de dévoiler Claude Sonnet 4.5), qu’elle présente comme son modèle le plus puissant pour le développement logiciel. Le modèle est désormais accessible depuis l’API Claude ou le chatbot Claude, avec une tarification identique à celle de Sonnet 4 : 3 $ par million de tokens en entrée, 15 $ par million en sortie.
L’argument principal mis en avant est la capacité à maintenir une session autonome très longue : lors de tests internes, Sonnet 4.5 a été observé en action pendant plus de 30 heures, construisant lui-même une application, en configurant des services de base de données, en achetant des noms de domaine, ou encore en validant des exigences de sécurité.
Sur le plan des performances techniques, Sonnet 4.5 excelle sur le benchmark SWE-Bench Verified, dédié à la qualité logicielle, et affiche une progression forte sur les tâches d’interaction avec des systèmes d’exploitation (benchmark “OSWorld”).
Anthropic accompagne ce lancement d’outils renforcés : le Claude Agent SDK, qui permet aux développeurs de créer leurs propres agents sur la base de cette technologie, et la mise à jour de Claude Code avec des fonctions telles que les “checkpoints” pour revenir en arrière dans le code.
Enfin, l’entreprise déclare que Sonnet 4.5 est son modèle le plus “aligné” à ce jour, avec des progrès dans la réduction de comportements toxiques ou trompeurs, et une meilleure résistance aux attaques de prompt injection.
Anything : vers une plateforme “tout-en-un” pour transformer les prototypes IA en apps rentables
Le “vibe-coding” - la création d’applications grâce à des instructions en langage naturel - connaît une croissance impressionnante. Plusieurs jeunes pousses affichent des chiffres spectaculaires : la suédoise Lovable a atteint 100 millions de dollars de revenus annuels récurrents (ARR, pour Annual Recurring Revenue) en huit mois seulement, et Replit est passé de 2,8 M $ à 150 M $ d’ARR en moins d’un an.
Cependant, ces plateformes se limitent souvent à produire des prototypes : pour passer à une application complète, l’utilisateur doit configurer lui-même bases de données, stockage ou systèmes de paiement. C’est ce que veut changer Anything, lancée il y a à peine un mois. La société a rapidement atteint un rythme de revenus annualisés (ARR) de 2 M $ en deux semaines et vient de lever 11 M $ de financement pour une valorisation de 100 M $, avec le soutien de fonds comme Footwork, Uncork, Bessemer et M13.
Créée par deux anciens de Google, Dhruv Amin et Marcus Lowe, Anything propose une plateforme “tout-en-un” : les utilisateurs peuvent générer des applications web et mobiles incluant directement base de données, stockage, paiements et publication sur les stores. Leur objectif : devenir le “Shopify du vibe-coding”, en permettant à des créations générées par IA de se transformer en véritables entreprises rentables.
Il y a plus de robots au travail en Chine qu’ailleurs - et pourquoi ça compte
Depuis quelques années, la Chine a pris une avance spectaculaire dans l’automatisation industrielle. En 2024, son parc de robots industriels opérationnels a dépassé 2 millions d’unités, à une époque où le total mondial avoisine 4,66 millions.
Cette même année, les usines chinoises ont installé environ 295 000 nouveaux robots, ce qui représente 54 % des installations globales - soit plus que le reste du monde entier.
Cette montée en puissance s’inscrit dans une stratégie nationale forte : depuis le plan Made in China 2025, le gouvernement chinois a encouragé via des financements publics, des politiques industrielles ciblées et un soutien aux entreprises locales la montée en compétence dans la robotique et dans l’intelligence artificielle.
Par ailleurs, pour la première fois en 2024, 57 % des robots nouvellement installés en Chine étaient produits localement, dépassant les importations.
Grâce à cette adoption massive de la robotisation, l’efficacité industrielle monte, le coût de la main-d’œuvre relative baisse, et la Chine consolide son rôle de "atelier du monde" - mais désormais avec une composante technologique dominante.
GPT 5 s’approche des experts : quand l’IA rivalise avec l’humain pour l’emploi
OpenAI a dévoilé un nouveau benchmark baptisé GDPval (pour “Gross Domestic Product Value” ou "valeur du produit intrinsèque brute" en français), qui mesure comment ses modèles d’IA se comparent à des professionnels humains dans des tâches économiquement utiles.
Ce test couvre 44 professions réparties dans 9 secteurs majeurs du PIB américain (santé, finance, industrie, administration, etc.).
Dans GDPval v0, des experts humains comparaient des livrables produits par l’IA et par d’autres professionnels, puis choisissaient le meilleur.
Les résultats montrent que la version “GPT 5 high” est jugée à un niveau équivalent ou supérieur à des experts humains dans 40,6 % des cas.
Anthropic, de son côté, obtient avec Claude Opus 4.1 un taux de 49 % selon OpenAI, bien que l’entreprise note que ses résultats pourraient être aidés par une préférence pour des présentations graphiques plaisantes.
OpenAI souligne toutefois les limites actuelles : GDPval ne teste aujourd’hui que des productions statiques (rapports, plans, synthèses), et non des tâches interactives ou des fonctions plus larges que celles qu’un professionnel assume.
Néanmoins, pour Aaron Chatterji (économiste chez OpenAI), ces résultats suggèrent que les professionnels pourraient bientôt déléguer certaines tâches “techniques” à l’IA et se concentrer sur des travaux à plus forte valeur ajoutée.
