Quand ChatGPT prend le contrôle de l’iPhone : une démo impressionnante d’IA en action
- Tilo
- modifié le
Partager la publication
Le futur de l’interaction homme-machine est peut-être déjà là
Un développeur d’OpenAI, Rounak Jain, a conçu un projet baptisé "PhoneAgent" qui permet à ChatGPT de contrôler un iPhone par commandes vocales. Ce projet, présenté comme une étude de faisabilité, démontre qu’il est possible d’orchestrer des actions complexes sur iOS sans accès à des API privées d’Apple ni recours au jailbreak.
Un agent intelligent plus compétent que Siri ?
Basé sur le modèle GPT-4.1 d’OpenAI, PhoneAgent interagit avec l’interface utilisateur iOS via les outils de test disponibles dans Xcode. Il peut lire l’écran, simuler des tapotements, saisir du texte et faire défiler les contenus. Une simple commande vocale permet d’envoyer un selfie accompagné d’un haïku, d’activer la lampe torche ou de commander un Uber pour aller à l’aéroport. Il s’agit d’une véritable expérience mains libres, grâce à une reconnaissance vocale continue en tâche de fond.
Une technologie réservée aux développeurs... pour l'instant
Ce projet n’est pas une application disponible sur l’App Store, mais un projet Xcode à compiler soi-même. Cela signifie que seuls les développeurs peuvent le tester, mais cela n’empêche pas PhoneAgent de susciter un véritable engouement. Le code est librement accessible sur Github, ce qui permet à la communauté d’expérimenter avec ses fonctionnalités.
🚨🤖 Today, I'm launching an AI agent that gets things done across iPhone apps.
— Rounak Jain (@r0unak) June 1, 2025
It's powered by OpenAI GPT 4.1 and is open source. Try it out! pic.twitter.com/bTgJhdzG5U
Une démonstration du potentiel des agents IA
PhoneAgent illustre de façon concrète comment les agents intelligents peuvent transformer notre rapport à la technologie mobile. Contrairement aux simples assistants vocaux, un agent IA est conçu pour réaliser des tâches à notre place, en s’appuyant sur une compréhension contextuelle approfondie. Apple travaille toujours sur ses propres modèles d’IA, mais il est peu probable que l’on voie une intégration de ce niveau avant plusieurs années.
Et si Apple ouvrait ses portes à OpenAI ?
Ce projet met en lumière un futur possible : une collaboration plus étroite entre les géants de la tech pour offrir des expériences utilisateurs enrichies. Pour l’instant, ChatGPT peut déjà remplacer Siri sur certains aspects grâce aux fonctionnalités d’Apple Intelligence. Mais PhoneAgent prouve qu’avec un accès plus poussé à iOS, les assistants basés sur l’IA pourraient aller bien plus loin.
