Quand ChatGPT prend le contrôle de l’iPhone : une démo impressionnante d’IA en action

Image Quand ChatGPT prend le contrôle de l’iPhone
Phone Agent contrôle un Iphone
PhoneAgent, un projet open source impressionnant d’un développeur d’OpenAI, montre comment ChatGPT peut contrôler un iPhone uniquement par commande vocale, sans jailbreak. Une démonstration fascinante du potentiel des agents intelligents.

Partager la publication

Sommaire
    Add a header to begin generating the table of contents

    Le futur de l’interaction homme-machine est peut-être déjà là

    Un développeur d’OpenAI, Rounak Jain, a conçu un projet baptisé "PhoneAgent" qui permet à ChatGPT de contrôler un iPhone par commandes vocales. Ce projet, présenté comme une étude de faisabilité, démontre qu’il est possible d’orchestrer des actions complexes sur iOS sans accès à des API privées d’Apple ni recours au jailbreak.

    Un agent intelligent plus compétent que Siri ?

    Basé sur le modèle GPT-4.1 d’OpenAI, PhoneAgent interagit avec l’interface utilisateur iOS via les outils de test disponibles dans Xcode. Il peut lire l’écran, simuler des tapotements, saisir du texte et faire défiler les contenus. Une simple commande vocale permet d’envoyer un selfie accompagné d’un haïku, d’activer la lampe torche ou de commander un Uber pour aller à l’aéroport. Il s’agit d’une véritable expérience mains libres, grâce à une reconnaissance vocale continue en tâche de fond.

    Une technologie réservée aux développeurs... pour l'instant

    Ce projet n’est pas une application disponible sur l’App Store, mais un projet Xcode à compiler soi-même. Cela signifie que seuls les développeurs peuvent le tester, mais cela n’empêche pas PhoneAgent de susciter un véritable engouement. Le code est librement accessible sur Github, ce qui permet à la communauté d’expérimenter avec ses fonctionnalités.

    Une démonstration du potentiel des agents IA

    PhoneAgent illustre de façon concrète comment les agents intelligents peuvent transformer notre rapport à la technologie mobile. Contrairement aux simples assistants vocaux, un agent IA est conçu pour réaliser des tâches à notre place, en s’appuyant sur une compréhension contextuelle approfondie. Apple travaille toujours sur ses propres modèles d’IA, mais il est peu probable que l’on voie une intégration de ce niveau avant plusieurs années.

    Et si Apple ouvrait ses portes à OpenAI ?

    Ce projet met en lumière un futur possible : une collaboration plus étroite entre les géants de la tech pour offrir des expériences utilisateurs enrichies. Pour l’instant, ChatGPT peut déjà remplacer Siri sur certains aspects grâce aux fonctionnalités d’Apple Intelligence. Mais PhoneAgent prouve qu’avec un accès plus poussé à iOS, les assistants basés sur l’IA pourraient aller bien plus loin.

    D'autres articles d'IA qui pourraient vous intéresser
    Retour en haut