FRFAM.COM >> Famille >> Technologie &Innovation >> Informatique

Adieu les mots d'activation comme « Alexa » ? Une innovation de Carnegie Mellon révolutionne les assistants vocaux

Des chercheurs de l'université Carnegie Mellon ont mis au point un système permettant d'interagir avec des haut-parleurs intelligents et autres appareils à commande vocale, sans mot d'activation.

Basé sur l'apprentissage automatique, ce système pourrait poser les bases d'une alternative sécurisée aux assistants domestiques toujours à l'écoute.

Comment fonctionne ce nouveau système ?

Les résultats ont été publiés dans un [document de recherche PDF] par une équipe de quatre chercheurs, accompagnés d'une vidéo démonstrative.

La recherche porte sur la direction de la voix, une technique qui identifie à la fois la position et l'angle d'origine de la parole. Contrairement aux appareils actuels, focalisés uniquement sur la source sonore, cette approche va plus loin.

Les systèmes traditionnels dépendent d'un mot-clé spécifique, limitant les options même en le modifiant.

Lorsqu'une personne parle, sa voix génère des échos dans la pièce, arrivant au microphone à des moments variés. En analysant la synchronisation, le volume et le spectre fréquentiel de ces échos, le système détermine si l'utilisateur s'adresse directement à l'appareil ou non.

L'équipe a partagé un dépôt GitHub contenant l'ensemble de données d'entraînement : 11 520 phrases uniques ont permis d'atteindre une précision de 90 degrés dans la prédiction de l'angle.

Les calculs, légers, s'exécutent localement sur l'appareil, sans recours au cloud. Les chercheurs visent des interactions plus fluides et une confidentialité accrue pour les utilisateurs.

Aucun calendrier n'est annoncé pour une commercialisation, mais cette technologie pourrait éliminer le besoin de mots de réveil. Sans les appeler par leur nom, les enceintes en ont-elles vraiment besoin ? Alexa le sait peut-être.

Fin des assistants vocaux personnifiés ?

Cette avancée ouvre des perspectives excitantes, sans pour autant remplacer totalement les mots-clés. Les haut-parleurs intelligents séduisent par leur activation vocale mains-libres.

Elle promet un usage simultané de plusieurs appareils dans un même espace, en ciblant un seul sans réveiller les autres – comme demander la météo en silence.

Nous en sommes aux balbutiements, mais une telle technologie pourrait transformer les interactions homme-machine en réalité quotidienne.

[]