Google Duplex tient une conversation naturelle.

Lors de la Google I/O 2018, la présentation de Google Duplex a montré des exemples époustouflants de la capacité d’une intelligence artificielle à avoir un échange naturel avec un interlocuteur humain. Plusieurs technologies d’avant garde sont utilisées conjointement.

 

Google Duplex

Des exemples époustouflants de la capacité d’une intelligence artificielle à tenir une conversation naturelle

Deux exemples de prise de rendez-vous ont été diffusés. Avec le salon de coiffure, le rendez-vous a pu être pris de manière très simple, avec quelques itérations sur l’horaire. Dans le second cas, l’interlocutrice a fait quelques confusions entre le nombre de personnes et la date par exemple, que Google Duplex a rectifié, avec patience et efficacité.

Les petits ‘hmmm-hmmm », pour montrer que l’intelligence artificielle était à l’écoute, ont contribué à humaniser le dialogue et aucun des deux interlocuteurs ne s’est rendu compte qu’il parlait avec un ordinateur.

Même si la capacité des machines à simuler un comportement humain doit conduire à définir des règles déontologiques (par exemple informer la personne appelée qu’elle dialogue avec un ordinateur), la prouesse technique est indéniable.

Google Duplex : comment ça marche ?

On assiste véritablement, depuis quelques années à une progression très rapide de la puissance de l’intelligence artificielle.

Dans son blog, Google, a donné quelques explications sur le fonctionnement de Duplex.

L’objectif de Duplex est de rendre l’expérience de l’échange aussi naturel que possible.
Pour y parvenir, il a fallu relever plusieurs défis : le langage naturel est difficile à comprendre et à exprimer et l’interlocuteur attend des réponses instantanées. A l’oral, on fait souvent des phrases compliquées, avec des interruptions et l’on parle très vite. En outre, certaines phrases peuvent parfois être ambiguës.

Pour parvenir à rendre la conversation naturelle, Google Duplex a mis en œuvre différentes technologies :

 

Google Duplex : comment ça marche ?

  • un réseau neuronal récurrent basé sur la plate-forme de « machine learning » TensorFlow Extended (TFX). Le réseau d’apprentissage profond de Google Duplex a été entraîné à l’aide d’un grand nombre de conversations anonymisées.
  • le son entrant est analysé par la technologie de reconnaissance automatique de la parole de Google (Automatic Speech Recognition – ASR). L’entrainement s’effectue dans un domaine précis.
  • la réponse est générée en utilisant les modules de texte vers parole (Text To Speech – TTS) ainsi que des outils complémentaires pour moduler l’intonation (Tacotron and WaveNet). Des disfluences (« hmmm »…) sont également insérées.

De nombreuses applications de cette technologie sont envisagées

Voici quelques exemples d’applications fournis par Google :

  • Grâce à sa prochaine intégration dans Google Assistant, il sera possible d’utiliser Google Duplex pour prendre des rendez-vous : « Ok Google, prends rendez-vous chez mon médecin un soir de cette semaine sauf mercredi, à partir de 18h »…)
  • Des commerces dont l’activité repose sur des rendez-vous (coiffeurs, hotels, restaurants,…) pourront avoir recours à Google Duplex pour interagir avec les clients qui appellent
  • Google pourra utiliser Duplex pour appeler de très nombreux commerces et services pour connaître les éventuelles heures d’ouverture pour certains jours fériés et mettre à jour une information qui sera ensuite accessible à tous

Avec la présentation de Google Duplex, on a vraiment le sentiment que le dialogue oral entre l’homme et la machine entre dans une nouvelle ère.

 

 

Fermer le menu
×
×

Panier