BLOG publié le 16 oct. 2018 • Département / Unité Média Numériques Média

Alexa – Développeurs, à vos claviers !

Tomas Granryd

Inaugurant une nouvelle série de blogs personnels de nos Membres sur la transformation numérique, Tomas Granryd, de la Radio suédoise, qui préside le Groupe VOX de l’UER, s’intéresse aux appareils à commande vocale dont les médias de service public doivent promouvoir le développement d’usages pratiques.

Depuis deux ans, j’ai l’étrange impression que le monde qui nous entoure change trop vite. Pourtant, si l’on y regarde de près, l’innovation se diffuse trop lentement. On dirait qu’il se ne passe rien de vraiment nouveau. J’ai le sentiment agaçant que je connais déjà ce dont je rêve et que je vais devoir attendre plusieurs années pour qu’il devienne réalité : le Wi-Fi est encore parfois inaccessible, la multitude de mots de passe continue d’être un cauchemar, le stockage des données reste problématique, les mises à jour provoquent toujours des interruptions intempestives, le Bluetooth est encore utilisé comme norme (!), l’autonomie des batteries reste à l’ordre du jour des conférences de développeurs et Skype est toujours aussi difficile à utiliser. Certes, les choses changent, mais plutôt à grands coups de recyclage.

Si la technologie fait parfois de vrais sauts qualitatifs, avec iPay, Spotify, Chromecast ou, dans une moindre mesure, Shazam, ces innovations restent rares.

Alors, si on inventait quelque chose de vraiment nouveau ?

À mon avis, la voix est un des domaines où l’on pourrait faire de véritables bonds de géant. Et le plus incroyable, c’est qu’il est pratiquement impossible de les prédire.

Je me souviens encore de la première fois où j’ai pu commander le système audio de ma maison au son de ma voix. J’ai été bluffé. Cette interface plus naturelle, conviviale et humaine allait transformer notre écosystème en station radio et nous allions pouvoir accéder à l’Internet et à notre matériel d’une manière totalement différente. Génial !

En Suède, les appareils à commande vocale sont en vente depuis près d’un an, dans certaines boutiques en ligne. La Radio suédoise (SR) a travaillé d’arrache-pied sur des applis liées à ces dispositifs qui, malheureusement, existent uniquement en anglais. Pas vraiment idéal pour un radiodiffuseur suédois.

Je souhaite bon courage à l’utilisateur suédois s’il demande à Alexa de lui mettre P3 Älskar. Alexa sélectionnera probablement une chanson sur Spotify intitulée El´s Cow. Ou, dans le meilleur des cas, elle lui suggérera la radio danoise Doctor P3 (DR P3) !

Mais tout ça va bientôt changer : il y a un mois, Google Assistant est sorti en suédois et en fin d’année, ce sera le tour de Google Home. Cette nouveauté va servir de point de départ à nos futurs développements !

SR travaille dans trois domaines de la reconnaissance vocale : Available, Augmented et Adapted (accessible, augmenté et adapté). Les trois A, en somme !

Le premier domaine (Available) est évident : tout ce que nous produisons doit être facilement accessible par l’intermédiaire de l’assistant. Nous voulons offrir une expérience utilisateur agréable et une recherche tolérante aux erreurs, grâce à une conception axée sur l’être humain. Ce n’est pas facile. Mais c’est le minimum qu’un MSP doit pouvoir offrir en la matière.

Nous avons créé une appli pour Google Assistant. C’est un bon début, mais elle est loin d’être parfaite. Elle pose encore de nombreux problèmes dont nous ne maîtrisons pas tous les éléments.

Ainsi, vous ne pouvez pas « ouvrir » une action lorsque vous écoutez la radio sur l’appli : pour régler une alarme ou augmenter le volume, vous devez sortir de l’appli. C’est un défaut majeur. Mais nous savons que Google travaille sur cette question.

Le deuxième domaine (Augmented) concerne l’expérience du streaming.

Par exemple, vous écoutez une chanson qui vous plaît à la radio : d’un seul mot, vous pouvez aussitôt la sauvegarder dans Spotify. Autre cas : vous entendez une pub sur un titre pendant que vous écoutez de la musique en streaming. Vous pouvez, en faisant pause, demander à votre AV (assistant vocal) de lancer ce titre.

Cette fonctionnalité pourrait offrir une véritable valeur ajoutée aux auditeurs. C’est là que nous pourrions créer la surprise, au lieu de proposer du déjà vu.

Le troisième domaine (Adapted) est encore plus passionnant : il s’agit de produire des types de contenus spécialement destinés aux assistants vocaux, des contenus tirant parti de tous les avantages offerts par l’interaction mains libres.

C’est un défi colossal, pour lequel nous devrons faire appel à nos esprits les plus innovants.

Si nous réussissons dans ces trois domaines, nous ne nous contenterons plus de suivre les tendances ; nous les créerons pour construire l’expérience vocale idéale.

Nous savons que la technologie est sur le point d’arriver, nous savons même quand elle arrivera. Nous ne pourrons pas dire que nous avons été pris par surprise. Pour être francs, si dans cinq ans, nous ne sommes pas un leader des services de divertissement, d’information et d’éducation sur les appareils à commande vocale, c’est que nous n’aurons pas bien travaillé !

Alors, il est temps de créer !