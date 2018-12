Dans la série de politique-fiction "Mr. Robot", l'agente du FBI Dominique DiPierro vit seule, avec pour unique compagnie Alexa, l'IA [intelligence artificielle, ndlr] qui équipe son enceinte Echo d'Amazon. La vision d'un futur proche ? Possible, si l'on en croit la futurologue américaine Amy Webb, fondatrice du Future Today Institute : « Les assistants digitaux comme Siri d'Apple, Alexa d'Amazon, Google Assistant ou Cortana de Microsoft deviennent omniprésents. D'ici dix ans, les interfaces seront conversationnelles et non visuelles. » Selon la prospectiviste, pas moins de la moitié des habitants des pays industrialisés qui interagissent avec des ordinateurs ou d'autres machines utiliseront le vocal dès 2021.

Ce passage de l'écrit au vocal représente un véritable changement de paradigme pour les consommateurs comme pour les entreprises. C'est aux États-Unis que sont apparues les enceintes connectées, parfois appelées ECV (enceintes à commande vocale). Petit rappel de l'accélération de l'histoire : en novembre 2014, Amazon lance Echo, suivi en 2016 par Google Home, en 2017 par Invoke de Microsoft et Harman Kardon (disponible uniquement aux États-Unis) et cette année par HomePod d'Apple.

Ces haut-parleurs commandés à la voix sont très populaires outre-Atlantique, où il y en aurait déjà près de 58 millions en service (source : Voicebot.ai).

Et d'après le cabinet Gartner, 75% des foyers américains posséderont une enceinte intelligente en 2020.

Un engouement qui ne semble pas près de faiblir. Au premier trimestre 2018, les ventes d'Echo ont augmenté de 102% par rapport à la même période de 2017, et celles de Google Home de 709% (source : Strategy Analytics) !

Il faut dire que les deux géants du Net n'hésitent pas à commercialiser leurs appareils à prix coûtant, voire à perte. Lors du Black Friday du 23 novembre dernier, l'enseigne Boulanger proposait l'Echo Dot 2 à un prix promotionnel de 24,99 euros contre 59,99 euros normalement, et le Google Home Mini à 29,50 euros au lieu de 59,00 euros.

Moins de 30 euros pour une ECV : les fabricants font le maximum pour séduire les Français. Car le véritable enjeu n'est pas de faire du business avec leurs enceintes boostées à l'IA mais bien de s'introduire dans tous les foyers pour s'assurer la plus grosse part du gâteau de la maison connectée, un marché au potentiel énorme qui pourrait peser 138 milliards de dollars en 2023 d'après le cabinet d'étude de marché MarketsandMarkets. Tout en recueillant des masses de données comportementales livrées volontairement par les adeptes du vocal.

[Google Home est disponible en France depuis juin 2017. On peut écouter de la musique, commander des objets connectés, écouter des radios. Il est aussi possible de déclencher le visionnage sur son téléviseur de vidéos YouTube et Netflix. Crédits : Reuters]

Amazon, pionnier et leader

Echo, Google Home, HomePod, Invoke et bientôt Djingo - l'assistant franco-allemand d'Orange et Deutsche Telekom programmé début 2019 -, ont pour vocation d'être au centre de l'écosystème domotique en pilotant par la voix volets roulants, portes de garage, chauffage, climatisation, serrure intelligente, alarmes, lumières... Sans oublier les appareils électroménagers qui deviennent peu ou prou tous connectés, de l'aspirateur robot au lave-linge. Amazon vient d'ailleurs d'annoncer un micro-ondes compatible avec Alexa.

Mais après avoir dit « Alexa » ou « OK Google » pour jouer son morceau préféré, consulter la météo, écouter les informations ou faire cuire son poulet, les possesseurs de smart speaker vont-ils s'en servir pour acheter en ligne ? La probabilité est forte si l'on en croit Adobe Analytics, qui annonce que 30% des propriétaires d'Alexa utilisent déjà leur haut-parleur intelligent pour effectuer un achat sur le Web, 17% pour se faire livrer à manger et 16% pour rechercher des informations sur des vols ou des hôtels. Le cabinet OC & C Strategy prévoit un marché de 40 milliards de dollars en 2022 pour les achats en ligne effectués par la voix.

Encore une fois, Amazon a un coup d'avance grâce à l'intégration du compte Amazon Prime avec son IA Alexa, à qui il suffit d'énumérer sa liste de courses pour que les achats soient déclenchés, payés et livrés. Autre coup de maître : l'assistant vocal Alexa équipe la nouvelle box Delta de Free. L'opérateur possède 6,5 millions d'abonnés fixes haut débit, mais il faudra attendre de voir si cette nouvelle superbox avec Netflix, Alexa et un son Devialet séduit les clients, malgré un prix élevé de 59,99 euros par mois.

De son côté, Google, qui accapare déjà 90% des requêtes sur le Web, compte accroître encore sa mainmise sur le search, et donc récolter toujours plus de données sur nos habitudes de consommation. Et, sans doute, vendre aux annonceurs des espaces publicitaires vocaux. Pour l'instant, le géant de Mountain View teste ce nouveau format publicitaire avec prudence. En effet, il n'est pas du tout certain que les consommateurs soient prêts à écouter des annonces commerciales entre deux chansons des Stones ou deux flashs de France Info. Mais auront-ils le choix ?

Avec le vocal, pas d'ad blockers comme sur les écrans d'ordinateur et de smartphones. Les marques en sont conscientes et développent des formats très courts et des contenus les plus synthétiques possible pour éviter un effet négatif de ces annonces parlées. Reste que la voix, médium « chaud », est une occasion en or pour elles d'engager une conversation avec leurs clients et prospects. Selon Arnaud de Lacoste, fondateur de Sitel Group, « la voix est le nouveau porte-parole des marques ».

Les marques donnent de la voix

Une analyse partagée par Mark Taylor, chargé de l'expérience client au sein de l'activité Digital customer experience de Capgemini, qui affirme que « les assistants vocaux vont complètement révolutionner la façon dont les marques et les consommateurs interagissent. »

« Ce qui séduit dans les assistants vocaux, c'est qu'ils sont profondément ancrés dans nos vies quotidiennes et qu'ils offrent aux consommateurs une richesse et une simplicité d'interaction totalement inédites. Les marques qui seront capables de capitaliser sur l'énorme intérêt suscité par les assistants vocaux vont non seulement établir des relations plus étroites avec leurs clients, mais aussi se créer des opportunités de croissance significatives ».

Pour Arnaud de Lacoste, l'expérience vocale peut être de quatre natures. Un compagnon, pour délivrer une information de la manière la plus personnalisée possible et un moyen pour les marques de construire un lien plus fort avec leurs clients. Une commande, pour effectuer des tâches répétitives et simplifier l'accès au service. Une expérience, pour aider les marques à développer de l'engagement avec les consommateurs. Du commerce, pour éliminer les frictions dans le parcours client, particulièrement pour les commandes régulières.

Domino's Pizza a sorti son application vocale sur Alexa en 2016 à l'occasion du Super Bowl. Avec succès : en deux mois, près d'un cinquième des clients américains de l'entreprise utilisaient le service de commande vocale. Aussitôt, son concurrent Pizza Hut l'a imité.

En France, des enseignes et des marques comme Carrefour, Cdiscount, Darty, Sephora, Boulanger, Monoprix, AccorHotels et Oui. Sncf ont développé leur skill (interface vocale interactive) pour Google Home. Côté Echo d'Amazon, disponible en France depuis six mois, on trouve pour l'instant les skills Air France, Domino's Pizza, Oui. SNCF et Uber.

Les banques s'intéressent également de près à ces nouvelles interfaces : d'après une étude de MasterCard et de l'université d'Oxford, 93% des consommateurs préfèrent la biométrie vocale aux mots de passe pour accéder à leurs services financiers.

Attention aux données échangées

Mais mieux vaut réfléchir à deux fois avant d'utiliser Echo ou Google Home pour échanger des informations avec sa banque. Les enceintes à commande vocale écoutent les conversations en permanence et envoient ces données dans le cloud.

Google et Amazon conservent les métadonnées (nom, date, heure) et l'historique des requêtes sur leurs serveurs. Un risque sérieux pour la confidentialité, au point que la Commission nationale de l'informatique et des libertés (Cnil) conseille « d'éteindre l'appareil lorsque l'on ne s'en sert pas ou lorsque l'on ne souhaite pas pouvoir être écouté », entre autres mises en garde comme « avertir les invités de l'enregistrement potentiel des conversations », « encadrer les interactions de ses enfants » ou encore « rappeler les risques à partager des données intimes ou des fonctionnalités sensibles (ouverture de porte, alarme...) ».

Rand Hindi, fondateur de Snips, va plus loin. Pour lui, Alexa et Google Home représentent « le pire d'Internet » :

« Quand vous donnez des data à une entreprise privée, elle crée un profil de plus en plus précis au risque d'une manipulation de vos actions. On devrait pouvoir choisir ce qu'on veut lui communiquer. »

Le fondateur de Snips développe actuellement un assistant vocal (Snips Airdays) et un haut-parleur intelligent (Air Base) plus respectueux de la confidentialité des données personnelles, qui ne seront pas envoyées dans le cloud mais conservées localement dans l'appareil. Ce qu'on appelle la « privacy by design » ou la protection des données dès la conception d'une nouvelle technologie.

Un principe qui a d'ailleurs inspiré le RGPD (Règlement général sur la protection des données) européen. Pour Sébastien Soriano, président de l'Arcep, le régulateur des communications électroniques, Amazon, via les skills d'Alexa, peut être considéré comme le troisième OS aux côtés d'iOS d'Apple et d'Android de Google.

« Demain, les assistants vocaux seront dans la télévision et la voiture. On pourra faire ses courses depuis sa voiture autonome. Le problème étant que seuls les grands acteurs du Net peuvent remplir ce rôle. Si l'on veut trouver une alternative européenne aux Internet californien et chinois, il ne s'agit pas de se demander comment devenir un OS de plus, mais de revenir aux débuts du Web et aux logiciels libres », analyse Sébastien Soriano.

Autre danger potentiel : l'empreinte vocale (qui est unique, comme le sont les empreintes digitales) qui sera le sésame pour toutes les interactions avec les enceintes parlantes.

Dans le viseur des hackers

Mais si personne ne songerait à transmettre ses empreintes digitales à un e-commerçant comme Amazon ou un moteur de recherche comme Google, les utilisateurs d'Echo et de Google Home leur confient leur signature vocale sans broncher. Mauvaise idée, car celle-ci peut renseigner sur votre âge, votre état de santé et vos émotions.

« Ce genre de technologie peut aussi informer sur la taille de la pièce dans laquelle vous parlez, les matériaux dont sont composés les murs, le nombre de personnes présentes, les fluctuations du réseau électrique et même vous localiser géographiquement de manière assez précise », avertit Amy Webb.

De plus, les enceintes sont vulnérables aux cyberattaques. La société britannique MWR a prouvé qu'elle avait pu installer un malware (logiciel malveillant) dans une enceinte Echo d'Amazon et récupérer les flux audio. Et, selon le dernier rapport sur les menaces cyber de l'éditeur d'antivirus McAfee, les cybercriminels prévoient de cibler l'Internet des objets (IoT) via les plateformes cloud, les assistants numériques et les réseaux sociaux. Les futurs malwares mobiles utiliseront les smartphones, les tablettes et les routeurs comme vecteur pour avoir accès aux assistants numériques et aux appareils domestiques connectés.

Selon Bastien Dubuc, country manager France chez Avast, un autre éditeur d'antivirus, cité par le magazine spécialisé Global Security Mag, « il arrive que des développeurs préfèrent concevoir des appareils faciles et pratiques à utiliser au détriment de la sécurité. La bonne nouvelle, c'est qu'une enceinte connectée peut être installée et opérationnelle en un clin d'œil ; la mauvaise, c'est qu'elle est tout aussi facilement piratable. Outre cette faible sécurité, les consommateurs sont souvent tellement pressés de découvrir l'appareil qu'ils ne prennent pas le temps de changer les paramètres définis par défaut ». La porte d'entrée des virus, c'est le routeur, qui fait transiter les paquets de données d'une interface réseau à une autre.

« Si un hacker parvient à l'infiltrer, il peut potentiellement compromettre tous les périphériques qui y sont connectés. Outre les assistants vocaux, si des appareils comme la porte d'entrée ou le portail du garage ont des capacités audio, les cybercriminels peuvent donner l'ordre de les déverrouiller via l'enceinte intelligente. Il faut savoir que tous les objets communiquent entre eux et peuvent être utilisés contre leurs propriétaires », ajoute Bastien Dubuc.

Plus anecdotique mais néanmoins désagréable, la conversation d'un couple américain de Portland a été enregistrée par leur enceinte Echo puis envoyée par mail à un de leurs contacts. En Angleterre, un perroquet a même réussi à commander pour 10 livres sterling de marchandises sur Amazon en imitant la voix de sa propriétaire.

Encore plus troublant : dans le premier épisode de la saison 21 du dessin animé satirique "South Park", les personnages ont répété en boucle « OK Google » et « Alexa », déclenchant des centaines de milliers d'enceintes connectées dans les foyers américains. Une voix de dessin animé provenant d'une télévision qui peut contrôler un dispositif censé à terme piloter tous les appareils de la maison ? Pas très rassurant.

Malgré tous ces risques pour la vie privée des consommateurs, les marques sont bien décidées à sauter dans le train du vocal, de peur de louper la prochaine révolution de la relation client. Les aficionados des enceintes intelligentes seraient bien inspirés de relire le roman "1984" de George Orwell avant de s'adresser à leur assistant vocal :

« Le télécran recevait et transmettait simultanément. Il captait tous les sons émis par Winston au-dessus d'un chuchotement très bas. Naturellement, il n'y avait pas moyen de savoir si, à un moment donné, on était surveillé. »

ENCADRE 1/2

Portrait-robot de l'utilisateur de "smart speaker"

Verto Analytics a dressé le portrait-robot de l'utilisateur d'assistants vocaux le plus actif. Ou plutôt de l'utilisatrice, puisqu'il s'agirait d'une femme âgée de 52 ans qui passerait en moyenne 90 minutes par mois à parler à son assistant vocal. Selon Pew Research, 37% des Américains utilisant un assistant vocal ont plus de 50 ans, alors même qu'ils sont les plus réticents à naviguer via des interfaces graphiques.

Source : Livre blanc TLC, "La voix porte-parole des marques"

ENCADRE 2/2

Principales raisons pour lesquelles les utilisateurs apprécient leur enceinte

1. Pouvoir faire plusieurs choses en même temps (multitasking).

2. Accomplir des tâches plus rapidement que sur d'autres appareils.

3. Obtenir des réponses plus rapidement à leurs questions.

4. Rendre les routines quotidiennes plus simples.

Source : Google-PeerlessInsights, "Voice-Activated Speakers : People's Lives Are Changing", août 2017.