Guide

Assistant Google: à la découverte de la commande vocale

Luca Fontana
25/1/2019
Traduction: Sophie Boissonneau
Photos: Thomas Kunz

En sept ans d'existence, Siri, Alexa et l'Assistant Google ont dû en apprendre des choses. Je me suis donc demandé si je pouvais me servir de mon smartphone en utilisant uniquement la commande vocale pendant toute une journée.

«Ok Google. Quel temps fait-il aujourd'hui?»

Il doit être 6h30 du matin. Ma chambre est plongée dans le noir complet, typique de l'hiver et de ses courtes journées.

«Aujourd'hui à Zurich le temps est partiellement nuageux avec des températures allant de -4 °C à 0 °C» me répond mon smartphone d'une voix de femme.

Plus tard à Zurich: «On dirait que vous aurez besoin de votre parapluie aujourd'hui»
Plus tard à Zurich: «On dirait que vous aurez besoin de votre parapluie aujourd'hui»

Parfait. Je vais pouvoir rentabiliser ce manteau d'hiver qui m'a coûté bien trop cher. Je demande à la voix de femme quel est mon programme du jour. Réunion de la rédaction à 10h, entraînement de football à 18h. Rien d'autre de prévu. Un vendredi bien calme, en somme.

Puis la voix braille d'un ton bien trop amical: «au revoir». J'esquisse un sourire. Je ne savais pas que l'on pouvait «revoir» un assistant vocal virtuel. C'est ce que l'on va voir aujourd'hui, puisque je vais tenter de n'utiliser mon smartphone qu'avec l'Assistant Google.

Le matin

Avant, je trouvais ça bizarre de demander à voix haute à mon téléphone si je devais prendre un parapluie. L'avènement du réseau 3G a transformé nos smartphones en machines savantes qui nous permettent de trouver facilement et rapidement n'importe quelle information. Aujourd'hui, parler à mon téléphone ne me semble pas si étrange.

Tout a commencé en octobre 2011 lorsqu'Apple a lancé Siri sur le marché, permettant ainsi aux utilisateurs d'Apple de discuter avec leur smartphone. Mais à l'autre bout du fil, c'est bien à un assistant vocal virtuel que l'on a affaire. Un coup de génie qui sera ensuite adopté par Microsoft avec Cortana, Amazon avec Alexa, et par Google en 2016 avec son Assistant Google. Les services de commande vocale sont aujourd'hui sur toutes les lèvres, surtout «Ok Google».

J'ai pu constater que «Ok Gougou» marche aussi

Je me frotte les yeux pour chasser la fatigue, puis demande: «Ok Google, comment puis-je me rendre à Zurich Hardbrücke en bus?»

L'assistant réfléchit pendant une seconde, puis me répond: «La meilleure option est de prendre la ligne 4 en provenance d'Asp à 7h22. C'est à environ cinq minutes à pied d'ici. Le trajet vous prendra environ une heure et dix minutes avec deux changements.»

C'est trop long. Je ne serais même pas à l'heure pour ma seule réunion de la journée, c'est ridicule.

«Okay Google. Quel est le chemin le plus court pour aller à Zurich?»

Google me répond: «Pour aller à Zurich, le plus court est de passer par l'A1 en voiture. Le trajet dure environ 16 minutes lorsque le trafic est fluide.»

Voilà qui est mieux.

La photo a été prise à un arrêt de tram à Zurich
La photo a été prise à un arrêt de tram à Zurich

En voiture

Après mon rituel matinal de brossage de dents, douche et café (un peu amer ce matin), je monte en voiture. Et maintenant, un peu de musique. La musique est mon carburant, je ne peux pas m'en passer.

«Dis Google», (je viens de voir que «dis» fonctionne aussi) «lance ma playlist Bohemian Rhapsody».

Cela fait plusieurs semaines que le tube de Queen accompagne mes matins. Je m'en donne à cœur joie. En patientant au feu rouge aux portes de la ville, je me demande si ceux qui m'aperçoivent par la fenêtre apprécient ma performance artistique.

«Dis Google. Je veux envoyer un message à Dominik Natel», dis-je. C'est ainsi que mon collègue Dominik Bärlocher est enregistré dans mes contacts.

Après «Dis Google», la musique se coupe automatiquement. Le micro est ainsi à mes ordres et n'est pas perturbé par la musique. Ma demande se retrouve sur Internet sous forme de fichier audio. Un serveur analyse l'enregistrement et exécute la demande. Si nécessaire, le serveur envoie une réponse.

«Quelle application souhaitez-vous utiliser?», me demande la gentille voix de femme. Je réponds «WhatsApp» et me mets à dicter. Je ne dois pas oublier les signes de ponctuation, comme la virgule ou le point.

«Salut Dominik, point. C'est bizarre de parler comme ça, virgule, parce que je dois énoncer les signes de ponctuation, point», dis-je. Et ainsi de suite. Tout fonctionne très bien, du moment que l'on reste sur de l'allemand «standard». Le suisse-allemand demeure un tabou à l'étranger.

Je dois bien réfléchir à ce que je vais dire avant de le dire
Je dois bien réfléchir à ce que je vais dire avant de le dire

Au volant de ma voiture, je suis bien obligé de constater que l'Assistant Google me facilite la vie. Au lieu de passer le trajet à tripoter mon téléphone, je le commande par la voix.

Au bureau

Ce vendredi, j'envoie bien moins de messages que d'habitude. Nous travaillons en open space, et de toute façon je n'ai pas envie de les dicter en allemand standard. En revanche, créer des rappels et des rendez-vous dans le calendrier se fait très bien.

En parlant de rappels, j'en profite pour demander à l'assistant d'ajouter du lait et du beurre à ma liste de courses. Super invention, au passage, cette liste de courses que l'on peut remplir par commande vocale. Ça vous est déjà arrivé de vous dire «il faut que je me note de prendre du beurre» et d'oublier aussitôt? Personnellement, ça m'arrive tout le temps.

Lait, beurre, poires, bananes... plus d'excuse pour oublier quelque chose
Lait, beurre, poires, bananes... plus d'excuse pour oublier quelque chose

Je tente un «Holà Google», dans un sursaut de créativité espagnole.

Ça ne donne rien. L'assistant de Google ne s'active qu'avec «Ok Google» ou «Dis Google». Sur certains appareils, il faut appuyer sur un bouton pour lancer l'analyse vocale. D'autres restent constamment à l'écoute et détectent les mots-clés comme «Ok Google», «Alexa» ou «Dis Siri» pour ensuite transférer les données au serveur.

Pour répondre, l'appareil a besoin d'une grosse force de calcul. Il fonctionne donc uniquement sur le cloud du fournisseur. Sans ça, chaque smartphone, enceinte et machine à café devrait avoir la puissance d'un ordinateur de modélisation climatique de la NASA.

Le midi

C'est l'heure du dîner. J'ai déjà prévu de me rendre chez Angkor.

Je lance quand même un «Dis Google. J'ai faim.» pour voir si l'Assistant Google peut trouver mon asiatique préféré.

Ignorant mon estomac qui crie famine, il prend tout son temps pour me sortir une douzaine de restaurants près de chez moi. L'Angkor n'en fait pas partie. Bravo. Pour y remédier, je précise ma demande.

«Ok Google», dis-je doucement, «j'ai envie d'asiatique».

Une nouvelle voix me répond, mais en chinois. Elle me sort quelque chose que je ne comprends pas.

L'Assistant Google peut aussi traduire, même lorsqu'on ne lui a rien demandé
L'Assistant Google peut aussi traduire, même lorsqu'on ne lui a rien demandé

Je finis par comprendre qu'il m'a traduit «j'ai envie» en chinois. Je note au passage que Google ne fait pas la différence entre asiatique et chinois, ce qui me fait sourire. Mais je n'ai pas encore atteint mon objectif. Un peu agacé, je recommence: «Okay Google, y a-t-il un restaurant asiatique dans le Puls 5?»

Le restaurant Angkor apparaît enfin.

Je me demande pourquoi ça a pris autant de temps. Après tout, ce n'est pas comme si le siège de digitec était encerclé de restaurants asiatiques.

L'Assistant Google communique en ligne avec le serveur. Il compare ma demande avec sa gigantesque base de données. L'avantage, c'est que l'analyse et la comparaison des milliers de demandes de tous les utilisateurs permettent à l'assistant de s'améliorer. Le système apprend à comprendre plus que des simples mots-clés ou des formulations prédéfinies.

Cela ne fait pas très longtemps que je connais l'Angkor, mais j'imagine que plus j'y irai, plus Google le retiendra. Super, mais flippant.

L'après-midi

Cet après-midi, j'ai un entretien téléphonique de prévu. Je lance l'appel par commande vocale.

«Qui souhaitez-vous appeler?», me demande la voix féminine. Il faut maintenant que j'énonce le nom de la personne à appeler comme il est écrit dans mon répertoire. Seulement voilà, je n'ai pas enregistré son numéro.

Ce que je suis censé faire n'est pas toujours évident
Ce que je suis censé faire n'est pas toujours évident

«Euh... Zéro, sept, neuf...». Au lieu de lui dire le nom, j'entreprends d'énoncer le numéro de téléphone. Et ça marche.

Un peu plus tard, Dominik essaye de me joindre. Parfait, je vais pouvoir voir s'il est possible de décrocher en utilisant la commande vocale. C'est un échec. Le téléphone ne réagit pas à mon «Ok Google». Il continue de sonner jusqu'à ce que je décroche en swipant.

Avec Dominik, nous discutons souvent de la vie privée sur Internet. C'est un sujet important. Google autorise la désactivation automatique de sa commande vocale, ce qui empêche le smartphone d'écouter tout ce qu'il se passe. Appréciable, si l'on tient à sa vie privée. Mais dans ce cas, l'Assistant Google ne répondra plus à «Ok Google». Ce n'est pas si grave, on peut toujours ouvrir l'appli Google en maintenant le bouchon principal du smartphone appuyé.

Le soir

De nos jours, les smartphones n'ont plus le monopole de la commande vocale. Dominik s'en sert chez lui pour allumer et éteindre ses lumières. Avec le Bixby de Samsung, on peut même contrôler ses appareils électroménagers comme la machine à laver, le lave-vaisselle ou la machine à café, dans la mesure où ils sont de la même marque.

Parmi les partenaires de Google, on compte entre autres Philips Hue et Gigaset. En principe, tous ces appareils contiennent des micros cachés dans de petites enceintes en réseau et forment ce que l'on appelle une «maison connectée». Mais chez moi, il n'y a pas d'infrastructure adaptée. Je ne peux pas vraiment tester tout ça. En plus, il est tard et je commence à avoir faim.

«Dis Google. Je voudrais commander une pizza sur eat.ch.»

«J'ai programmé une alarme», me répond la voix féminine.

Ça, je ne m'y attendais pas.

En fin de compte, on a souvent faim quand on se réveille.
En fin de compte, on a souvent faim quand on se réveille.

Je la déprogramme, pas besoin d'alarme. Mon estomac gargouille si fort qu'il pourrait sortir la tortue de ma copine de son hibernation.

«Ouvre l'appli eat.ch.» Ça marche. Ma pizza avalée et mon estomac rempli, je décide de terminer mon expérience.

Bilan

«Ok Google» est surtout pratique pour accomplir des tâches routinières: jouer de la musique, programmer une alarme ou un rappel, connaître le temps qu'il fait... L'Assistant Google ne se contente pas de réagir à de simples mots-clés, il comprend également les questions plus complexes. Quand je lui demande la météo du jour, je peux enchaîner en demandant «et demain?», et il me donnera les prévisions pour le jour suivant.

L'assistance atteint malheureusement vite ses limites lorsqu'il s'agit de tâches plus complexes, du moins par chez nous. Aux États-Unis, l'Assistant Google peut acheter des billets de cinéma, réserver une table au restaurant ou encore commander une pizza. Ce n'est pas encore possible ici. En outre, un assistant vocal intelligent type Google Duplex capable de prendre un rendez-vous chez le coiffeur reste pour l'instant un rêve d'avenir.

Google Duplex a été présenté en mai 2018.

Dans la vidéo ci-dessus, vous découvrirez comment une intelligence artificielle est capable d'imiter une voix humaine de façon si réaliste que la coiffeuse à l'autre bout du fil ne remarque même pas qu'elle discute avec un ordinateur. Il n'y a plus de limite.

Finalement, à qui l'assistant vocal peut-il servir? Il n'est pas encore assez intelligent pour accomplir les tâches que je voudrais lui faire faire. Et pour les personnes ayant des déficiences visuelles ou une motricité limitée des doigts, Google fait beaucoup, mais pourrait faire encore plus. Je peux utiliser la commande vocale pour lancer un appel, mais pas pour décrocher. Je peux demander à l'assistant de programmer une alarme, mais il ne pourra pas l'annuler. Je peux ouvrir une appli en disant «Ok Google», mais je ne pourrai pas la quitter, ni vraiment l'utiliser. Et ainsi de suite.

«Dis Google. Où suis-je?»
«Dis Google. Où suis-je?»

On sent que tout cela n'a pas été entièrement réfléchi, et c'est dommage. Mais face à l'intérêt croissant que suscite la domotique, je suis sûr que la commande vocale du téléphone ne pourra que s'améliorer et devenir de plus en plus populaire.

Cet article plaît à 23 personne(s)


User Avatar
User Avatar

Vivre des aventures et faire du sport dans la nature et me pousser jusqu’à ce que les battements du cœur deviennent mon rythme – voilà ma zone de confort. Je profite aussi des moments de calme avec un bon livre sur des intrigues dangereuses et des assassins de roi. Parfois, je m’exalte de musiques de film durant plusieurs minutes. Cela est certainement dû à ma passion pour le cinéma. Ce que j’ai toujours voulu dire: «Je s’appelle Groot.» 


Smartphone
Suivez les thèmes et restez informé dans les domaines qui vous intéressent.

Ces articles pourraient aussi vous intéresser

  • Guide

    Le certificat Covid : hé, les fédéraux, vous pouvez faire mieux

    par Dominik Bärlocher

  • Guide

    Une expérience de stalking par selfie: les reflets dans les selfies constituent-ils un danger?

    par Dominik Bärlocher

  • Test de produit

    Protection de la vie privée : Volla Phone X23 à l’essai

    par Michelle Brändle

9 commentaires

Avatar
later