Sur la Toile, Techniques

De recherche de Google par la voix

Une infime partie d'unes des banques de serveurs de Google

Tout le monde ici connaît certainement Google Translate, le service de traduction automatique instantanée de Google. Mais avez-vous déjà entendu parler du nouveau service proposé sous Android (leur système d’exploitation de smartphones), Search By Voice?

Résumé en termes simples, Search By Voice est un (énième) logiciel de reconnaissance vocale, c’est-à-dire un programme qui permet de dicter à l’ordinateur ou au smartphone un texte, qu’il écrira au fur et à mesure. Les logiciels existant les plus performants (Dragon NaturallySpeaking, pour ne pas le nommer) coûtent cher (compter environ 150€ pour Dragon) et ne sont pas parfaits (sur les tests que j’ai effectués, il tourne à environ 70% de mots justes), ce qui implique une longue relecture avec correction des fautes, ce qui fait perdre le temps gagné en n’écrivant pas.

Sauf que là, c’est Google. Je ne suis pas fan de l’entreprise. Loin de là. Mais il faut reconnaître qu’ils sont incroyablement innovants. Prenons Google Translate, déjà. Il réussit les tests que je lui ai fait passer à peine mieux que les autres logiciels de traduction automatique instantanée (type Linguatec, Reverso...). Son gros avantage, c’est la finesse. Je veux dire que, lorsqu’il trouve le bon sens, il formule une phrase beaucoup plus correcte que ses concurrents. Pourquoi?

La traduction automatique est un problème depuis longtemps, encore loin d’être résolu. Parce que pour bien traduire, il faut comprendre le sens d’une phrase, ce qui met en jeu des mécanismes complexes dans le cerveau humain. Il faut ensuite reformuler ce sens en oubliant les mots de départ. Irréalisable pour un ordinateur. Un ordinateur ne comprend pas, il analyse. De là viennent les deux types de traduction automatique principalement utilisés.

1)L’analyse sémantique : le logiciel comporte une reconnaissance de la fonction de chaque mot dans une phrase, et tente donc de l’analyser. Cela entraîne un long moment de développement, avec l’aide de linguistes, notamment, pour réussir à transposer les fonctions entre les langues (car l’ordre des mots n’est pas le même, par exemple, entre le français et l’allemand).
2)Le mot à mot : technique de base. On rentre dans le logiciel un dictionnaire aussi étendu que possible (comprenant toutes les formes possibles de chaque mot), et on fait correspondre à chaque mot d’un langue A un mot d’une langue B.

Google bénéficie de beaucoup plus de serveurs, d’espace de stockage, d’expériences et d’argent que tous ses concurrents. Ce qui lui a permis de développer une troisième méthode. En se servant de l’énorme base de données Google (plusieurs milliards de pages référencées), l’entreprise peut trouver des correspondances à chaque expression que l’on veut traduire. En fait, à chaque requête, Google scanne l’ensemble des phrases qui correspondent à ce que l’on a écrit en langue A, et trouve la correspondance qui revient le plus souvent dans la langue B. C’est une analyse statistique. La phrase la plus utilisée est considérée correcte. Et si on trouve qu’elle n’est pas correcte, on peut proposer une correction.

Bien sûr le système n’est pas parfait. Essayez, pour rigoler, de faire traduire « Longtemps, je me suis couché de bonne heure » (le début de La Recherche du Temps Perdu) du français vers l’anglais, puis de l’anglais vers l’allemand, puis de l’allemand vers l’espagnol, de l’espagnol vers l’italien, et enfin de l’italien vers le français. Vous obtiendrez certainement quelque chose du genre « Tôt au lit une longue » (en passant par le tagalog, le coréen, le macédonien, le slovène, l’allemand, l’azéri, l’anglais avant le retour en français). Mais, lorsque le sens est juste, il trouve une formulation idiomatique, contrairement à ses concurrents, puisque cette formule aura été proposée par des locuteurs humains. Bref. Revenons à nos moutons, c’est à dire Google Search By Voice.

Quel rapport, me direz-vous, entre Google Translate et Google Search By Voice, à part Google? Et bien, là encore, Google a révolutionné les méthodes, et trouvé une méthode qui marche pas si mal. Habituellement, les logiciels de reconnaissance vocale reposent sur ce principe : on paramètre le logiciel pour sa voix (avec son accent, son débit, etc); le logiciel analyse en suite la courbe des sons que vous produisez, la compare avec une courbe indicative qui lui dit quelle syllabe correspond à quelle fréquence, et produit ainsi un texte brut, fait de syllabe. Il les combine ensuite (l’ensemble ne prend qu’une demie seconde environ) pour en faire des mots qu’il trouve dans son dictionnaire interne.

Google Search By Voice se repose, lui, encore une fois, sur l’énorme base de données de Google. Autrement dit, lorsque vous dites une phrase, il l’enregistre, la compare à toutes les phrases qui sont dans son immense banque de données, et choisit celle qui est la plus proche, d’un point de vue du son, de ce que vous avez dit. Les phrases sont ensuites transcrites, le plus simplement du monde, en retrouvant dans la base de données la phrase écrite qui correspond à la phrase orale. Bien sûr il a fallu des années de développement et la puissance énorme du Cloud Computing (on reviendra dessus, ne vous inquiétez pas, ceux qui ne savent pas ce que c’est) de Google pour arriver à ce résultat. Aucune autre entreprise n’aurait pu parvenir à un logiciel pareil. Parce qu’elle n’aurait pas eu le nombre de données dont dispose Google, ni son infrastructure informatique.

Désormais, chaque fois que vous utiliser Google Search By Voice, vous augmentez la taille de la base de données de Google, et donc vous améliorez le service. Est-ce un opensource? Non. Et pourtant, c’est l’utilisateur qui fait le logiciel. On pourrait considérer les logiciels de Google comme une catégorie nouvelle, ni logiciel libre ni logiciel opensource ni basé uniquement sur le travail des développeurs… Toujours convaincu qu’il faut garder toutes vos données pour vous et ne les transmettre à personne?

Addendum : Vous l’aurez compris le titre n’est que la traduction par Google Translate de Google Search By Voice en français. Comment faire pour bien traduire un texte, alors? Faire appel à un traducteur professionnel ou un étudiant en traduction. Demander un devis (qui en général est gratuit et n’engage pas) et examiner sa proposition. A moins que vous ne vous sentiez l’âme d’un développeur de logiciel de traduction automatique efficace…

Publicités

À propos de Louis Tarpin

Traducteur indépendant, je voyage et vous propose mes services en freelance. Traduction, relecture, révision, écriture, transcription, d'anglais ou italien en français, je suis à votre écoute pour produire, ensemble, des textes de qualité. Je tiens également un blog de cuisine et de photographie.

Discussion

Pas encore de commentaire.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

Les Mieux Notés

Suivez-nous sur Twitter !

Nos derniers tweets

%d blogueurs aiment cette page :