Pour traduire automatiquement des phrases, il faut comprendre leur sens. Une des possibilités est la méthode sémantique. Elle est importante puisque c'est la plus exacte. Elle prend en compte le contexte et le rapprochement des mots. Mais pour rester efficace, cette technique nécessite beaucoup de travail de la part des linguistes. C'est aussi pour cela que les logiciels correspondants sont particulièrement onéreux.
Un jour Google a fait beaucoup "mieux" et a proposé de nombreuses langues. Dans le même moment, leurs traductions étaient devenues vraiment mauvaises.
Il y a une raison. Dans l'aide officielle, il est expliqué qu'ils utilisent une méthode statistique. Une première analyse lit des livres entiers pour voir un peu statistiquement comment les mots se succèdent. Une seconde analyse injecte des livres traduits professionnellement. Au final, l'agencement des mots de la première série permet de déduire les relations entre deux textes traduits.
Testons la traduction de la phrase ironique suivante : "Par la qualité toute relative de ses articles, le site SDC est vraiment une source régulière d'informations quotidiennes."
On constate au moins qu'ils ont chacun leur propre réponse. Les langues sont un brin plus compliquées qu'une simple formule.