Il y a presque exactement un an, Google nous a montré l’une des démos technologiques les plus époustouflantes de mémoire récente : des lunettes AR capables de traduire instantanément ce que quelqu’un disait à l’utilisateur dans une autre langue, le tout en temps réel. Ces descendants de Google Glass pourraient nous donner, comme le prétendait Google, « des sous-titres pour le monde ».
Malheureusement, comme c’est souvent le cas avec les démos Google, il y avait un problème : ces lunettes de traduction AR n’étaient qu’un « premier prototype » que Google avait testé. Les sonnettes d’alarme de Vaporware ont commencé à sonner et Google est resté étrangement silencieux sur le concept depuis.
C’est dommage, car les lunettes de traduction AR de Google sont l’une des rares idées matérielles de ces dernières années qui promettent de résoudre un gros problème, plutôt qu’un inconvénient mineur. Comme l’a déclaré Google l’année dernière, la technologie pourrait faire tomber les barrières linguistiques et aider les personnes sourdes ou malentendantes à suivre les conversations.
Mais tout n’est pas perdu. Nous sommes à l’approche de Google IO 2023, qui démarre le 10 mai et donne à Google l’occasion de nous dire comment ses lunettes de traduction AR progressent. C’est une opportunité que Google doit saisir, si nous ne voulons pas perdre la foi que tout le concept devienne une réalité.
Nous n’avons pas besoin que Google annonce le produit de consommation fini ou les dates d’expédition dans IO 2023. Mais si le discours d’ouverture ne mentionne pas leurs lunettes de traduction en direct, nous devrons supposer qu’ils ont reçu un billet de première classe pour lui. cimetière google (s’ouvre dans un nouvel onglet). Heureusement, il y a de bonnes raisons de penser que ce n’est pas le cas.
Perdu dans la traduction
Le plan de Google pour nous donner le rêve de science-fiction de la technologie de traduction en direct remonte en fait à 2017, lorsqu’il a introduit les Google Pixel Buds originaux aux côtés du Pixel 2. À l’époque, Google avait déclaré que la traduction en temps réel fonctionnerait « comme avoir un personnel traducteur ». à tes côtés », mais la réalité n’a pas tenu cette promesse.
Même six ans plus tard, le processus de traduction en direct avec Google Pixel Buds Pro est une expérience délicate, comme vous pouvez le voir dans la démo ci-dessous. La promesse des lunettes de traduction AR de Google est qu’elles pourraient simplifier cela, en vous montrant la réponse traduite de l’autre personne sous forme de texte devant vos yeux, au lieu d’interrompre le flux en le jetant dans votre oreille.
Nous ne savons pas encore si les stars de la technologie se sont alignées pour y arriver, mais la concurrence de plus en plus chaude (et les propres recherches de Google) semble la pousser dans la bonne direction.
Depuis que Google a fait la démonstration de ses lunettes de traduction AR, nous avons vu un certain nombre d’entreprises démontrer des concepts similaires. Sans doute le meilleur à ce jour a été les lunettes RayNeo X2 AR de TCL, que nous avons eu le plaisir de tester au CES 2023.
Le rédacteur en chef de TechRadar, Matt Bolton, a qualifié le RayNeo X2 de « preuve de concept la plus convaincante pour les casques AR que j’ai jamais vu », et la démonstration clé est, vous l’avez deviné, la traduction en direct et le sous-titrage.
Alors qu’il y avait un léger délai de deux secondes entre une personne qui parlait et sa question traduite en texte au fond des verres, Matt Bolton a pu avoir une conversation complète avec quelqu’un qui parlait entièrement en chinois. Idéalement, les deux personnes devraient porter des lunettes AR pour qu’une conversation complète ait lieu, mais c’est un bon début.
TCL n’est pas la seule entreprise à produire un prototype fonctionnel d’un concept de lunettes similaire à celui que Google a présenté l’année dernière. L’Air Glass 2 d’Oppo a réussi à surpasser ses rivaux comme le Nreal Air et le Viture One en offrant une conception sans fil, ce qui signifie que vous n’avez pas besoin d’un câble pour coupler les spécifications avec votre smartwatch ou votre téléphone Oppo.
Malheureusement, il est peu probable qu’Air Glass 2 soit lancé sur les marchés occidentaux, et il est en fait plus probable que l’un des autres géants de la technologie puisse voler le tonnerre de la traduction en direct de Google. Cue le virage à gauche hurlant de Meta du métaverse dans son agitation latérale complice, annoncé en février 2022 (s’ouvre dans un nouvel onglet)pour créer un « traducteur vocal universel ».
Comme son nom l’indique, ce projet vise à utiliser l’apprentissage automatique et l’IA pour donner à chacun « la capacité de communiquer avec n’importe qui dans n’importe quelle langue », comme l’a déclaré Mark Zuckerberg. Essentiellement pour les lunettes de traduction AR de Google, Meta a également promis que « avec une efficacité améliorée et une architecture plus simple, la parole à la parole directe pourrait débloquer une traduction en temps réel de qualité quasi humaine pour les futurs appareils comme les lunettes. » AR ».
Avec Meta prévoyant apparemment de sortir ces lunettes AR, actuellement surnommées Project Nazare, dans le courant de 2024, Google est définitivement sur le point de commencer à évoluer avec ses spécifications de traduction AR, et idéalement cela signifie annoncer des nouvelles plus concrètes à Google IO 2023.
Orthophonie
Google sera-t-il vraiment en mesure d’annoncer le développement de ses lunettes AR Translation lors de sa grande conférence des développeurs la semaine prochaine ? Jusqu’à présent, il n’y a eu aucune rumeur ou fuite suggérant que ce sera le cas, mais ces derniers mois, il est devenu clair que Google Translate, et les langues en général, restent l’une de ses principales priorités.
En mars, les chercheurs de Google AI a révélé avec enthousiasme plus d’informations sur son Universal Speech Model (USM) (s’ouvre dans un nouvel onglet)qui est au cœur de son plan visant à créer un modèle de langage d’IA prenant en charge 1 000 langues différentes.
Cet USM, que Google décrit comme une « famille de modèles vocaux de nouvelle génération », est déjà utilisé sur YouTube pour générer des sous-titres traduits automatiquement sur des vidéos en 16 langues (ci-dessous), permettant aux YouTubers de développer leur audience mondiale.
Google affirme que cette IA a été formée sur 12 millions d’heures de parole et 28 milliards de phrases de texte, couvrant plus de 300 langues. Ce sont des données de formation importantes qui, espérons-le, apporteront une contribution significative aux lunettes de traduction AR, comme celles que Google a démontrées il y a un an.
Malheureusement, il y a peu de preuves que les récentes avancées de Google ont fait leur chemin dans Google Traduction. Alors que la société a annoncé l’année dernière qu’elle avait ajouté 24 langues à Translate, le portant à un total de 133 langues prises en charge, sa progression semble stagner, avec des rivaux comme profondL (s’ouvre dans un nouvel onglet) largement considéré comme plus précis dans certaines langues.
Pourtant, Google a fait des progrès ailleurs, révélant en février que Translate sera bientôt bien meilleur pour comprendre le contexte. Par exemple, il pourra comprendre si vous parlez de commander une basse (le poisson) pour le dîner ou de commander une basse (l’instrument) pour votre groupe.
Google a ajouté que Translate, pour une poignée de langues prises en charge, commencera à utiliser « les tournures de phrase correctes, les idiomes locaux ou les mots appropriés en fonction de votre intention », permettant aux phrases traduites de correspondre à la façon dont une personne parle de langue maternelle.
Tout cela ressemble à nouveau à une base idéale pour les lunettes de traduction AR qui fonctionnent un peu plus comme le traducteur universel de Star Trek, et moins comme les expériences maladroites et saccadées que nous avons eues dans le passé.
Voir, c’est croire
Google a déjà beaucoup de choses à dire à Google IO 2023, du nouveau Google Pixel Fold au Google Bard, et la petite affaire d’Android 14. Mais c’est aussi un moment maintenant ou jamais pour eux de saisir leurs lunettes de traduction AR . une étape importante pour devenir réalité.
Cette année, Google a déjà été critiqué par le boom de ChatGPT, et le mois prochain, il semble probable que nous verrons l’arrivée tant attendue du casque Apple AR/VR à la WWDC 2023. Si vous voulez être considéré comme un matériel innovateur, au lieu d’un débutant paresseux, vous devez commencer à transformer certaines de vos idées les plus innovantes en objets du monde réel.
À certains égards, les lunettes de traduction AR de Google semblent être le contraste idéal avec le casque de réalité mixte d’Apple, qui, selon les analystes, jettera tout au mur pour voir quel cas d’utilisation tient le coup.
À l’inverse, un portable plus simple qui fait bien une chose, ou du moins mieux que ses rivaux récemment lancés, pourrait être le coup de pouce dont Google a besoin au cours d’une année au cours de laquelle il a apparemment été attaqué de toutes parts. Nous attendons avec impatience de voir votre réponse à Google IO 2023, et nous garderons un œil sur les émissions de vos hôtes.
« Introverti. Amateur de bière extrême. Organisateur subtilement charmant. Explorateur d’une humilité exaspérante. Écrivain indépendant. »