Sommaire
Google présente des lunettes intelligentes avec HUD lors de TED2025
Lors de la conférence TED2025, Google a révélé des lunettes intelligentes élégantes dotées d’un affichage tête haute (HUD), bien que la société les ait qualifiées de “matériel conceptuel”.
Révélation lors de TED
Au début du mois, Shahram Izadi, responsable de Google Android XR, a pris la scène à TED pour présenter non seulement ces lunettes HUD, mais aussi le futur casque XR de Samsung.
La présentation de 15 minutes est désormais disponible au public.
Les lunettes proposées sont équipées de caméras, de microphones et de haut-parleurs, à l’instar des Ray-Ban Meta glasses, mais elles se distinguent par un “petit affichage haute résolution en couleur dans la lentille”.
Cet affichage, monoculaire, utilise la réfraction lumineuse dans une lentille droite et offre un champ de vision relativement limité.
Présentation du système AI Gemini
La démonstration s’est concentrée sur le système d’intelligence artificielle multimodale de Google, Gemini, en incorporant la capacité Project Astra qui permet de se souvenir de ce qu’elle capte en “encodant continuellement les cadres vidéo, combinant l’entrée vidéo et vocale dans une chronologie d’événements et gardant cette information en mémoire pour un rappel efficace”.
Ce qui a été démontré :
- Multimodal Basique : Bhatia demande à Gemini de composer un haïku basé sur ce qu’elle voit, et le système répond par un poème évocateur.
- Mémoire Contextuelle : Après s’être détournée d’une étagère, Bhatia demande à Gemini le titre du “livre blanc qui était derrière elle”, et Gemini répond correctement. Plus tard, elle questionne sur sa “carte de clé d’hôtel” sans mentionner l’étagère; Gemini localise la carte à droite du disque musical.
- Multimodal Complexe : Bhatia demande une explication sur un diagramme dans un livre; Gemini offre une réponse adéquate.
- Traduction : En regardant un panneau en espagnol, elle demande à Gemini de le traduire sans préciser la langue, réussissant à le faire en anglais, puis, à la demande du public, en farsi.
- Support Multilingue : Bhatia interagit avec Gemini en hindi, et l’AI répond spontanément dans la même langue.
- Actions : En regardant un album, Bhatia demande à Gemini de jouer une piste, ce qui est diffusé sur son téléphone via Bluetooth.
- Navigation : Elle demande une direction vers un parc avec vue sur l’océan. Lorsqu’elle regarde droit devant, elle voit des instructions 2D, et vers le bas, un minimap 3D fixe du trajet.
Autres avancées et concurrence
À Google I/O 2024, Google avait déjà dévoilé une démonstration de ces lunettes intelligentes avec HUD focalisées sur les capacités du Project Astra de Gemini.
Il est notable que les modèles de l’année précédente étaient plus encombrants, ce qui suggère des efforts de miniaturisation en cours.
Shahram Izadi a décrit ces innovations comme du “matériel conceptuel”, sans annonce d’un produit ou de calendrier précis.
Outre Google, des rumeurs indiquent que Samsung, en collaboration avec Google Gemini AI, travaille également sur un concurrent des Ray-Ban Meta. De son côté, Meta prévoit de lancer ses propres lunettes intelligentes, équipées d’un affichage similaire dans l’œil droit et d’une intelligence artificielle multimodale.
Apple semble aussi envisager le développement de lunettes intelligentes, avec une potentielle sortie en 2027, espérant capitaliser sur le succès initial des Ray-Ban Meta glasses.
On peut s’attendre à une compétition acharnée dans l’univers des lunettes intelligentes dans les prochaines années, chaque entreprise cherchant à dominer le marché de l’AI capable de voir et d’entendre tout comme l’utilisateur, tout en projetant des images à tout instant.
