La idea es simple: en lugar de buscar en Google, abrís Gemini, activás la cámara y hacés tu pregunta en voz alta. El asistente ve lo que vos ves y responde en el momento, sin que tengas que describir nada con palabras. La cámara deja de ser solo una herramienta fotográfica y se convierte en una puerta de entrada a información contextual.
1. Reconocimiento de objetos y señales
Al apuntar la cámara hacia un objeto, Gemini puede explicar qué es, para qué sirve o qué significa. Esto incluye desde elementos cotidianos hasta señales de tránsito, carteles en otros idiomas o etiquetas de productos. Incluso puede interpretar símbolos complejos, como los de lavado en prendas de ropa, ofreciendo explicaciones claras para evitar errores.
2. Traducción y análisis de documentos en tiempo real
Otro uso muy práctico: al enfocar libros, manuales o documentos, el sistema puede traducir, resumir o explicar la información en términos más sencillos. Esto resulta especialmente útil en contextos académicos o laborales, donde el tiempo es limitado, y permite acceder rápidamente a información clave sin necesidad de leer documentos completos.
3. Asistente de cocina desde la heladera
Si no sabés qué cocinar, podés preguntarle a Gemini y mostrarle con la cámara los ingredientes que tenés en la heladera o a disposición en la cocina. Con esa información, te propondrá recetas y también puede sugerirte qué deberías comprar para tener una alimentación más variada.
4. Ayuda con reparaciones y problemas del hogar
Cuando algo se rompe o no funciona, enfocás el problema con la cámara y describís lo que pasa. La IA puede sugerir pasos a seguir, herramientas necesarias o precauciones básicas, lo que facilita resolver situaciones sin necesidad de experiencia previa.
5. Comparación de productos en tiempo real
Si ves un producto que te interesa, podés usar la cámara para identificarlo y obtener información relevante en segundos: dónde comprarlo, comparar opciones similares o conocer detalles del fabricante. Incluso podés comparar productos en tiempo real, lo que facilita tomar decisiones más informadas sin perder tiempo investigando en múltiples páginas.
Para activar estas funciones hay que tener instalada la app de Gemini y acceder a Gemini Live. Desde ahí se comparte la cámara y se hacen las preguntas por voz. Algunas funciones avanzadas requieren Gemini Advanced, el plan de pago de Google One.
