Gemini 3.5 Live Translate es el modelo de audio más avanzado de Google para traducción en vivo, diseñado para facilitar la comunicación entre personas que hablan diferentes idiomas. La plataforma permite mantener conversaciones fluidas, ofreciendo traducciones instantáneas durante el diálogo. A diferencia de los sistemas anteriores, que esperaban a que el hablante terminara la frase para procesar y traducir, este sistema opera de forma continua: la traducción fluye mientras la persona habla.
La diferencia técnica que lo cambia todo
El problema de los traductores de voz tradicionales siempre fue el mismo: las pausas. El gran salto respecto a herramientas anteriores es que ya no hace falta parar a esperar la respuesta: la traducción fluye de forma continua mientras el hablante habla. El sistema sigue al hablante con solo unos segundos de retraso y conserva la entonación, el ritmo y el tono de voz original.
La latencia es de menos de un segundo. La herramienta tiene un retraso en el doblaje de menos de 1 segundo y mantiene la cadencia original del hablante. Además, detecta automáticamente los idiomas involucrados sin necesidad de configuraciones manuales. Eso significa que podés tener una conversación fluida con alguien que habla otro idioma como si los dos tuvieran un intérprete en tiempo real entre los dos.
Cómo usarlo en el celular
La función ya está disponible en Google Translate para Android e iOS, sin costo adicional. A partir del 9 de junio de 2026, cualquier usuario de Android o iOS puede activarlo en la aplicación Google Translate. Para acceder, hay que abrir la app y comprobar si ya se activó. El lanzamiento es progresivo y puede tardar un poco en aparecer; en ese caso conviene revisar si hay una actualización pendiente en la tienda.
En Android hay un "modo escucha" adicional. Este modo permite pegar el teléfono al oído como en una llamada privada para oír la traducción de forma discreta. Y con cualquier par de auriculares conectado, la app funciona como un intérprete simultáneo que escucha por el micrófono del celular y traduce al oído.
El salto en Google Meet
El impacto en el trabajo es igual de significativo. En Google Meet, el servicio pasó de admitir solo cinco idiomas a soportar más de 70, lo que permite más de 2.000 combinaciones lingüísticas dentro de una misma reunión. Anteriormente, las traducciones se limitaban únicamente a intercambios desde o hacia el inglés, pero esta restricción desaparece con la nueva arquitectura.
El detalle de seguridad: SynthID
Todas las voces generadas por la IA llevan una marca invisible de identificación. Como medida de seguridad, Google anunció que todas las voces generadas por Gemini 3.5 Live Translate incorporarán marcas de agua digitales mediante la tecnología SynthID. Estas marcas quedan integradas en la forma de onda del audio y permiten identificar que la voz fue creada por un sistema automatizado.
