En mayo de este año Google anunció Veo 3, su nuevo generador de videos hiperrealistas a partir de una descripción (un prompt) o una imagen explicando cómo debe animarse (la imagen original también puede estar generada por IA).
La herramienta llamó la atención del público porque con una mera descripción permite generar un video que parece grabado al estilo tradicional, incluyendo la creación de las voces y del sonido ambiente, algo que no era posible hasta ahora.
Rápidamente se viralizaron videos de todo tipo: desde los claramente generados por IA, con perspectivas imposibles, a los que intentaban simular ser “reales”, como un testimonio callejero tomado por un móvil televisivo o de streaming.
De hecho, el CEO de Google, Sundar Pichai, confirmó que desde mayo la comunidad internacional creó más de 40 millones de videos con Veo 3.
El alcance de estos videos, no obstante, estaba dado por la disponibilidad del acceso a la plataforma. Veo 3 estaba disponible mediante la introducción de prompts en Flow, un editor de video online que usa inteligencia artificial, aunque exclusivamente para suscriptores del plan Google AI Ultra en Estados Unidos, un servicio premium con un costo de 250 dólares al mes, que ofrece acceso anticipado a las últimas herramientas de inteligencia artificial desarrolladas por la compañía. Luego la compañía extendió el alcance a un grupo de países del hemisferio norte.
Hoy Google anunció que se extiende el alcance de esta plataforma. “Queremos que más personas puedan crear con Flow, así que hoy ampliamos la disponibilidad de Flow y Google AI Ultra (para el máximo acceso a lo mejor de la IA de Google) a 76 países más. Esto significa que, a partir de hoy, Flow está disponible en más de 140 países con un plan Google AI Pro o Ultra.»
Entre esos 140 países está la Argentina, tal como explica la propia compañía en su sitio. La única limitación oficial es que toda la interfaz debe usarse en inglés.
A diferencia de modelos anteriores como Imagen Video o Phenaki, Veo 3 alcanza un nivel de fluidez visual y realismo acústico que lo acerca a la calidad de una producción cinematográfica. Los clips generados pueden alcanzar una resolución de hasta 1080p y una duración de hasta un minuto, algo inusual en el campo de las IA generativas.
Otra diferencia clave es su capacidad para captar matices del lenguaje. El modelo entiende tonos, estilos y contextos, lo que permite generar resultados distintos según se especifique “una escena de película de acción” o “un video documental sobre naturaleza”.