ATB RADIO

EN VIVO

ATB Digital
Tecnología

Google Labs impulsa la nueva era de la inteligencia artificial generativa

Mundo, 16 junio 2025 (ATB Digital).— El futuro de la colaboración entre humanos e inteligencia artificial está tomando forma en los laboratorios de Google. Tras el evento Google I/O, Google Labs ha presentado una serie de innovaciones en IA generativa que prometen transformar la creatividad, la productividad y la personalización digital. Proyectos como Veo, Whisk, Project Mariner y NotebookLM no solo muestran el avance tecnológico de la compañía, sino que también redefinen la manera en que las personas interactúan con la información y las herramientas digitales. Según lo reportado por Google Labs en una conversación con Sonya Huang, de Sequoia Capital, estos desarrollos marcan el inicio de una nueva etapa en la relación entre humanos y máquinas inteligentes.

Google Labs: un nuevo liderazgo en IA tras Google I/O

La percepción pública sobre el liderazgo de Google en inteligencia artificial ha cambiado de manera notable en las últimas semanas, especialmente después de las presentaciones en Google I/O. De acuerdo con Google Labs, la aceleración en el lanzamiento de productos y la calidad de sus modelos han sido factores determinantes para este giro. Thomas Iljic, responsable de Whisk y Veo, atribuyó este cambio a la solidez de los modelos desarrollados por Google, mientras que Jaclyn Konzelmann, líder de Project Mariner, destacó la cantidad de productos y experiencias completamente nuevas que han surgido en poco tiempo.

Simon Tokumine, encargado de NotebookLM, señaló que el reconocimiento externo es el resultado de años de trabajo interno en IA generativa. “Para nosotros, esto se siente como el final del primer capítulo y el inicio del segundo”, afirmó Tokumine en declaraciones recogidas por Google Labs. La compañía ha logrado posicionarse en los primeros lugares de los principales rankings de IA, y sus modelos son considerados de vanguardia en la industria.

Innovaciones en creatividad: Veo y Whisk

En el ámbito creativo, Google Labs ha apostado por fusionar el cine y los videojuegos a través de la generación de video e imagen con IA. Thomas Iljic explicó que herramientas como Veo y Whisk permiten a los usuarios construir mundos virtuales, definir escenarios y personajes, y luego “filmar” dentro de esos entornos. Este enfoque, conocido como “world-building“, facilita la iteración y el refinamiento de las creaciones, permitiendo pausar, corregir y rehacer escenas de manera sencilla.

Iljic subrayó que la clave está en el concepto de “show and tell“, donde los usuarios no solo escriben instrucciones, sino que también pueden mostrar ejemplos visuales o actuar como referencia para la IA. “No todo se hace a través de texto; es más intuitivo mostrar y actuar, o dar una referencia como inspiración”, explicó Iljic, según lo publicado por Google Labs. Esta metodología democratiza la creación visual, permitiendo que cualquier persona, sin importar su experiencia previa, pueda experimentar con la narrativa audiovisual.

Whisk se orienta al público general, facilitando la creación y el remix de contenidos visuales en contextos tan variados como chats entre amigos o presentaciones empresariales. Por su parte, Veo y Flow están pensados para cineastas y creadores avanzados, ofreciendo herramientas sofisticadas para la producción de video con IA. La última versión de Veo, conocida como VO3, ha superado a sus predecesoras en calidad y adherencia a las instrucciones, y ahora incorpora la generación simultánea de audio y video, lo que amplía las posibilidades expresivas y la viralidad de los contenidos.

A pesar de estos avances, Iljic reconoció que aún existen retos técnicos, como la consistencia de personajes en escenas múltiples y la propagación de cambios a lo largo de un proyecto. Sin embargo, se mostró optimista respecto a la reducción de costos y el aumento de velocidad en la generación de video, anticipando que estas tecnologías serán cada vez más accesibles.

Productividad y asistentes inteligentes: Project Mariner

En el terreno de la productividad, Project Mariner representa un salto hacia la automatización inteligente de tareas en el navegador. Jaclyn Konzelmann relató que el proyecto nació con la idea de crear agentes capaces de explorar y actuar en nombre del usuario, más allá de responder preguntas o generar contenido. Inicialmente lanzado como una extensión de Chrome en diciembre pasado, Mariner ha evolucionado gracias al feedback de un grupo de usuarios de prueba, quienes valoraron especialmente la capacidad del agente para tomar el control del ratón, hacer clic, desplazarse y escribir en formularios.

La versión más reciente de Mariner, anunciada en Google I/O, permite a los usuarios delegar tareas que se ejecutan en segundo plano en máquinas virtuales, sin interrumpir su trabajo en el navegador local. Una de las innovaciones clave es la integración de contexto: Mariner puede acceder a todas las pestañas abiertas y utilizar esa información para completar tareas complejas, como agregar ingredientes de una receta a un carrito de compras en Instacart.

Konzelmann destacó la capacidad multitarea del agente, que puede gestionar hasta diez tareas simultáneamente, y la importancia de ofrecer al usuario la opción de supervisar o retomar el control en cualquier momento. “El usuario puede ver al agente en acción, pausar la tarea o recibir un resumen de lo realizado al finalizar”, explicó Konzelmann, según Google Labs.

En cuanto a los desafíos técnicos, la líder de Mariner reconoció que aún existen áreas de mejora en la calidad del modelo y la velocidad de ejecución. La decisión de utilizar capturas de pantalla, en lugar de interactuar directamente con el código de las páginas web, responde a la intención de desarrollar habilidades aplicables más allá de los sitios web tradicionales. Konzelmann anticipó que la automatización de tareas cotidianas, como la planificación de viajes o la gestión de compras en línea, será solo el comienzo, y que el verdadero potencial de Mariner radica en su capacidad para operar de manera omnipresente en todos los dispositivos del usuario y en su interacción con otros agentes.

El impacto de Mariner en el comercio electrónico podría ser significativo. Al eliminar la fricción humana en el proceso de compra, se abren nuevas oportunidades para la evolución de los modelos de negocio y la personalización de la experiencia de usuario. “Podríamos ver la aparición de un ‘carrito universal’ que agregue productos de diferentes tiendas y permita realizar compras con un solo clic”, sugirió Konzelmann en la conversación recogida por Google Labs.

Transformación de la información: NotebookLM

NotebookLM, liderado por Simon Tokumine, ha evolucionado de ser una herramienta viral de resúmenes de audio a convertirse en una plataforma integral para transformar la información en formatos personalizados. Tokumine explicó que la visión detrás de Notebook LM es crear contenido adaptado a una “audiencia de uno“, es decir, información diseñada específicamente para las necesidades individuales de cada usuario.

El éxito inicial de Notebook LM se debió a la función de audio overviews, que permitía generar resúmenes conversacionales de documentos. Sin embargo, el equipo ha ampliado las capacidades de la plataforma, incorporando aplicaciones móviles y soporte para audio en varios idiomas, gracias a la integración con modelos avanzados de Gemini. Ahora, los usuarios pueden acumular información a lo largo del tiempo, aprovechar la inteligencia integrada y adaptar el contenido a diferentes formatos, como cómics, mapas mentales o presentaciones.

Tokumine señaló que la personalización y la adaptabilidad de la información son fundamentales para el futuro de la gestión del conocimiento. “No todo tiene que ser un podcast; la información puede presentarse como un cómic, un video corto o un mapa mental, según lo que sea más útil para el usuario en ese momento”, afirmó Tokumine, según lo informado por Google Labs. Esta flexibilidad permite a estudiantes y profesionales gestionar proyectos complejos y acceder a la información de manera más eficiente.

El equipo de NotebookLM también está explorando nuevas formas de interacción, inspiradas en el comportamiento de los usuarios, como la generación de retroalimentación personalizada a partir de perfiles de LinkedIn o la creación de narrativas visuales para resumir documentos extensos. Tokumine destacó la importancia de aprovechar las características únicas de los dispositivos móviles para ofrecer experiencias complementarias a las de escritorio, como la grabación y transformación de conversaciones en tiempo real.

Retos, oportunidades y perspectivas futuras


Los líderes de Google Labs coincidieron en que uno de los mayores desafíos ha sido el “timing” en el desarrollo de nuevas tecnologías. A menudo, los proyectos han estado “demasiado adelantados” a su tiempo, lo que ha supuesto tanto una dificultad como una ventaja competitiva cuando las capacidades técnicas finalmente han estado listas. “Es fácil estar demasiado temprano en este espacio, pero eso nos da una ventaja cuando los modelos y las capacidades maduran”, reflexionó Iljic en la charla recogida por Google Labs.

En cuanto a las oportunidades, la reducción de costos y el aumento de la eficiencia en los modelos de IA están permitiendo que herramientas antes inaccesibles se conviertan en parte de la vida cotidiana. La convergencia entre creatividad, productividad y personalización está dando lugar a nuevos formatos y experiencias, como el contenido remixable y la automatización de tareas complejas.

Los líderes de Google Labs también anticipan cambios en los modelos de negocio y en el ecosistema digital, impulsados por la automatización y la personalización. La aparición de agentes inteligentes capaces de interactuar entre sí y de operar en múltiples dispositivos podría transformar la manera en que las personas consumen, crean y gestionan información.

La experimentación y la capacidad de aprender de los errores han sido elementos clave en el avance de estos proyectos. “La idea de ‘show and tell’ ha demostrado ser fundamental: no se trata solo de pedir a los usuarios que escriban instrucciones, sino de permitirles mostrar y colaborar con la IA como lo harían con un colega humano”, concluyó Iljic, según lo publicado por Google Labs.

Con estos desarrollos, Google Labs se posiciona como un referente en la exploración de nuevas formas de colaboración entre humanos e inteligencia artificial, abriendo el camino hacia una era en la que la creatividad, la productividad y la gestión de la información se redefinen constantemente.

Fuente: Infobae

Noticias relacionadas

Google cuenta con una nueva IA llamada Gemini

ATB Usuario

Ultra Ethernrt es una aplicación con IA que ayuda a descargar archivos con alto tráfico

ATB Usuario

Volvo incorpora la inteligencia artificial de Google Gemini en sus vehículos, ofreciendo una novedosa manera de interactuar mientras se conduce

Sergio Aliaga