ATB RADIO

EN VIVO

ATB Digital
Tecnología

Meta lanza SAM 3D, una herramienta capaz de generar modelos 3D a partir de una sola imagen

Meta lanza SAM 3D, una herramienta capaz de generar modelos 3D a partir de una sola imagen

Mundo, 26 de nov 2025 (ATB Digital).-  Meta ha dado un paso importante en el campo de la percepción visual con el lanzamiento de SAM 3D, una herramienta que permite generar reconstrucciones tridimensionales de objetos y cuerpos humanos partiendo únicamente de una imagen en 2D. A diferencia de otras tecnologías similares, esta propuesta destaca por su capacidad de representar tanto la geometría como la textura con un alto grado de fidelidad, incluso cuando se trata de escenas reales complejas o parcialmente ocultas.

Dos modelos para abordar el 3D desde lo cotidiano

El sistema se apoya en dos modelos principales: SAM 3D Objects y SAM 3D Body. Cada uno de ellos está diseñado para resolver distintos retos dentro del universo tridimensional. Por un lado, SAM 3D Objects permite reconstruir cualquier objeto individual que haya sido segmentado en una imagen, logrando resultados detallados y manipulables. Esto incluye desde un jarrón hasta una bicicleta, pasando por objetos más complejos que estén parcialmente cubiertos o distorsionados en la imagen original.

Por otro lado, SAM 3D Body se enfoca en recrear con precisión la forma y postura del cuerpo humano, incluso cuando éste aparece en posiciones inusuales o parcialmente visible. Esto abre la puerta a aplicaciones muy prácticas en sectores como el entretenimiento, el fitness, la rehabilitación física y el diseño de ropa digital.

Capacidad de entender escenas completas

Un aspecto que hace destacar a SAM 3D es su capacidad para generar reconstrucciones completas de escenas. Esto implica no solo representar objetos y personas por separado, sino situarlos en un contexto compartido, entendiendo su relación espacial y proporciones en conjunto. Gracias a esto, es posible visualizar, por ejemplo, cómo se ve una persona sentada frente a una mesa o cómo se distribuyen varios elementos dentro de una habitación, todo partiendo de una imagen plana.

Esta capacidad de percepción tridimensional del mundo real refleja una evolución hacia sistemas de IA que comprenden no solo la forma de las cosas, sino también su lugar en el espacio y su interacción con otros elementos. Es como pasar de ver una fotografía a tener una maqueta virtual que podemos recorrer o manipular desde cualquier ángulo.

Tecnología con arquitectura avanzada

Para lograr estos resultados, los ingenieros de Meta han desarrollado una arquitectura sofisticada. En el caso del modelo orientado a cuerpos humanos, se utiliza un sistema de codificador-decodificador basado en transformadores, capaz de predecir directamente la postura y la malla tridimensional del cuerpo. Esto permite una reconstrucción interactiva y precisa que no necesita información extra ni sensores especiales.

En el caso de los objetos, se aplican dos etapas de generación utilizando DiTs (Diffusion Transformers): la primera se encarga de crear la forma y posición en 3D, mientras que la segunda se enfoca en refinar los detalles y aplicar la textura para obtener una representación realista. Esta combinación permite que el sistema sea resistente a factores que tradicionalmente dificultan la reconstrucción, como la oclusión o la iluminación variable.

Aplicaciones prácticas y cotidianas

Uno de los aspectos más interesantes de SAM 3D es su orientación hacia usos prácticos en contextos reales. Por ejemplo, en Facebook Marketplace se podrá visualizar un mueble como una lámpara o una mesa directamente en la propia habitación del usuario mediante superposición en realidad aumentada. Esta funcionalidad podría reducir dudas antes de una compra, mejorando la experiencia de compra digital.

En el ámbito de la fisioterapia, la posibilidad de capturar con precisión la postura de un paciente desde una simple fotografía permite evaluar la evolución de ciertos tratamientos sin necesidad de equipos especializados. Y en el campo de la robótica, estas reconstrucciones tridimensionales facilitan que los sistemas puedan interactuar con objetos del mundo real con mayor comprensión de su forma y ubicación.

Evaluación en condiciones reales

Para asegurar que su tecnología esté alineada con los desafíos reales, Meta ha presentado el SAM 3D Artist Object Dataset, un conjunto de datos que contiene mallas tridimensionales de alta calidad capturadas en entornos reales. Este dataset representa un cambio en la forma de evaluar avances en el área, alejándose de escenarios artificiales o curados, y proponiendo una evaluación más exigente basada en percepción y comprensión visual del mundo tal como es.

Con esta nueva referencia, se plantea un nuevo estándar para medir el progreso en la reconstrucción 3D, alineando los desarrollos técnicos con las necesidades y condiciones de uso real, lo que aumenta el potencial de transferencia tecnológica y adopción comercial.

Más allá de la segmentación

SAM 3D es una extensión de los avances previos logrados con el modelo Segment Anything (SAM 3), que ya permitía detectar y segmentar objetos en imágenes o vídeos con gran precisión mediante instrucciones visuales o de texto. Ahora, con la incorporación de capacidades tridimensionales, Meta propone un ecosistema completo que va desde la segmentación hasta la representación espacial en 3D, todo alimentado por una misma lógica de comprensión visual.

Fuente: WWWHATSNEW

Noticias relacionadas

Trabajo instruye repliegue de funcionarios de Llaguaya, tras enfrentamientos y amenazas a oficinas públicas

Sergio Aliaga

Lily-Rose Depp sigue ascendiendo en su carrera y revela su obsesión con Drácula

ATB Usuario

YPFB concluye nuevo ducto que proveerá gas con mayor poder calorífico a la Planta Río Grande

Cristal Vergara Capo