Blackout Diffusion, generación de imágenes de “la nada”

Twitter - Many Worlds Linkedin - Many Worlds Facebook - Many Worlds Instagram - Many Worlds

Científicos del Laboratorio Nacional de Los Álamos (LANL) han desarrollado un nuevo entorno de trabajo que pretende redefinir la generación de imágenes por inteligencia artificial y tiene el suficiente potencial como para suponer una auténtica revolución en esta disciplina.

Blackout Diffusion ofrece un nuevo framework con el que es posible generar imágenes de la nada, es decir, desde la ausencia de imágenes o, mejor dicho, desde una “imagen vacía”. No es que este modelo de IA generativa no utilice imágenes de referencia para el aprendizaje automático, sino que no necesita una semilla aleatoria de entrada para empezar a generar una nueva imagen.

Además del cambio de enfoque y las consecuencias que esto pueda tener, con Blackout Diffusion tenemos una IA generativa capaz de crear imágenes comparables a las de otras inteligencias artificiales como DALL·E, pero utilizando menos recursos computacionales.

Conceptos básicos para entender Blackout Diffusion

Antes de intentar explicar qué es Blackout Diffusion, consideramos importante tener claros algunos conceptos relacionados con este nuevo tipo de inteligencia artificial, así que vamos a intentar explicarlos brevemente.

Modelos generativos de difusión (generative diffusion models)

En el desarrollo de la IA generativa, hay un elemento fundamental que es la aleatoriedad, que también en cierto modo estudia ramas de la física como la Termodinámica o de las matemáticas como la Probabilidad. Uno de los fenómenos aleatorios que se estudian es el proceso de difusión, que se refiere al movimiento aleatorio y sirve de inspiración a modelos de IA como DALL·E 2 o Stable Diffusion.

En la generación de imágenes por IA, se parte de la idea de que el movimiento aleatorio de los píxeles siempre conduce a ese ruido o nieve (TV static) que queda cuando el televisor no recibe señal. En los modelos generativos de difusión, se utilizan imágenes de muestra para ver cómo funciona el proceso de difusión en ese tipo de imágenes; cuando el modelo está suficientemente entrenado, es capaz de revertir el proceso. A partir del ruido, puede generar una nueva imagen del mismo tipo que las que se habían utilizado para su entrenamiento. Este proceso de inversión se hace a partir de cualquiera de los puntos aleatorios que forman ese ruido. O, al menos, era así como se hacía hasta la aparición de Blackout Diffusion.

En resumen, podría decirse que los modelos generativos de difusión destruyen o “emborronan” los datos que reciben en su entrenamiento añadiendo ruido gaussiano (los puntos siguen una distribución gaussiana) y aprenden a recuperar esos datos revirtiendo ese proceso de “emborronamiento”.

Semilla aleatoria de entrada (random seed)

Una semilla de número aleatorio se refiere al número que inicia una secuencia en un generador de números aleatorios. En un modelo de IA generativa de difusión, sería el punto del ruido a partir del cual se genera una nueva imagen.

Cadena o proceso de Márkov (Markov process)

Un proceso de Márkov es un tipo de proceso estocástico en el que la probabilidad de que se dé un evento depende únicamente del evento inmediatamente anterior.

Espacio de estados discretos (discrete-state spaces)

La representación de espacios de estado se utiliza para analizar y modelar sistemas que tienen múltiples entradas y salidas. Un espacio de estado o acción discreto es finito o contable; se opone a un estado o acción continuo, que está representado por intervalos.

Cómo funciona Blackout Diffusion

Blackout Diffusion se presentó en un estudio titulado “Blackout Diffusion: Generative Diffusion Models in Discrete-State Spaces”, firmado por Javier E. Santos, Zachary R. Fox, Nicholas Lubbers y Yen Ting Lin. Estos investigadores explican que los modelos generativos de difusión típicos se basan en procesos de difusión gaussianos; sin embargo, los datos del mundo real a menudo se presentan en espacios de estado discretos, especialmente en aplicaciones científicas. De ahí que hayan desarrollado una formulación teórica para “cadenas de Márkov de estado discreto, en el momento de añadir ruido a los datos (forward diffusion process), que utiliza análisis exacto en lugar de variacional”.

Esta formulación teórica se plasma en el entorno de trabajo Blackout Diffusion, que aprende a generar muestras nuevas desde una imagen vacía en vez de a partir de ruido. Es decir, a diferencia de los modelos generativos de difusión típicos, Blackout Diffusion no necesita una semilla aleatoria a partir de la cual revertir el proceso de difusión (backward/reverse diffusion process).

¿Qué avances o ventajas supone Blackout Diffusion?

La llegada de Blackout Diffusion tiene varias consecuencias para la industria del modelado generativo con IA; no solo para los sectores ligados a la creatividad, sino también para la investigación. Este nuevo framework, al contrario que los modelos continuos, funciona en espacios discretos, lo cual amplía su ámbito de aplicación, por ejemplo, para la ciencia. Blackout Diffusion facilita las simulaciones científicas y ayudará a avanzar en campos como la búsqueda de nuevos fármacos o los estudios sobre bioquímica.

Pero, si hay un avance visible e inmediato, es que Blackout Diffusion consigue igualar la calidad de imagen de los modelos actuales, pero utiliza menos espacio computacional. El hecho de no partir de una semilla aleatoria y “ahorrarse” el proceso inverso de difusión hace que utilice los recursos informáticos de manera más eficiente.

El planteamiento teórico de Blackout Diffusion supone, además, una nueva línea de desarrollo para la IA generativa que está llamada a revolucionar distintas acciones, desde la programación hasta la creación artística.
Blackout Diffusion es un entorno de trabajo de IA generativa muy nuevo y, aunque es prometedor y los avances en aprendizaje automático cada vez van más rápido, todavía queda ver cómo evoluciona y afecta a la industria.
En Many·Worlds, siempre intentamos estar atentos a estos avances y cambios para poder adaptar las últimas tecnologías a nuestros proyectos y sacarles el máximo partido. Si no quieres quedarte atrás, ponte en contacto con nosotros y te ayudaremos a que también puedas aprovechar estos avances en tu negocio.

DESCARGA NUESTRO INFORME SOBRE LA SITUACIÓN DE LA RA/RV EN LA INDUSTRIA 4.0


Portada de la industria

Otros artículos relacionados