VAE: intuición visual e interactiva

VAE: por qué aprender una nube y no solo un punto

Un autoencoder clásico comprime cada dato en un código fijo. Eso sirve para reconstruir, pero no garantiza que el espacio latente sirva para generar datos nuevos. El VAE cambia la regla: cada dato se codifica como una distribución y esas distribuciones se ordenan contra un prior simple.

Idea central: el VAE cambia un poco de nitidez por un espacio latente continuo, muestreable y con menos hoyos.

Controles del simulador

Fuerza KL β 1.00

β balanceado: reconstruye y ordena el espacio.

Incertidumbre σ 0.35

σ grande obliga al decoder a funcionar en una zona, no solo en un punto exacto.

Presets didácticos

Ejemplo observado x

Qué son A, B y C: son datos de juguete. Cada uno es una familia de patrones 5×5 parecidos a una letra. Sirven solo para mostrar que el VAE aprende regiones latentes para tipos de datos distintos.

Acciones

Si algo se pierde: presiona Reset, vuelve a Paso 1 y usa los presets.

Reconstrucciónmedia

Alineación con priormedio

Diversidad latentemedia

Arquitectura conceptual

Qué mirar ahoraProblema AE

Espacio latente 2D

patrón A patrón B patrón C prior común N(0,I), no es un patrón z muestreado

Qué ve el decoder

1. El problema del autoencoder clásico

Diagnóstico actual

Qué problema resuelve El AE reconstruye, pero no garantiza que un z aleatorio tenga sentido. El VAE entrena un espacio que se puede muestrear.

Qué agrega Cada dato pasa a ser una nube $q(z|x)$ y no un punto fijo. La KL acerca esas nubes al prior $N(0,I)$.

Qué puede fallar Si β es muy bajo hay hoyos. Si β es muy alto, el decoder puede ignorar z y producir salidas promedio.