VAE: por qué aprender una nube y no solo un punto

Un autoencoder clásico comprime cada dato en un código fijo. Eso sirve para reconstruir, pero no garantiza que el espacio latente sirva para generar datos nuevos. El VAE cambia la regla: cada dato se codifica como una distribución y esas distribuciones se ordenan contra un prior simple.

Idea central: el VAE cambia un poco de nitidez por un espacio latente continuo, muestreable y con menos hoyos.
1. Sigue los pasos Usa la navegación para leer una idea a la vez. No partas moviendo todo.
2. Mira el espacio latente A/B/C son tres familias de datos sintéticos. Las nubes son $q(z|x)$ para cada familia.
3. Cambia β Compara β=0, β=1 y β alto para ver el trade-off reconstrucción vs generación.
Paso 1 de 6
1.00
β balanceado: reconstruye y ordena el espacio.
0.35
σ grande obliga al decoder a funcionar en una zona, no solo en un punto exacto.
Qué son A, B y C: son datos de juguete. Cada uno es una familia de patrones 5×5 parecidos a una letra. Sirven solo para mostrar que el VAE aprende regiones latentes para tipos de datos distintos.

Si algo se pierde: presiona Reset, vuelve a Paso 1 y usa los presets.

Reconstrucciónmedia
Alineación con priormedio
Diversidad latentemedia
Qué mirar ahoraProblema AE
    patrón A patrón B patrón C prior común N(0,I), no es un patrón z muestreado

    1. El problema del autoencoder clásico

    Diagnóstico actual

    Qué problema resuelve El AE reconstruye, pero no garantiza que un z aleatorio tenga sentido. El VAE entrena un espacio que se puede muestrear.
    Qué agrega Cada dato pasa a ser una nube $q(z|x)$ y no un punto fijo. La KL acerca esas nubes al prior $N(0,I)$.
    Qué puede fallar Si β es muy bajo hay hoyos. Si β es muy alto, el decoder puede ignorar z y producir salidas promedio.