Forward pass (propagación hacia adelante). La entrada x se multiplica por los pesos W⁽¹⁾, se suma el sesgo b⁽¹⁾ y se aplica una función de activación para producir la capa oculta h (2 neuronas). Luego, h se multiplica por W⁽²⁾, se suma b⁽²⁾ y se aplica otra activación para producir la salida x̂ (5 neuronas). Como es un autoencoder, el objetivo es reconstruir la entrada: x̂ ≈ x. La calidad de la reconstrucción se mide con la función de pérdida (loss):
L = ½ Σᵢ (xᵢ − x̂ᵢ)²
Esto es el error cuadrático medio (MSE). L = 0 significa reconstrucción perfecta. Cuanto mayor sea L, peor es la reconstrucción y más deben ajustarse los pesos.
Backpropagation (propagación hacia atrás). El objetivo es calcular ∂L/∂θ para cada parámetro θ de la red: cuánto cambia la pérdida L si modificamos ligeramente ese parámetro. L es la función de pérdida MSE = ½ Σᵢ(xᵢ − x̂ᵢ)², que mide el error de reconstrucción del autoencoder. Usando la regla de la cadena, el gradiente se propaga desde la salida hacia la entrada, capa por capa. Con esos gradientes, actualizamos los pesos: θ ← θ − η·∂L/∂θ (descenso del gradiente). Navega los pasos con las pills de abajo.
Valores de entrada x (target del autoencoder)
Activación oculta
Activación salida
Época: 0L = —
η1.00
Entrada xOculta hSalida x̂w > 0w < 0
x (target)Capa ocultaSalida x̂∂ > 0∂ < 0Calculando ahora