Referencia del curso

Glosario y preguntas frecuentes

Conceptos centrales y respuestas rápidas para navegar el curso de Machine Learning no supervisado con precisión técnica.

Volver al inicio

Glosario de Machine Learning no supervisado

Conceptos centrales extraídos de los notebooks del curso para consulta rápida y lectura semántica por buscadores.

Aprendizaje no supervisado

Familia de métodos que busca estructura en datos sin etiquetas explícitas, por ejemplo clusters, dimensiones latentes, manifolds o patrones generativos.

Clustering

Agrupa observaciones por similitud para descubrir segmentos, comunidades o perfiles sin conocer clases de antemano.

K-Means

Algoritmo particional que asigna puntos al centroide más cercano y actualiza centroides para minimizar la variación intra-cluster.

Centroide

Vector promedio que representa el centro de un cluster en K-Means y sirve como prototipo de sus observaciones.

Método del codo

Heurística para escoger el número de clusters observando cuándo la mejora marginal de la inercia deja de ser sustantiva.

Silhouette score

Métrica que compara cohesión intra-cluster y separación inter-cluster para evaluar la calidad de una partición.

Clustering jerárquico

Construye una estructura de grupos anidados usando criterios de enlace como single, complete, average o Ward.

DBSCAN

Algoritmo basado en densidad que detecta clusters de forma arbitraria y separa puntos de ruido mediante epsilon y MinPts.

HDBSCAN

Extensión jerárquica de DBSCAN que estima clusters estables a múltiples escalas de densidad.

Punto núcleo

Observación con suficientes vecinos dentro de un radio epsilon; funciona como base para expandir clusters en DBSCAN.

PCA

Análisis de componentes principales; proyecta datos en direcciones ortogonales que maximizan la varianza explicada.

Varianza explicada

Proporción de información retenida por cada componente principal o por un subconjunto de componentes.

t-SNE

Técnica no lineal que convierte similitudes de alta dimensión en probabilidades para preservar vecindarios locales en 2D o 3D.

Perplexity

Hiperparámetro de t-SNE que controla la escala efectiva de vecinos considerada por el algoritmo.

UMAP

Método de reducción de dimensionalidad basado en grafos y geometría de manifolds, útil para visualización y exploración.

Manifold

Supuesto geométrico según el cual datos de alta dimensión viven cerca de una estructura latente de menor dimensión.

Embedding

Representación numérica densa que captura relaciones semánticas, geométricas o funcionales entre observaciones.

Backpropagation

Procedimiento que calcula gradientes desde la salida hacia las capas internas para entrenar redes neuronales.

Autoencoder

Red que aprende a comprimir una entrada en un espacio latente y reconstruirla, optimizando una pérdida de reconstrucción.

Espacio latente

Representación interna de baja dimensión donde el modelo organiza factores relevantes de variación de los datos.

Autoencoder convolucional

Autoencoder que usa convoluciones para explotar estructura espacial, especialmente en imágenes.

VAE

Autoencoder variacional que aprende distribuciones latentes y permite muestrear nuevas observaciones mediante inferencia probabilística.

Prior y posterior

En modelos bayesianos, el prior representa creencias antes de observar datos y el posterior las actualiza después de observarlos.

Truco de reparametrización

Técnica que permite entrenar VAEs con gradientes al separar ruido aleatorio de parámetros aprendibles.

GAN

Red generativa adversaria compuesta por un generador y un discriminador que compiten en un juego minimax.

Generador

Componente de una GAN que transforma ruido latente en muestras sintéticas plausibles.

Discriminador

Componente de una GAN que intenta distinguir muestras reales de muestras generadas.

Self-attention

Mecanismo que permite que cada token pese la relevancia de otros tokens del mismo contexto.

Queries, keys y values

Proyecciones usadas por atención para calcular compatibilidad, recuperar información y combinar contexto.

Transformer

Arquitectura basada en atención que reemplaza recurrencia por procesamiento paralelo y modelamiento contextual eficiente.

BERT

Modelo Transformer encoder bidireccional entrenado con masked language modeling para representaciones contextuales.

WordPiece

Tokenización en subpalabras usada por BERT para manejar vocabulario amplio y palabras infrecuentes.

GPT

Familia de modelos Transformer decoder entrenados de manera autorregresiva para predecir el siguiente token.

Sampling y temperatura

Parámetros de generación que controlan diversidad y aleatoriedad al elegir el siguiente token en modelos GPT.

Preguntas frecuentes

Respuestas breves y visibles en HTML para estudiantes, buscadores y plataformas que indexan contenido educativo.

¿Qué se aprende en este curso de Machine Learning no supervisado?

El curso cubre clustering, reducción de dimensionalidad, aprendizaje de representaciones, autoencoders, modelos generativos y Transformers. La idea central es aprender a descubrir estructura, construir embeddings e interpretar modelos modernos sin depender de etiquetas supervisadas.

¿Qué diferencia hay entre clustering y reducción de dimensionalidad?

El clustering busca agrupar observaciones similares; la reducción de dimensionalidad busca proyectar datos complejos a menos dimensiones preservando información relevante. En la práctica se complementan: primero se explora la geometría de los datos y luego se interpretan segmentos o patrones.

¿Por qué se estudian PCA, t-SNE y UMAP en conjunto?

PCA entrega una base lineal e interpretable; t-SNE ayuda a visualizar vecindarios locales; UMAP combina preservación local con mejor lectura de estructura global. Compararlos enseña cuándo una visualización es evidencia fuerte y cuándo solo es exploración.

¿Qué rol cumplen los embeddings y autoencoders?

Los embeddings convierten datos complejos en representaciones densas. Los autoencoders aprenden esas representaciones al comprimir y reconstruir datos, lo que permite estudiar estructura latente, anomalías, compresión y generación.

¿Cómo se conectan VAEs, GANs y Transformers con aprendizaje no supervisado?

Los VAEs aprenden distribuciones latentes, las GANs aprenden a generar muestras realistas mediante competencia adversarial y los Transformers aprenden representaciones o distribuciones de lenguaje a gran escala. Todos explotan regularidades de datos sin requerir etiquetas tradicionales para cada ejemplo.

¿El sitio incluye notebooks descargables?

Sí. Cada clase tiene una versión HTML para lectura rápida y un enlace IPYNB para descargar el notebook y ejecutarlo en un entorno local o en la nube.

¿Qué datos se publican en este sitio?

Solo se incluyen datos públicos necesarios para ejecutar los notebooks publicados. Los materiales administrativos y de evaluación se gestionan por canales internos del curso.

¿Para quién está diseñado el material?

Está pensado para estudiantes y profesionales con interés en Machine Learning aplicado que quieran pasar de intuiciones geométricas a modelos profundos de representación y generación con rigor técnico.