Familia de métodos que busca estructura en datos sin etiquetas explícitas, por ejemplo clusters, dimensiones latentes, manifolds o patrones generativos.
Glosario y preguntas frecuentes
Conceptos centrales y respuestas rápidas para navegar el curso de Machine Learning no supervisado con precisión técnica.
Glosario de Machine Learning no supervisado
Conceptos centrales extraídos de los notebooks del curso para consulta rápida y lectura semántica por buscadores.
Agrupa observaciones por similitud para descubrir segmentos, comunidades o perfiles sin conocer clases de antemano.
Algoritmo particional que asigna puntos al centroide más cercano y actualiza centroides para minimizar la variación intra-cluster.
Vector promedio que representa el centro de un cluster en K-Means y sirve como prototipo de sus observaciones.
Heurística para escoger el número de clusters observando cuándo la mejora marginal de la inercia deja de ser sustantiva.
Métrica que compara cohesión intra-cluster y separación inter-cluster para evaluar la calidad de una partición.
Construye una estructura de grupos anidados usando criterios de enlace como single, complete, average o Ward.
Algoritmo basado en densidad que detecta clusters de forma arbitraria y separa puntos de ruido mediante epsilon y MinPts.
Extensión jerárquica de DBSCAN que estima clusters estables a múltiples escalas de densidad.
Observación con suficientes vecinos dentro de un radio epsilon; funciona como base para expandir clusters en DBSCAN.
Análisis de componentes principales; proyecta datos en direcciones ortogonales que maximizan la varianza explicada.
Proporción de información retenida por cada componente principal o por un subconjunto de componentes.
Técnica no lineal que convierte similitudes de alta dimensión en probabilidades para preservar vecindarios locales en 2D o 3D.
Hiperparámetro de t-SNE que controla la escala efectiva de vecinos considerada por el algoritmo.
Método de reducción de dimensionalidad basado en grafos y geometría de manifolds, útil para visualización y exploración.
Supuesto geométrico según el cual datos de alta dimensión viven cerca de una estructura latente de menor dimensión.
Representación numérica densa que captura relaciones semánticas, geométricas o funcionales entre observaciones.
Procedimiento que calcula gradientes desde la salida hacia las capas internas para entrenar redes neuronales.
Red que aprende a comprimir una entrada en un espacio latente y reconstruirla, optimizando una pérdida de reconstrucción.
Representación interna de baja dimensión donde el modelo organiza factores relevantes de variación de los datos.
Autoencoder que usa convoluciones para explotar estructura espacial, especialmente en imágenes.
Autoencoder variacional que aprende distribuciones latentes y permite muestrear nuevas observaciones mediante inferencia probabilística.
En modelos bayesianos, el prior representa creencias antes de observar datos y el posterior las actualiza después de observarlos.
Técnica que permite entrenar VAEs con gradientes al separar ruido aleatorio de parámetros aprendibles.
Red generativa adversaria compuesta por un generador y un discriminador que compiten en un juego minimax.
Componente de una GAN que transforma ruido latente en muestras sintéticas plausibles.
Componente de una GAN que intenta distinguir muestras reales de muestras generadas.
Mecanismo que permite que cada token pese la relevancia de otros tokens del mismo contexto.
Proyecciones usadas por atención para calcular compatibilidad, recuperar información y combinar contexto.
Arquitectura basada en atención que reemplaza recurrencia por procesamiento paralelo y modelamiento contextual eficiente.
Modelo Transformer encoder bidireccional entrenado con masked language modeling para representaciones contextuales.
Tokenización en subpalabras usada por BERT para manejar vocabulario amplio y palabras infrecuentes.
Familia de modelos Transformer decoder entrenados de manera autorregresiva para predecir el siguiente token.
Parámetros de generación que controlan diversidad y aleatoriedad al elegir el siguiente token en modelos GPT.
Preguntas frecuentes
Respuestas breves y visibles en HTML para estudiantes, buscadores y plataformas que indexan contenido educativo.
¿Qué se aprende en este curso de Machine Learning no supervisado?
El curso cubre clustering, reducción de dimensionalidad, aprendizaje de representaciones, autoencoders, modelos generativos y Transformers. La idea central es aprender a descubrir estructura, construir embeddings e interpretar modelos modernos sin depender de etiquetas supervisadas.
¿Qué diferencia hay entre clustering y reducción de dimensionalidad?
El clustering busca agrupar observaciones similares; la reducción de dimensionalidad busca proyectar datos complejos a menos dimensiones preservando información relevante. En la práctica se complementan: primero se explora la geometría de los datos y luego se interpretan segmentos o patrones.
¿Por qué se estudian PCA, t-SNE y UMAP en conjunto?
PCA entrega una base lineal e interpretable; t-SNE ayuda a visualizar vecindarios locales; UMAP combina preservación local con mejor lectura de estructura global. Compararlos enseña cuándo una visualización es evidencia fuerte y cuándo solo es exploración.
¿Qué rol cumplen los embeddings y autoencoders?
Los embeddings convierten datos complejos en representaciones densas. Los autoencoders aprenden esas representaciones al comprimir y reconstruir datos, lo que permite estudiar estructura latente, anomalías, compresión y generación.
¿Cómo se conectan VAEs, GANs y Transformers con aprendizaje no supervisado?
Los VAEs aprenden distribuciones latentes, las GANs aprenden a generar muestras realistas mediante competencia adversarial y los Transformers aprenden representaciones o distribuciones de lenguaje a gran escala. Todos explotan regularidades de datos sin requerir etiquetas tradicionales para cada ejemplo.
¿El sitio incluye notebooks descargables?
Sí. Cada clase tiene una versión HTML para lectura rápida y un enlace IPYNB para descargar el notebook y ejecutarlo en un entorno local o en la nube.
¿Qué datos se publican en este sitio?
Solo se incluyen datos públicos necesarios para ejecutar los notebooks publicados. Los materiales administrativos y de evaluación se gestionan por canales internos del curso.
¿Para quién está diseñado el material?
Está pensado para estudiantes y profesionales con interés en Machine Learning aplicado que quieran pasar de intuiciones geométricas a modelos profundos de representación y generación con rigor técnico.