Cinco modelos, cinco definiciones de "ingreso promedio", ninguna mal a propósito —y un bug en producción. El training-serving skew, qué resuelve realmente un feature store (una definición, dos consumos) y, sobre todo, cuándo NO usarlo.
El punto de partida si vives en Excel y quieres salir. El error de inicio (automatizar el caos sin entenderlo), los 3 pasos sin misterio (leer con pandas, transformar en funciones, escribir con openpyxl) y el salto que de verdad cambia tu semana: dejar de correrlo a mano.
Un cron funciona hasta que tienes 10 reportes con dependencias. Por qué Airflow (dependencias, reintentos, trazabilidad), el setup mínimo que un auditor entiende (tareas idempotentes, backoff, cero estado oculto) y el error más común: meter la lógica de negocio dentro del DAG.
Si solo hiciste el Titanic y el dataset de casas, eso no te prepara para el trabajo real. Por qué el dataset limpio te miente, un caso real de predecir mora con datos crudos (nulos con significado, fechas en tres formatos, fuga temporal) y la verdad incómoda: el 80% del trabajo no es el modelo.
Un modelo no avisa cuando se rompe: sigue prediciendo con confianza, números cada vez peores. Los tres tipos de drift, por qué esperar la etiqueta real llega tarde, y qué hacer cuando salta la alarma sin reentrenar en pánico.