Un modelo no avisa cuando se rompe: sigue prediciendo con confianza, números cada vez peores. Los tres tipos de drift, por qué esperar la etiqueta real llega tarde, y qué hacer cuando salta la alarma sin reentrenar en pánico.
El dataset limpio de Kaggle te miente. Cómo se hace ML de riesgo crediticio donde las decisiones cuestan dinero: definir el target es una decisión de negocio, las tres ventanas (observación, desempeño, exclusión), y por qué el desbalance no se arregla con SMOTE sino con el costo del error.
Del notebook a un endpoint real en cuatro pasos: empaquetar con dependencias fijadas, subir al Model Registry, desplegar y validar el contrato de entrada. Lo mínimo que de verdad funciona en producción, en 2026, sin montar el serving a mano.
El camino real de un scoring de crédito: del dato sucio al modelo evaluado como lo evaluaría un área de riesgo. Por qué el split temporal lo es todo, por qué accuracy miente en crédito, y por qué sin SHAP no lo puedes desplegar en banca regulada.
El 95% de exactitud en el notebook no significa nada si el modelo se cae en producción. Los tres asesinos reales (data drift, dependencias, supuestos de input) y el MLOps mínimo viable con Vertex AI y Evidently — sin Kubernetes.