2 Introduccion y Motivacion

La mayoria de los pipelines de credito siguen una receta implicita: predecir una PD puntual y optimizar decisiones como si esa prediccion fuera exacta. El problema es conocido y profundo: pequenas desviaciones de calibracion o cambios de regimen pueden inducir politicas fragiles, justo en la capa donde se asigna capital.

Este paper propone una respuesta operativa y cientificamente defendible: usar intervalos conformales como conjuntos de incertidumbre para optimizacion robusta de portafolio. El foco no es “otro modelo de scoring”, sino un puente explicito entre uncertainty quantification y predict-then-optimize que denominamos Conformal Robust Predict-then-Optimize (CRPTO). La industria suele colapsar predicciones en valores esperados para la optimizacion; nosotros resolvemos esto inyectando los intervalos de Conformal Prediction directamente como conjuntos de incertidumbre del optimizador.

2.0.1 Contexto en la literatura

La interseccion entre prediccion, incertidumbre y decision ha sido abordada desde tres tradiciones relativamente independientes. Primero, la literatura de predict-then-optimize formalizada por (Elmachtoub & Grigas, 2022) propone la perdida SPO+ que entrena modelos de prediccion teniendo en cuenta directamente la calidad de la decision downstream. Esta linea, ampliada por (Donti et al., 2017), sistematizada en el survey de (Mandi et al., 2024) y extendida recientemente al setting online por (Capitaine et al., 2026), ha demostrado que minimizar el error predictivo no equivale a minimizar el arrepentimiento decisional — de hecho, en el benchmark de este proyecto, SPO+ reduce el regret de decision en un 49.1% respecto al enfoque two-stage clasico (Wilcoxon \(p < 10^{-164}\)). Sin embargo, la mayor parte de estos trabajos asume que la prediccion es puntual y no incorpora cuantificacion de incertidumbre explicita: SPO+ minimiza regret pero no ofrece garantias de cobertura auditables ni proteccion verificable contra colas de riesgo.

Segundo, la optimizacion robusta clasica de (Bertsimas & Sim, 2004) introduce conjuntos de incertidumbre parametrizados por un presupuesto de robustez \(\Gamma\) que controla el trade-off entre proteccion contra peores escenarios y conservadurismo excesivo. Esta formulacion ha sido ampliamente adoptada en finanzas y logistica, pero depende de supuestos distribucionales o de la eleccion ad hoc del tamano del conjunto de incertidumbre. La pregunta natural — como construir conjuntos de incertidumbre con garantias formales de cobertura — ha recibido relativamente poca atencion hasta la aparicion de la prediccion conformal.

Tercero, la prediccion conformal, establecida formalmente por (Vovk et al., 2005) y popularizada por la introduccion pedagogica de (Angelopoulos & Bates, 2023), ofrece intervalos de prediccion con garantias de cobertura finita y distribution-free, bajo la unica condicion de intercambiabilidad. La literatura mas cercana al tipo de garantia que usa este paper ya no se limita a cobertura clasica: (Bates et al., 2021) y (Angelopoulos et al., 2025) introducen marcos de risk control distribution-free; (Angelopoulos et al., 2024) extiende esa idea a riesgos monotónicos con una garantía en esperanza; y (Johnstone & Cox, 2021) junto con (Patel et al., 2024) comienzan a conectar conjuntos conformales con optimizacion robusta. Trabajos recientes como CROMS (Bao et al., 2025), conformal robust optimization and satisficing (Zhao et al., 2026), calibración conformal end-to-end (Yeh, Christianson, Wu, et al., 2025) y conformal prediction robusta multi-distribución (Yang & Jin, 2026) refuerzan que la pregunta ya es decision-aware, no solo predictiva. El trabajo mas directamente comparable es Predict-then-Calibrate (Sun et al., 2024), que propone separar explicitamente la prediccion de la calibracion de incertidumbre para LP contextuales robustos; su garantia de cobertura sandwiched (\(\alpha \leq \mathbb{P}(c \in \mathcal{U}) \leq \alpha + 1/(T+1)\)) aplica al vector de costos, pero no se instancia en una restriccion de portafolio ponderada ni incorpora cobertura grupo-condicional. No obstante, estas contribuciones operan en dominios genericos, en tareas de vision/NLP, shortest path o portafolios de equity, sin conexion directa con credito minorista real.

2.0.2 Brecha en la literatura

La curaduria de docs/research/foundations/crpto_references_state_of_art.md muestra un panorama sugerente:

si existen trabajos sobre Conformal Robust Optimization (Johnstone & Cox, 2021; Patel et al., 2024; Zhao et al., 2026);
si existe la literatura clasica de price of robustness y SPO+ (Bertsimas & Sim, 2004; Elmachtoub & Grigas, 2022);
no aparece una integracion clara entre credito minorista real, intervalos conformales y asignacion robusta de portafolio.

Esa brecha es especialmente interesante en Lending Club, donde el paso de score a decision economica es inmediato y medible. Ninguno de los trabajos identificados en las categorias C (conformal + robust optimization), D (conformal en finanzas) y E (decision-focused learning) del repositorio de referencias combina simultaneamente: (i) un modelo de scoring calibrado sobre datos de credito reales, (ii) intervalos conformales Mondrian con una partición regulatoriamente interpretable de base y una variante empíricamente promovida por benchmark, (iii) una formulacion de portafolio robusta parametrizada por dichos intervalos, y (iv) una traduccion explicita desde el control de riesgo conformal tipo RCPS/LTT/CRC hacia una restriccion lineal de PD ponderada. Esta ausencia constituye la brecha central que motiva el presente trabajo.

El refresh de literatura de mayo de 2026 refina, pero no desplaza, esta brecha. Los trabajos nuevos muestran que el campo se mueve hacia calibracion conformal end-to-end (Yeh, Christianson, Wu, et al., 2025), seleccion de modelos conformal robustos por riesgo decisional (Bao et al., 2025), control de riesgo OCE/CVaR (Yeh, Christianson, Wierman, et al., 2025), cobertura multi-distribucion (Yang & Jin, 2026) y actualizacion online (Capitaine et al., 2026; Liu et al., 2026). Esa direccion confirma que CRPTO debe presentarse como una arquitectura post-hoc, auditable y portfolio-aware: no pretende ser la ultima palabra end-to-end, sino una instancia concreta donde la incertidumbre conformal ya cambia una decision financiera real y deja una cadena de evidencia reproducible.

Por que esta brecha importa para los profesionales

En la practica bancaria, la asignacion de capital crediticio se realiza diariamente sobre estimaciones puntuales de PD. Cuando esas estimaciones fallan — por cambios macroeconomicos, drift temporal o simple error de calibracion — las perdidas se materializan antes de que los modelos de monitoreo las detecten. Un sistema que incorpore incertidumbre con garantias formales directamente en la decision de asignacion no solo mejora la robustez del portafolio, sino que facilita la gobernanza ante comites de riesgo y reguladores, quienes pueden auditar tanto la cobertura del intervalo como la sensibilidad de la decision.

2.0.3 Preguntas de investigacion

El paper se estructura alrededor de las siguientes preguntas:

RQ1: Pueden los intervalos conformales split actuar como conjuntos de incertidumbre operativos para optimizacion robusta de portafolio crediticio, produciendo decisiones cuya calidad sea verificable empiricamente?
RQ2: Como se compara esta estrategia con baselines de incertidumbre alternativos — bootstrap, BMA y decision-focused learning — en terminos de cobertura, anchura de intervalo y retorno economico ajustado por riesgo?
RQ3: Cual es la frontera eficiente entre nivel de confianza conformal (\(1-\alpha\)), robustez del portafolio y retorno economico, y como puede un gestor de portafolio navegar esa frontera en la practica?

2.0.4 Pregunta central

Puede un intervalo conformal actuar como conjunto de incertidumbre operativo para asignacion robusta de capital crediticio sin depender de supuestos distribucionales fuertes?

2.0.5 Alcance del paper

Este trabajo cubre el pipeline completo desde la prediccion calibrada de PD hasta la decision de portafolio robusta, pasando por la generacion de intervalos conformales Mondrian. Especificamente, el paper aborda: la calibracion de CatBoost con seleccion automatica entre Platt, isotonica y Venn-Abers (vease Sección 4.0.1.2); la generacion de intervalos conformales via MAPIE con grade como baseline natural e interpretable y score_decile_mondrian como winner final promovido (vease Sección 10.1); la formulacion de un programa lineal robusto parametrizado por las bandas conformales (vease Capítulo 4); y la evaluacion empirica sobre datos out-of-time de Lending Club.

El paper no cubre: una demostracion distribution-free mas fuerte que Markov para el bound de funded set, la extension a portafolios multi-periodo o con costos de transaccion, ni la comparacion con metodos de optimizacion end-to-end como el entrenamiento conformal de riesgo propuesto por (Yeh, Christianson, Wierman, et al., 2025). El tightening Hoeffding/Bernstein sí queda documentado como apendice condicional bajo supuestos adicionales de independencia, pero no reemplaza el teorema principal. Tampoco aborda la prediccion online conformal, online DFL (Capitaine et al., 2026) ni la adaptacion a distribuciones no estacionarias mediante algoritmos tipo universal portfolio (Liu et al., 2026) o cobertura robusta multi-distribución (Yang & Jin, 2026), temas que se discuten en Sección 6.0.8.

Alcance honesto del claim

El paper actual es fuerte como CRPTO post-hoc auditable: toma una PD calibrada, construye intervalos conformales, los usa como conjunto de incertidumbre y promueve una policy económica dentro de una región exacta. No afirma todavía que toda la selección conformal sea end-to-end decision-aware ni que el bound post-selección sea más fuerte que el resultado distribution-free documentado en Sección 3.0.4.

2.0.6 Contribuciones del paper

Formaliza el enfoque Conformal Robust Predict-then-Optimize (CRPTO), estableciendo un puente directo entre la garantia de cobertura/riesgo conformal y el presupuesto de robustez de (Bertsimas & Sim, 2004) para seleccion de portafolio crediticio.
Compara CRPTO contra baselines alternativos de incertidumbre (bootstrap, BMA) y contra decision-focused learning (SPO+), con metricas que abarcan cobertura, anchura, regret economico y auditabilidad regulatoria.
Cuantifica la frontera entre cobertura, ancho y retorno economico bajo una misma trazabilidad experimental, proporcionando una herramienta operativa para gestores de portafolio.
Demuestra que la ventaja competitiva de CRPTO frente a SPO+ no es el regret (donde SPO+ es superior por diseno) sino la trazabilidad: cobertura verificable por grupo, auditabilidad ante SR 11-7, y respuesta automatica ante cambios de regimen via ensanchamiento natural de intervalos.
Materializa una capa P1 de evidencia journal sin cambiar el champion: funded-set export, strict temporal holdout, exact eval de finalists conformales, stress sintético endurecido y apéndice de dependencia para el tightening condicional.

Lectura editorial recomendada

El claim fuerte no es “CRPTO domina a SPO+ en toda metrica”. El claim publicable es mas preciso: CRPTO paga un precio de regret para comprar auditabilidad, cobertura verificable y una region robusta exacta dentro de la cual la policy economica puede promoverse sin ambiguedad. Esa lectura alinea el paper con Management Science / Operations Research / EJOR mejor que una narrativa de leaderboard unico.

2.0.7 Relevancia metodologica

El valor del paper no esta solo en la robustez. Tambien esta en la gobernanza:

la PD esta calibrada con Venn-Abers;
la incertidumbre tiene cobertura observable;
la policy promovida queda congelada en models/final_project_promotion.json y models/champion_portfolio_policy.json.

Ese paquete lo diferencia de enfoques puramente teoricos donde el conjunto de incertidumbre es elegante, pero dificil de auditar o desplegar.

2.0.8 Estructura del argumento

Las siguientes secciones desarrollan:

el marco teorico que conecta conformal y robustez (Capítulo 3);
el protocolo experimental congelado del proyecto (Capítulo 4);
la evidencia empirica sobre trade-offs y politicas resultantes (Capítulo 5);
las amenazas a la validez y la agenda de cierre para version journal (Capítulo 6);
el paquete de soporte que el libro conserva para escritura posterior: ablacion Mondrian (Sección 10.1), protocolo SPO+ (Sección 11.1), checkpoint de fair lending (Sección 12.1), MRM/SR 11-7 (Sección 13.1), composicion del funded set
1. y trazabilidad completa (Sección 15.1).

Por que el libro conserva mas material que el paper

La version actual de Quarto funciona como una mesa de trabajo editorial. No todo entrara en el primer manuscrito: parte sera cuerpo del paper, parte ira al appendix journal y parte quedara como tesis/libro. Mantener aqui el material amplio evita perder decisiones, cautelas, artefactos y argumentos que luego pueden ser decisivos cuando se escoja venue o cuando lleguen comentarios de reviewers.

Angelopoulos, A. N., & Bates, S. (2023). Conformal Prediction: A Gentle Introduction. Foundations and Trends in Machine Learning. https://arxiv.org/abs/2107.07511

Angelopoulos, A. N., Bates, S., Candès, E. J., Jordan, M. I., & Lei, L. (2025). Learn then Test: Calibrating Predictive Algorithms to Achieve Risk Control. The Annals of Applied Statistics. https://doi.org/10.1214/24-AOAS1998

Angelopoulos, A. N., Bates, S., Fisch, A., Lei, L., & Schuster, T. (2024). Conformal Risk Control. ICLR 2024. https://openreview.net/forum?id=33XGfHLtZg

Bao, Y., Hu, Y., Ren, H., Zhao, P., & Zou, C. (2025). Optimal Model Selection for Conformalized Robust Optimization (CROMS). https://arxiv.org/abs/2507.04716

Bates, S., Angelopoulos, A. N., Lei, L., Malik, J., & Jordan, M. I. (2021). Distribution-Free, Risk-Controlling Prediction Sets. arXiv preprint. https://arxiv.org/abs/2101.02703

Bertsimas, D., & Sim, M. (2004). The Price of Robustness. Operations Research. https://doi.org/10.1287/opre.1030.0065

Capitaine, A., Haddouche, M., Moulines, E., Jordan, M. I., Boursier, E., & Durmus, A. (2026). Online Decision-Focused Learning. ICLR 2026. https://doi.org/10.48550/arXiv.2505.13564

Donti, P. L., Amos, B., & Kolter, J. Z. (2017). Task-based End-to-end Model Learning in Stochastic Optimization. NeurIPS. https://arxiv.org/abs/1703.04529

Elmachtoub, A. N., & Grigas, P. (2022). Smart «Predict, then Optimize». Management Science, 68(1). https://doi.org/10.1287/mnsc.2020.3922

Johnstone, C., & Cox, B. (2021). Conformal Uncertainty Sets for Robust Optimization. COPA (PMLR v152). https://proceedings.mlr.press/v152/johnstone21a.html

Liu, T., Dobriban, E., & Orabona, F. (2026). Online Conformal Prediction via Universal Portfolio Algorithms. https://arxiv.org/abs/2602.03168

Mandi, J. et al. (2024). Decision-Focused Learning: Foundations, State of the Art, Benchmark and Future Opportunities. Journal of Artificial Intelligence Research. https://arxiv.org/abs/2307.13565

Patel, N., Rayan, O., & Tewari, A. (2024). Conformal Contextual Robust Optimization. AISTATS (PMLR v238). https://arxiv.org/abs/2310.10003

Sun, C., Liu, L., & Li, X. (2024). Predict-then-Calibrate: A New Perspective of Robust Contextual LP. arXiv preprint arXiv:2305.15686. https://arxiv.org/abs/2305.15686

Vovk, V., Gammerman, A., & Shafer, G. (2005). Algorithmic Learning in a Random World. Springer. https://doi.org/10.1007/978-3-031-06649-8

Yang, Y., & Jin, Y. (2026). Multi-Distribution Robust Conformal Prediction. https://doi.org/10.48550/arXiv.2601.02998

Yeh, C., Christianson, N., Wierman, A., & Yue, Y. (2025). Conformal Risk Training: End-to-End Optimization of Conformal Risk Control. NeurIPS 2025. https://arxiv.org/abs/2510.08748

Yeh, C., Christianson, N., Wu, A., Wierman, A., & Yue, Y. (2025). End-to-End Conformal Calibration for Optimization Under Uncertainty. Transactions on Machine Learning Research. https://arxiv.org/abs/2409.20534

Zhao, L., Jiang, H., & Qi, W. (2026). Conformal Robust Optimization and Satisficing for Prescriptive Analytics with Black-Box Predictors. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5338354