27 Literatura, Trazabilidad y Entorno Reproducible

Contexto académico, contribuciones, notebooks, artefactos y configuración que ayudan a decidir qué va al paper y qué al journal.

Nota editorial: este capítulo conserva material técnico de soporte para tesis, supplement y revisión. Los bloques de código quedan acotados visualmente por defecto; la lectura principal está en el texto, las tablas y las figuras.

Procedencia: book/chapters/18-research-agenda/18a-state-of-the-art.qmd

27.1 Estado del Arte

El proyecto se ubica en la intersección de varias literaturas maduras y unas pocas intersecciones todavía poco exploradas. La fuente maestra para este mapa es docs/research/foundations/crpto_references_state_of_art.md, que cataloga aproximadamente 80 trabajos organizados en 12 categorías temáticas.

27.1.1 Mapa temático

Panorama del estado del arte
Eje	Estado de la literatura	Gap relevante para el proyecto
Conformal foundations	Muy desarrollado	Pocas aplicaciones integradas a decisión crediticia
Mondrian / group-conditional	Activo 2023-2026	Evidencia aplicada en crédito real aún limitada
Conformal + robust optimization	Emergente	Integración operativa aún rara en portafolio crediticio
IFRS9 / lifetime credit risk	Madura por separado	Ausencia práctica de UQ distribution-free en pipelines ECL
Decision-focused learning	Expansión rápida	Poco diálogo con incertidumbre conformal en crédito

27.1.2 Mapa bibliográfico actualizado CRPTO

El intake bibliográfico de mayo de 2026 deja el mapa más fino: existen predecesores cercanos en P2P lending, credit scoring conformal ordinal, conformal robust optimization y decisión certificates. Por eso el claim fuerte ya no debe ser “nadie ha trabajado nada parecido” sino una afirmación más defendible: no encontramos un trabajo que una, en el mismo artefacto auditable, PD calibrada sobre Lending Club, intervalos conformales, optimización robusta de portafolio crediticio, exact funded-set validation y gobernanza de reproducibilidad.

Bloque	Papers que ahora deben aparecer	Lectura para tesis/paper
Conformal foundations	Vovk, Papadopoulos, Angelopoulos, Bates, Barber, Gibbs/Candes.	Base de cobertura y límites de cobertura condicional.
Group/weighted/MD coverage	Mondrian, Barber, Guan, Jonkers, Liu multi-source, Yang MDCP, Bhattacharyya group-weighted.	Sustenta A23 y evita sobreprometer cobertura exacta por perfil.
Conformal + robust decisions	Johnstone, Patel, Sun PTC, Yeh E2E, Hu CRC, Chen/Reddy.	Vecindario teórico directo de CRPTO.
Decisión certificates	CROM, CREDO, CREME, conformal satisficing.	Future work natural, no selector oculto del champion.
P2P/Lending Club OR	Guo, Chi, Babaei/Bamdad, Torkian/Bamdad/Sarfaraz.	Predecesores de dominio que obligan a precisar la novedad.
Credit scoring y asignación	Lessmann, Ayari, Khandani, Jagtiani, Albanesi, Blattner, Brevoort, Fuster.	Contexto de scoring, equidad, ruido y credit invisibility.
Decision-focused learning	Donti, Elmachtoub/Grigas, Mandi, Schutte.	Comparador de regret; CRPTO prioriza auditoría y riesgo.
Finance conformal portfolios	Noguer, Kato, Liu online portfolio.	Vecinos financieros fuera de crédito minorista.
IFRS9 / MRM / governance	Basel, SR 11-7, ECB/IFRS9, FinRegLab, CFPB BISG.	Tesis/supplement, no contribución central IJDS.

27.1.3 Corriente 1: Fundamentos de predicción conformal

La predicción conformal fue establecida formalmente por (Vovk et al., 2005) en el marco del algorithmic learning, proporcionando garantías de cobertura finita bajo la única condición de intercambiabilidad. El trabajo de (Papadopoulos et al., 2002) introdujo la variante inductiva (split conformal) que reduce drásticamente el costo computacional al separar el conjunto de calibración del de entrenamiento, a cambio de una partición de datos. La guia introductoria de (Angelopoulos & Bates, 2023) popularizó el marco en la comunidad de ML, mientras que (Romano et al., 2019) propuso Conformalized Quantile Regression (CQR), que combina regresión cuantílica con calibración conformal para producir intervalos adaptativos en anchura. Más recientemente, (Bates et al., 2021) y (Angelopoulos et al., 2025) desarrollaron marcos de risk control distribution-free, (Angelopoulos et al., 2024) extendió el enfoque a control de riesgo conformal para pérdidas monotónicas, y el survey de (X. Zhou et al., 2025) consolida el estado del campo con una perspectiva de datos.

Brecha para este proyecto: la mayoría de estos trabajos son fundamentales y genéricos; la aplicación a dominios específicos de decisión financiera sigue siendo limitada.

27.1.4 Corriente 2: Cobertura condicional y Mondrian

El procedimiento Mondrian, introducido en (Vovk et al., 2005) y desarrollado como distribución predictiva por (Boström et al., 2021), ofrece garantías de cobertura group-conditional al calibrar intervalos dentro de particiones predefinidas. (Ding et al., 2023) abordaron la escalabilidad del enfoque cuando el número de clases es grande, mostrando que la partición debe equilibrar granularidad con tamaño de muestra de calibración. (Gibbs et al., 2025) formalizaron garantías condicionales más fuertes, y (Bairaktari et al., 2025) propusieron Kandinsky conformal prediction para particiones multi-atributo. (Y. Zhou & Sesia, 2024) exploró la cobertura ecualizada para grupos seleccionados adaptativamente, y (Plassier et al., 2025) abordó la validez condicional aproximada.

Brecha para este proyecto: ya no conviene afirmar que no existe predicción conformal en crédito, porque hay trabajo ordinal reciente (Kawasumi et al., 2026). La brecha defendible es más estrecha: la evidencia publicada que conecte particiones de riesgo crediticio, validación out-of-time, intervalos PD y decisión de portafolio sigue siendo muy limitada.

27.1.5 Corriente 3: Predicción conformal y optimización robusta

La conexión entre conjuntos conformales y optimización robusta fue inaugurada por (Johnstone & Cox, 2021), quienes propusieron usar intervalos conformales como conjuntos de incertidumbre para programas robustos. (Patel et al., 2024) extendieron esta idea al caso contextual, donde los conjuntos de incertidumbre dependen de covariables observadas. (Yeh, Christianson, Wu, et al., 2025) propusieron calibración conformal end-to-end para optimización bajo incertidumbre, y (Chenreddy & Delage, 2024) abordaron la optimización robusta condicional. (Zhao et al., 2026) formalizaron la interacción entre conformal y satisficing, y (Bao et al., 2025) propusieron selección óptima de modelo para optimización robusta conformada. (Chan et al., 2024) exploraron la optimización inversa conformal, y (Iutzeler & Mazoyer, 2025) conectaron predicción de riesgo conformal con optimización distributivamente robusta.

Brecha para este proyecto: a pesar de la riqueza de este subcampo, los ejemplos cercanos suelen ser abstractos, LPs contextuales generales o decisiones robustas fuera de crédito. La conexión entre intervalos conformales, scoring crediticio calibrado, P2P/Lending Club y asignación robusta de capital sigue siendo el espacio específico de CRPTO.

27.1.6 Corriente 4: Predicción conformal en finanzas

(Noguer i Alonso, 2024b) ofreció un survey de predicción conformal en finanzas que cubre portafolios de equity, commodities y derivados. (Kato, 2025) propuso selección de portafolios basada en predicciones conformales, y (Noguer i Alonso, 2024a) exploró la optimización de portafolio conformal. (Fantazzini, 2024) aplicó inferencia conformal adaptativa a medidas de riesgo de mercado. (Liu et al., 2026) conecto predicción conformal online con algoritmos de portafolio universal.

Brecha para este proyecto: estos trabajos operan predominantemente en mercados de equity y derivados. La aplicación a crédito minorista — donde el “retorno” es un cupón fijo y el “riesgo” es un evento binario de default — tiene características suficientemente distintas como para requerir evaluación independiente.

27.1.7 Corriente 4b: P2P lending y portafolios de crédito

El intake nuevo deja claro que el vecindario aplicado de CRPTO ya existe. Guo et al. estudian evaluación de riesgo para inversion P2P (Guo et al., 2016), Chi, Ding y Peng formulan un problema robusto de portafolio P2P (Chi et al., 2019), Babaei y Bamdad proponen soporte multiobjetivo para inversion P2P (Babaei & Bamdad, 2020), y Torkian, Bamdad y Sarfaraz llevan una lectura AI/OR multiobjetivo al dominio de digital lending (Torkian et al., 2026).

Brecha para este proyecto: estos trabajos hacen que el paper de CRPTO deba ser preciso. La novedad no es “usar optimización en Lending Club”; es usar la incertidumbre conformal de una PD calibrada como objeto de decisión robusta, con exact funded-set validation y trazabilidad de artefactos.

27.1.8 Corriente 5: Decision-focused learning y predict-then-optimize

(Elmachtoub & Grigas, 2022) introdujeron la pérdida SPO+ que optimiza la predicción teniendo en cuenta directamente la calidad de la decisión downstream. (Donti et al., 2017) propusieron aprendizaje end-to-end en optimización estocastica, y (Mandi et al., 2024) sistematizaron el campo en un survey comprensivo. (Sun et al., 2024) propusieron Predict-then-Calibrate, un paradigma que separa la predicción de la cuantificación de incertidumbre vía calibración por cuantiles residuales, logrando garantías de cobertura independientes del modelo predictivo para LP contextuales robustos. (Kiyani et al., 2025) exploraron los fundamentos de teoría de decisión para predicción conformal, y (Yeh, Christianson, Wierman, et al., 2025) propusieron entrenamiento de riesgo conformal que optimiza directamente el control de riesgo conformal.

Brecha para este proyecto: la interacción entre decision-focused learning e incertidumbre conformal en crédito es prácticamente inexistente. El proyecto aborda esta brecha al incorporar tanto intervalos conformales como una implementación de SPO+ (véase sec-estrella-results), permitiendo la comparación directa entre ambos paradigmas.

27.1.9 Corriente 6: Riesgo crediticio, IFRS 9 y análisis de supervivencia

(Saavedra et al., 2024) aplicaron ML con riesgos competitivos para estimar PD lifetime bajo IFRS 9. («Defining and comparing SICR-events under IFRS 9», 2025) compararon definiciones de eventos SICR, y (IFRS Board, 2024) publico un análisis de retroalimentacion sobre las dificultades prácticas de los triggers actuales. (Botha & Verster, 2026) abordaron la modelizacion de la estructura temporal de default bajo IFRS 9, y (Chen, 2024) ofrece un tratamiento comprehensivo de modelizacion práctica de riesgo de crédito. (European Central Bank, 2024) documenta las expectativas supervisoras del BCE sobre overlays y mejoras de modelos. En el ambito de scoring, (Lessmann et al., 2015) y (Ayari et al., 2026) proporcionan benchmarks sistematicos de algoritmos de clasificación para crédito.

Brecha para este proyecto: ningún trabajo identificado conecta predicción conformal con el pipeline completo de IFRS 9, incluyendo staging (SICR), provisión (ECL por rango) y análisis de sensibilidad. Esta ausencia es la motivacion central del Paper 2 (sec-p2-intro).

27.1.10 Corriente 7: Inferencia causal en crédito

(Chernozhukov et al., 2018) establecieron el marco de Double/Debiased ML para estimación de parámetros de tratamiento, y (Athey & Wager, 2019) propusieron los bosques causales para estimación de efectos heterogeneos (CATE). (Causal Inference for Banking, Finance, and Insurance, 2023) reviso el uso de inferencia causal en banca y finanzas. El proyecto utiliza CATE para ajustar decisiones de portafolio (véase sec-cate-portfolio), pero la combinación de intervalos conformales sobre estimaciones CATE en crédito permanece inexplorada.

27.1.11 Hallazgos de posicionamiento

La revisión curada del proyecto enfatiza seis vacíos que se organizan en tres niveles de profundidad. Los dos primeros son fundacionales: la ausencia de papers que integren conformal con IFRS9 end-to-end y la ausencia de un ejemplo auditable que combine conformal prediction, PD calibrada y robust portfolio allocation en crédito. Estos vacíos son importantes porque las dos aplicaciones más naturales de la incertidumbre conformal en banca — provisionar con bandas y asignar capital con protección — todavía no tienen una ruta aplicada completa. Sin resolver estos, las aplicaciones más específicas no tienen base.

Los dos siguientes son metodológicos: la falta de uso explícito del ancho conformal como señal SICR y la escasez de sistemas completos CatBoost → calibración → CP → decisión robusta. Estos vacíos operan un nivel más abajo: asumen que la integración fundacional es posible y preguntan cómo implementarla. El ancho como señal SICR es una propuesta concreta que convierte un subproducto del intervalo en un trigger prudencial; el pipeline completo es la evidencia de que la cadena puede ejecutarse end-to-end sin que las piezas se desacoplen.

Los dos últimos son de gobernanza y validación: la escasez de evaluación de Mondrian conformal sobre grades crediticios con datos OOT y la falta de integración explícita de predicción conformal con validación de modelos (MRM / SR 11-7). Estos vacíos son los que determinan si un resultado académico puede cruzar hacia la práctica bancaria. Un regulador no pregunta solo si el modelo funciona — pregunta si se puede verificar que funciona, por segmento y en datos que el modelo no vio durante entrenamiento. Sin cobertura OOT verificable por grade y sin un marco de validación compatible con SR 11-7, la predicción conformal permanece como curiosidad metodológica.

Cada uno de estos seis vacíos corresponde a una contribución específica de la tesis, y su organización jerárquica refleja la estructura del propio pipeline: primero se establece la viabilidad fundacional (Papers 2 y Estrella), luego se demuestra la implementación metodológica (Pipeline completo + SICR conformal), y finalmente se valida la gobernanza (Paper 3 + MRM).

Seis vacíos reformulados

La revisión sistemática de la biblioteca CRPTO revela estos claims defendibles:

No identificamos una integración de predicción conformal con provisiones IFRS 9 end-to-end.
La evidencia de Mondrian conformal sobre grades crediticios con validación OOT sigue siendo limitada.
No identificamos un paper que use intervalos conformales como conjuntos de incertidumbre para optimización robusta de portafolio crediticio con funded-set validation.
No identificamos una integración de pérdida SPO+ e incertidumbre conformal en crédito que preserve el mismo contrato de auditoría.
No identificamos el ancho conformal como señal SICR en un pipeline IFRS9-inspired.
No identificamos predicción conformal integrada de forma explícita en un dossier MRM/SR 11-7.

Cada uno de estos vacíos corresponde a una contribución específica de la tesis.

La lectura actualizada reemplaza el lenguaje absoluto de “zero papers” por un lenguaje de claim auditable. Kawasumi et al. muestran que ya existe conformal prediction en credit scoring ordinal (Kawasumi et al., 2026); Guo, Chi, Babaei/Bamdad y Torkian/Bamdad/Sarfaraz muestran que P2P lending ya tiene modelos de inversion y optimización (Babaei & Bamdad, 2020; Chi et al., 2019; Guo et al., 2016; Torkian et al., 2026). CRPTO se sostiene porque integra esas familias con cobertura conformal, robustez de portafolio y trazabilidad de artefactos, no porque las literaturas vecinas no existan.

27.1.12 Cómo se posiciona el proyecto

El proyecto no compite principalmente en “otra mejora incremental de scoring”. Su posicionamiento más fuerte es el de una plataforma aplicada que conecta:

probabilidad calibrada,
incertidumbre observable,
optimización / provisión,
gobernanza y reproducibilidad.

Matriz tematica maestra del panorama research
Tema	Pregunta central	Donde se cristaliza en este proyecto
Scoring calibrado	Cómo convertir score en probabilidad defendible?	`sec-calibration-selection` y `sec-model-champion`
Conformal por grupo	Cómo medir incertidumbre útil por segmento?	`sec-mondrian` y Paper 3
Decisión robusta	Cómo usar esa incertidumbre para asignar capital?	`sec-robust-portfolio` y CRPTO
IFRS9 con incertidumbre	Cómo se mueve la provisión bajo escenarios y lifetime risk?	`sec-ecl-calculation` y Paper 2
Gobernanza aplicada	Cómo sostener la conversacion ante auditoría y comité?	`sec-mrm`

27.1.13 Implicacion

Esta ubicación permite una estrategia de publicación por piezas sin perder coherencia global: cada paper vive en una intersección distinta, pero todos beben del mismo núcleo experimental y del mismo vocabulario metodológico. La coherencia no es solo retórica: los tres papers comparten el mismo modelo base (CatBoost calibrado), el mismo pipeline conformal (MAPIE Mondrian), los mismos datos out-of-time y la misma infraestructura de reproducibilidad, lo cual elimina la posibilidad de que resultados contradictorios entre papers se deban a diferencias de implementación.

Procedencia: book/chapters/18-research-agenda/18b-thesis-contributions.qmd

27.2 Contribuciones de la Tesis

La tesis completa debe leerse como un sistema de contribuciones encadenadas, no como una suma de notebooks o dashboards. Esa lectura ya no depende de una página específica de Streamlit: queda fijada oficialmente en este capítulo del libro. Las contribuciones se organizan en cuatro dimensiones — metodológica, técnica, operativa y regulatoria — que reflejan las capas del pipeline y las audiencias a las que cada aporte se dirige.

La tesis en una oracion

Esta tesis demuestra que la combinación de calibración probabilística, predicción conformal Mondrian e incertidumbre distribution-free produce un sistema de gestión de riesgo crediticio que es simultáneamente más robusto en sus decisiones, más transparente en su gobernanza y más informativo en sus provisiones que los pipelines convencionales basados en predicciones puntuales.

27.2.1 Contribuciones metodológicas

Las contribuciones metodológicas constituyen el núcleo teórico de la tesis y representan los aportes con mayor potencial de generalización más allá del dominio de crédito.

Predict-then-optimize con predicción conformal. La contribución central de la tesis es la formalización del uso de intervalos conformales como conjuntos de incertidumbre para optimización robusta de portafolio crediticio (sec-estrella-intro). A diferencia de los conjuntos de incertidumbre clásicos de (Bertsimas & Sim, 2004), que requieren especificación ad hoc o supuestos distribucionales, los intervalos conformales heredan directamente la garantía de cobertura del procedimiento conformal. La evidencia empírica muestra que esta conexión produce portafolios cuya calidad es verificable en términos de cobertura y estabilidad, y que el nivel conformal $1-\alpha$ funciona como una palanca de robustez con consecuencias económicas observables.

Mondrian conformal para scoring crediticio. La evaluación sistemática de Mondrian conformal prediction sobre particiones de riesgo crediticio (grades A–G) con datos out-of-time constituye una evidencia aplicada específica de esta configuración en crédito minorista. Los resultados demuestran que la cobertura global puede enmascarar subcobertura sistemática en los grades de mayor riesgo, y que Mondrian corrige esta deficiencia con un costo controlado en anchura de intervalo. La versión detallada de ese draft vive en el carril Paper 3, fuera del build core.

IFRS 9 con incertidumbre distribution-free. La integración de intervalos conformales en el pipeline completo de IFRS 9 — abarcando staging (SICR conformal), provisión (ECL por rango) y análisis de sensibilidad (sec-p2-intro) — es una contribución sin precedentes en la literatura identificada. El ancho del intervalo conformal como señal complementaria de deterioro crediticio y la cuantificación del rango de provisiones bajo incertidumbre responden directamente a las demandas regulatorias de mayor transparencia y prospectividad.

Calibración integrada en el pipeline conformal. El pipeline establece una secuencia rigurosa calibración -> conformal -> decisión que garantiza que los intervalos se construyen sobre probabilidades genuinas, no sobre scores arbitrarios. La selección automática entre Platt (Platt, 1999), isotónica (Zadrozny & Elkan, 2002) y Venn-Abers (Vovk & Petej, 2014) mediante validación temporal multi-métrica asegura que la calibración es óptima para cada run experimental.

27.2.2 Contribuciones técnicas

Las contribuciones técnicas reflejan la implementación del pipeline end-to-end y las decisiones de ingeniería que hacen posible la reproducibilidad y escalabilidad del sistema.

Pipeline completo CatBoost -> Calibración -> MAPIE -> Pyomo. La tesis implementa un pipeline operativo que conecta cuatro capas tecnológicas: un modelo de scoring (CatBoost con búsqueda de hiperparámetros vía Optuna), una capa de calibración probabilística (con selección automática de método), un generador de intervalos conformales (MAPIE 1.3.0 con SplitConformalRegressor y partición Mondrian), y un optimizador de portafolio (Pyomo con solver HiGHS (Huangfu & Hall, 2018)). Cada capa persiste sus artefactos de forma trazable, y el contrato de modelo (models/pd_model_contract.json) garantiza la coherencia de features a lo largo de todo el flujo.

Integración de SPO+. El pipeline incorpora una implementación de la pérdida SPO+ (Elmachtoub & Grigas, 2022) que permite comparar el paradigma predict-then-optimize conformal con decision-focused learning. La implementación utiliza un MLP punto-a-punto con costos calibrados de PD (no binarios), lo cual resolvió el problema del paisaje plano que impedía la convergencia en versiones anteriores. El artefacto local A19/Figura 15 muestra una reducción de regret del 49.09% frente al enfoque two-stage, con significancia estadística verificada vía test de Wilcoxon (p = 1.39e-164); el cierre curado PyEPO 1.3.7 reporta 48.51% bajo un protocolo pareado separado (p = 3.80e-163).

Infraestructura de champion search. El sistema de búsqueda de champion implementa cuatro modos de ejecución (smoke, canonical_rebuild, champion_search, insights_factory) con perfiles configurables en YAML, persistencia de resultados en models/champion_registry.json, y soporte para aceleracion GPU vía RAPIDS en los componentes de optimización y simulacion A/B.

27.2.3 Contribuciones operativas

Las contribuciones operativas demuestran que el pipeline no es solo un prototipo académico sino un sistema desplegable con gobernanza explícita.

Matriz corta de claims de tesis y su valor práctico
Contribución	Claim defendible
Calibración + conformal + robustez	El proyecto deja de decidir sobre un punto y pasa a decidir sobre un rango plausible
Survival + IFRS9	Misma PD puntual puede tener lecturas prudenciales distintas segun el tiempo
Causalidad + policy	No solo clasificamos riesgo; también preguntamos donde intervenir
Explainability + MRM	El modelo puede discutirse en lenguaje de negocio y control, no solo con métricas

Pipeline end-to-end reproducible. La tesis implementa un pipeline de 14 scripts orquestados secuencialmente, con artefactos congelados y persistidos en cada etapa. El Quarto book, el companion Streamlit reducido (5 labs) y los artefactos DVC forman un sistema de documentación integrado que permite a cualquier evaluador reproducir los resultados desde los datos crudos hasta las decisiones de portafolio.

Simulacion A/B retroactiva. El script scripts/simulate_ab_test.py implementa una simulacion retroactiva que compara la política robusta (conformal) contra la política no-robusta (puntual) sobre los mismos datos históricos, cuantificando la diferencia en retorno ajustado por riesgo. Esta simulacion proporciona evidencia causal contrafactual que refuerza los claims de superioridad de la política conformal.

Auditoría de fairness. El pipeline incluye una auditoría completa de paridad demográfica, igualdad de oportunidades e impacto disparejo sobre los grupos protegidos, lo cual anticipa las crecientes demandas regulatorias sobre equidad algorítmica en crédito.

Contribuciones operativas de la tesis
Aporte	Evidencia
Pipeline end-to-end reproducible	Libro + Streamlit + artefactos congelados
Gobernanza explícita	Fairness, MRM, champion registry
Companion interactivo	5 labs locales opcionales
Trazabilidad de notebooks	Inventario y manifests

27.2.4 Contribuciones regulatorias

Las contribuciones regulatorias conectan el pipeline con los marcos normativos que rigen la gestión de riesgo crediticio en instituciones financieras.

Señal SICR conformal. El ancho del intervalo conformal como señal complementaria de deterioro crediticio (sec-sicr-signal) responde directamente a las críticas del IFRS Board (IFRS Board, 2024) sobre la insuficiencia de los triggers actuales basados en DPD y umbrales estáticos de PD. El umbral óptimo $t^* = 0.30$ captura el 75.8% de defaults no detectados por triggers tradicionales, lo cual demuestra el valor añadido de la señal conformal.

ECL con bandas de incertidumbre. La producción de provisiones ECL por rango — donde cada préstamo y el portafolio agregado tienen una estimación puntual, un límite optimista y un límite adverso — proporciona la información que los equipos prudenciales necesitan para calibrar overlays y buffers de capital (sec-ecl-calculation). La banda ECL de $288.5M (267% de la estimación puntual de $107.9M) cuantifica la magnitud de incertidumbre que las prácticas actuales ignoran.

Sensibilidad multi-dimensional. El análisis de sensibilidad que combina nivel conformal, método de supervivencia y escenario macroeconomico (sec-sensitivity-stress) produce un mapa de provisiones que facilita la comunicación con supervisores y la definición de políticas prudenciales informadas.

Validación MRM conforme a SR 11-7. El reporte MRM generado por scripts/generate_mrm_report.py organiza la evidencia de validación del modelo siguiendo los lineamientos SR 11-7 de la Reserva Federal, lo cual demuestra que el pipeline conformal es compatible con los marcos de gobernanza existentes.

27.2.5 Contribuciones de defendibilidad

La tesis también aporta algo menos visible, pero crucial: una forma de documentar proyectos de riesgo donde claims, artefactos y narrativa permanecen alineados. Esa disciplina reduce la brecha entre:

investigación aplicada,
revisión de jurados,
y preparacion de papers.

27.2.6 Claim central

El claim más fuerte y sostenible del proyecto es:

en riesgo crediticio, la combinación de calibración, incertidumbre conformal y decisión robusta produce un sistema más defendible que un pipeline centrado solo en predicción puntual.

Ese claim se sostiene porque cada componente tiene evidencia propia y, además, porque la integración completa ya fue ejecutada y documentada. La calibración mejora la confiabilidad de las probabilidades predichas; los intervalos conformales cuantifican la incertidumbre con garantías formales; la optimización robusta traduce esa incertidumbre en decisiones más estables; y la trazabilidad completa permite auditar cada paso del proceso. Ningún componente por separado sería suficiente para sostener el claim; es la integración coherente de los cuatro la que constituye la contribución central de la tesis.

Procedencia: book/chapters/A-notebook-atlas.qmd

Este apéndice no inventaria procedencia de notebooks. Su función es otra: mostrar qué evidencia visual del proyecto sí merece quedar cristalizada en el libro y cómo conecta con decisiones reales de modelado, incertidumbre, provisión y negocio.

Cada entrada del atlas cumple la misma regla editorial: una figura entra aquí si ayuda a explicar mejor, demostrar mejor o conectar mejor con negocio. Si una imagen solo sirve para recordar de qué notebook salió, no pertenece al libro.

27.3 Evidencia visual reutilizable

El atlas no necesita un contenedor HTML vacío: la evidencia reutilizable queda anclada en las figuras que el libro ya promueve a los capítulos de resultados, conformal, portafolio, gobernanza y Dataset 360.

27.4 Inventario de notebooks y su relación con el libro

Mapeo de notebooks del proyecto a capítulos del libro
Notebook	Tema	Capítulos relacionados
`01_eda_lending_club.ipynb`	Exploración del dataset, distribuciones, defaults por grade	`sec-eda-highlights`, `sec-geographic-temporal`
`02_feature_engineering.ipynb`	WOE/IV, OptBinning, features derivadas	`sec-woe-iv`, `sec-derived-features`
`03_pd_modeling.ipynb`	LR baseline, CatBoost, HPO, calibración	`sec-lr-baseline`, `sec-catboost-tuned`, `sec-calibration-selection`
`04_conformal_prediction.ipynb`	Split conformal, Mondrian, variantes	`sec-split-conformal`, `sec-mondrian`, `sec-cqr-variants`
`05_time_series_forecasting.ipynb`	AutoARIMA, reconciliación jerárquica	`sec-time-series`
`06_survival_analysis.ipynb`	Cox PH, RSF, CIF	`sec-survival`
`07_causal_inference.ipynb`	DML, CATE, policy, simulación A/B	`sec-causal-inference`, `sec-ab-testing`
`08_portfolio_optimization.ipynb`	Formulación LP, robust, frontera	`sec-deterministic-portfolio`, `sec-robust-portfolio`
`09_end_to_end_pipeline.ipynb`	ECL, escenarios, SICR, sensibilidad	`sec-ecl-calculation`, `sec-scenario-analysis`
`13_model_explainability.ipynb`	SHAP global/local, ALE, drift	`sec-global-explanations`, `sec-local-explanations`

27.5 Regla editorial

Regla editorial CRPTO: toda afirmación cuantitativa debe apuntar a un artefacto versionado, un script generador o una tabla reproducible del dossier.

Procedencia: book/chapters/C-artifact-catalog.qmd

Este catálogo no pretende listar cada archivo generado en el proyecto. Su función editorial es más precisa: registrar los artefactos canónicos que sostienen claims del libro, del companion y de los papers.

27.6 Catálogo mínimo de artefactos críticos

El catálogo mínimo se mantiene como criterio editorial: solo entran artefactos que sostienen claims verificables del paper, del libro o del suplemento.

27.7 Regla de trazabilidad

Cada claim importante del libro debería poder seguir esta cadena:

\[ \text{claim} \rightarrow \text{artefacto} \rightarrow \text{script/config} \rightarrow \text{run tag} \]

Cuando esa cadena se rompe, el proyecto pierde defendibilidad. Por eso este catálogo no es un anexo ornamental: es una herramienta de auditoría narrativa.

27.8 Artefactos adicionales frecuentemente consultados

Artefactos canónicos adicionales del pipeline
Artefacto	Path	Uso principal
Contrato del modelo PD	`models/pd_model_contract.json`	Features canónicas, tipos, thresholds
Modelo champion	`models/pd_canonical.cbm`	CatBoost entrenado y congelado
Calibrador seleccionado	`models/pd_canonical_calibrator.pkl`	Platt/Isotonic/Venn-Abers promovido
Intervalos conformales	`data/processed/conformal_intervals_mondrian.parquet`	$[PD_{low}, PD_{high}]$ por préstamo
Backtesting mensual	`data/processed/conformal_backtest_monthly.parquet`	Cobertura temporal y alertas
Grid SICR conformal	`data/processed/sicr_conformal_grid.parquet`	Búsqueda de $t^*$ óptimo
Comparación BMA vs CP	`data/processed/bma_comparison.parquet`	Ancho, cobertura y min-grade
Portafolio champion	`data/processed/portfolio_allocations.parquet`	Asignación robusta final
Frontera de robustez	`data/processed/portfolio_robustness_frontier.parquet`	Pareto riesgo-retorno-robustez
Resumen del pipeline	`data/processed/pipeline_summary.json`	KPIs cross-módulo
Training record PD	`models/pd_training_record.pkl`	Historial completo de entrenamiento
Registro MRM	`reports/mrm/mrm_validation_report.json`	Reporte SR 11-7 consolidado

Procedencia: book/chapters/D-configuration-reference.qmd

El proyecto ya no depende de “parámetros escondidos en notebooks”. La capa configs/ concentra las decisiones declarativas que gobiernan modelado, conformal, fairness, optimización y perfiles de ejecución.

27.8.1 Configuraciones clave

Núcleo de configuración declarativa
Archivo	Función
`configs/pd_model.yaml`	Configuración base del modelo PD
`configs/conformal_policy.yaml`	Metas y thresholds de cobertura
`configs/fairness_policy.yaml`	Límites de fairness y política de evaluación
`configs/mrm_policy.yaml`	Reglas de gobernanza y validación
`configs/optimization.yaml`	Parámetros de portafolio robusto
`configs/time_series.yaml`	Forecasting y escenarios temporales

27.8.2 Perfiles de ejecución

La carpeta configs/profiles/ empaqueta modos de trabajo completos, por ejemplo:

canonical_operational.yaml
canonical_confirmatory_full.yaml
crpto_e2e_default.yaml
search_pd_default.yaml

Esta separación es valiosa porque desacopla:

la lógica del pipeline,
la política de validación,
el contexto de ejecución.

27.8.3 Convención recomendada

Una configuración útil en este proyecto debería responder tres preguntas sin ambigüedad:

qué método se está usando;
con qué thresholds o constraints;
bajo qué perfil narrativo u operacional corre.

27.8.4 Relación con el libro

Muchos capítulos del libro citan resultados ya consolidados. Este anexo recuerda que esos resultados no nacen de magia editorial: nacen de YAML y JSON concretos, versionados y trazables. Esa disciplina es parte central de la madurez técnica del proyecto.

Procedencia: book/chapters/F-rerun-v2-refactor.qmd

27.9 Rerun V2 y Refactorización

27.9.1 Qué cambió realmente

El rerun V2 no fue solo “correr de nuevo” el pipeline. Fue una refactorización metodológica y operativa cuyo objetivo era convertir el proyecto en algo más reproducible, más auditable y más honesto editorialmente. Los cambios más importantes fueron:

Producer canónico de features: el pipeline ya no depende de artefactos heredados o notebooks viejos para reconstruir train_fe, calibration_fe, test_fe, feature_config.pkl y woe_encoders.pkl.
Separación explícita entre champion y universo research: el manifest V2 distingue core CatBoost, core logístico, challenger-only y columnas metadata/target.
Hardening de runs largos: validación temprana de configs, checkpoints, runtime status y artefactos atómicos.
Calibración más defendible: Brier decomposition y Murphy diagram como evidencia persistida, no solo como narrativa.
Causal reubicado: deja de venderse como parte promotable del pipeline champion y pasa a ser un lane research-grade de intervención/pricing.
Bundle trazable: el champion bundle ahora puede mostrar explícitamente cuando consume artefactos de run tags mezclados.

27.9.2 Estado del contrato V2


import sys
from pathlib import Path

sys.path.insert(0, str(Path.cwd().parent if Path.cwd().name == "book" else Path.cwd()))
from book._helpers.load_artifacts import try_load_json, try_load_parquet

import pandas as pd

manifest = try_load_parquet("feature_manifest_v2")
contract = try_load_json("pd_model_contract", directory="models", default={})

rows = [
    {"Elemento": "Columnas en splits FE canónicos", "Valor": int(len(manifest)) if not manifest.empty else None, "Lectura": "Universo auditable completo de features y metadata."},
    {"Elemento": "Features champion CatBoost", "Valor": int(manifest["is_core_catboost"].sum()) if not manifest.empty else contract.get("n_features"), "Lectura": "Contrato oficial del champion."},
    {"Elemento": "Features baseline logístico", "Valor": int(manifest["is_core_logreg"].sum()) if not manifest.empty else None, "Lectura": "Baseline lineal más ancho que el champion tabular."},
    {"Elemento": "Features challenger-only", "Valor": int(manifest["is_challenger_only"].sum()) if not manifest.empty else None, "Lectura": "Espacio de búsqueda research sin contaminar el contrato champion."},
    {"Elemento": "Shapes FE (train/cal/test)", "Valor": str(contract.get("split_shapes", {})), "Lectura": "Todos los splits comparten el mismo universo de columnas antes de congelar subsets."},
]

pd.DataFrame(rows)

La mejora conceptual aquí es importante: el champion ya no se confunde con el dataframe FE completo. El champion es un subset congelado, no el universo total de columnas disponibles.

27.9.3 Qué aportó la refactorización

La refactorización sí tuvo valor real en cinco frentes:

Reproducibilidad: ahora existe una cadena canónica desde splits temporales hasta artefactos de libro.
Gobernanza: quedó visible qué se usa en champion, qué se deja en challenger y qué se excluye por sparsity o por rol editorial.
Resumibilidad: los runs largos ya no dependen de “que no se caiga la máquina”; hay runtime statuses y checkpoints.
Narrativa honesta: Quarto puede leer artefactos reales en vez de sostener claims congelados.
Recuperación conformal: el rerun V2 dejó visible que el problema no era “MAPIE no sirve”, sino que el canónico estaba demasiado conservador y además el shrinkback deshacía parte del ajuste útil por grupo. La segunda vuelta conformal posterior recuperó el gate operativo.


import sys
from pathlib import Path

sys.path.insert(0, str(Path.cwd().parent if Path.cwd().name == "book" else Path.cwd()))
from book._helpers.load_artifacts import try_load_json

import pandas as pd

conformal = try_load_json("conformal_policy_status", directory="models", default={})

rows = [
    {"Indicador": "gate_overall_pass", "Valor": conformal.get("gate_overall_pass", conformal.get("overall_pass")), "Lectura": "El gate conformal material cierra operativamente."},
    {"Indicador": "overall_pass", "Valor": conformal.get("overall_pass"), "Lectura": "La policy conformal queda aprobada."},
    {"Indicador": "diagnostic_checks", "Valor": f"{conformal.get('diagnostic_checks_passed', 0)}/{conformal.get('diagnostic_checks_total', 4)}", "Lectura": "Los p-values quedan como diagnóstico no-gatable."},
    {"Indicador": "coverage_90", "Valor": conformal.get("coverage_90"), "Lectura": "Cobertura prudente dentro de materialidad."},
    {"Indicador": "avg_width_90", "Valor": conformal.get("avg_width_90"), "Lectura": "Ancho ya por debajo del máximo 0.80."},
    {"Indicador": "warning_alerts", "Valor": conformal.get("warning_alerts"), "Lectura": "Persisten solo 2 warnings mensuales concentrados."},
]

pd.DataFrame(rows)

27.9.4 Monotonic constraints: qué sirvieron y qué no

Las restricciones monotónicas sí dejaron algo valioso, pero la lectura final del proyecto cambió respecto al momento del rerun V2. Primero consolidaron:

un spec monotónico auditable;
el resolver canónico hacia el orden CatBoost;
un challenger promotion report con guardrails explícitos.


import sys
from pathlib import Path

sys.path.insert(0, str(Path.cwd().parent if Path.cwd().name == "book" else Path.cwd()))
from book._helpers.load_artifacts import try_load_json

import pandas as pd

promotion = try_load_json("challenger_promotion_report", directory="models", default={})
deltas = promotion.get("deltas", {})
checks = promotion.get("promotion_checks", {})

rows = [
    {"Chequeo": "challenger_promotable", "Valor": promotion.get("challenger_promotable"), "Lectura": "Resultado final del challenger monotónico."},
    {"Chequeo": "auc_drop", "Valor": deltas.get("auc_drop"), "Lectura": "Costo en ranking frente al champion."},
    {"Chequeo": "brier_increase_pct", "Valor": deltas.get("brier_increase_pct"), "Lectura": "Costo en calidad probabilística."},
    {"Chequeo": "ece_delta", "Valor": deltas.get("ece_delta"), "Lectura": "Costo en calibración."},
    {"Chequeo": "fairness_ok", "Valor": checks.get("fairness_ok"), "Lectura": "No rompe fairness."},
    {"Chequeo": "predictive_drift_ok", "Valor": checks.get("predictive_drift_ok"), "Lectura": "No pasó el guardrail predictivo/drift."},
]

pd.DataFrame(rows)

Esa fue la lectura intermedia. La lectura final del proyecto es más fuerte: después de corregir la semántica de fairness para que la búsqueda del challenger y la auditoría oficial midieran lo mismo, el carril monotónico sí terminó promoviéndose al champion vigente. Lo que convirtió a monotonicidad en champion no fue una sola métrica aislada, sino la combinación de:

no regresión operativa en AUC/Brier bajo la comparación oficial;
cierre de fairness sobre approval;
y evidencia posterior a la promoción: monotonicity_audit_status.json queda en PASS con cero disrupciones entre bandas y cero violaciones en las features monotónicas activas.

La lección útil del rerun V2 no es entonces “la monotonicidad no funcionó”, sino algo más interesante: el rerun dejó la infraestructura y el lenguaje de promoción listos, y el cierre final llegó cuando la semántica de fairness quedó alineada con la decisión real.

27.9.5 Por qué causal antes se narraba más “end-to-end”

Durante buena parte del proyecto sí tenía sentido contar causalidad como parte del pipeline end-to-end, pero en un sentido amplio: el carril causal tenía estimación, policy simulation, backtest y una integración tentativa con portafolio. En ese momento el valor del bloque era explorar si una capa de intervención podía convivir con el stack predictivo.

El rerun V2 cambió esa lectura por dos razones:

el proyecto ya tiene guardrails mejores y más explícitos;
una vez esos guardrails existen, el lane causal no pasa sensibilidad, aunque sí pase overlap y aunque la policy luzca económicamente interesante.


import sys
from pathlib import Path

sys.path.insert(0, str(Path.cwd().parent if Path.cwd().name == "book" else Path.cwd()))
from book._helpers.load_artifacts import try_load_json

import pandas as pd

effect = try_load_json("causal_effect_status", directory="models", default={})
sensitivity = try_load_json("causal_sensitivity_status", directory="models", default={})
policy = try_load_json("causal_policy_rule", directory="models", default={})
oot = try_load_json("causal_policy_oot_status", directory="models", default={})
portfolio_state = "no importado al paquete CRPTO"

rows = [
    {"Métrica": "ATE oficial", "Valor": effect.get("ate"), "Lectura": "Señal causal media positiva bajo LinearDML."},
    {"Métrica": "Overlap pass", "Valor": effect.get("overlap_pass"), "Lectura": "El soporte de tratamiento es suficiente."},
    {"Métrica": "Sensitivity pass", "Valor": sensitivity.get("sensitivity_pass"), "Lectura": "Este es el bloqueo real."},
    {"Métrica": "Robustness value", "Valor": sensitivity.get("robustness_value"), "Lectura": "Queda por debajo del umbral de promoción."},
    {"Métrica": "Policy rule", "Valor": policy.get("selected_rule"), "Lectura": "La mejor regla discreta sigue siendo research-grade."},
    {"Métrica": "OOT total net value", "Valor": oot.get("total_net_value"), "Lectura": "La policy es económicamente prometedora, pero no suficiente."},
    {"Métrica": "CATE portfolio state", "Valor": portfolio_state, "Lectura": "El optimizador causal queda bloqueado por policy gate y no entra al champion."},
]

pd.DataFrame(rows)

Entonces, la respuesta correcta es:

sí tuvo sentido narrarlo como parte del pipeline end-to-end durante la fase exploratoria;
no corresponde seguir narrándolo así en la versión oficial del libro, porque hoy ya sabemos que no forma parte del champion pipeline.

No fue un error histórico grave: fue una hipótesis de integración razonable que el proyecto terminó falsando de forma útil.

27.9.6 Qué más amerita ampliar búsqueda

Después del rerun y de la recuperación conformal, la frontera principal que sigue justificando nueva búsqueda es causal. Conformal ya no está bloqueado; lo que queda allí es una mejora incremental de eficiencia, no una deuda estructural del pipeline.

Sí amerita exploración adicional:

Causal: si y solo si la búsqueda se enfoca en robustez/sensibilidad, no en “forzar” otro rerun full.
Conformal: solo como optimización fina para reducir sobre-cobertura manteniendo el gate actual en PASS.
Calibración slice-aware / PD validation: porque la nueva lectura por cohortes ya mostró que el siguiente cuello de botella no es AUC sino persistencia de desviaciones por quarter y grade.
IFRS9 temporal defensibility: porque la capa diagnóstica nueva muestra anchura de incertidumbre macro alta y estabilidad temporal insuficiente.

Solo amerita búsqueda secundaria:

Monotonic challengers adicionales: ya no como sustituto urgente del champion, sino como carril de refinamiento estructural si aparece una mejora clara sin romper el hardening actual.
Time-series intervals: si se quiere mejorar la narrativa IFRS9 de incertidumbre macro, pero no parece la mayor fuente de upside inmediato.

No amerita ampliar búsqueda de forma prioritaria:

PD champion base;
survival core;
LGD/EAD base;
portfolio champion robusto.

La lectura general post-rerun es que el proyecto ya no necesita “buscar en todas partes”, sino cerrar bien la frontera causal y, si compensa el costo marginal, afinar la eficiencia conformal sin reabrir la arquitectura.

Angelopoulos, A. N., & Bates, S. (2023). Conformal Prediction: A Gentle Introduction. Foundations and Trends in Machine Learning, 16(4), 494-591. https://doi.org/10.1561/2200000101

Angelopoulos, A. N., Bates, S., Candès, E. J., Jordan, M. I., & Lei, L. (2025). Learn then Test: Calibrating Predictive Algorithms to Achieve Risk Control. The Annals of Applied Statistics. https://doi.org/10.1214/24-AOAS1998

Angelopoulos, A. N., Bates, S., Fisch, A., Lei, L., & Schuster, T. (2024). Conformal Risk Control. ICLR 2024. https://openreview.net/forum?id=33XGfHLtZg

Athey, S., & Wager, S. (2019). Estimating Treatment Effects with Causal Forests: An Application. Annals of Statistics. https://doi.org/10.1214/18-AOS1709

Ayari, H., Guetari, R., & Kraı̈em, N. (2026). Machine learning powered financial credit scoring: A systematic literature review. Artificial Intelligence Review, 59(1), 13. https://doi.org/10.1007/s10462-025-11416-2

Babaei, G., & Bamdad, S. (2020). A Multi-Objective Instance-Based Decision Support System for Investment Recommendation in Peer-to-Peer Lending. Expert Systems with Applications, 150, 113278. https://doi.org/10.1016/j.eswa.2020.113278

Bairaktari, K., Wu, J., & Wu, S. (2025). Kandinsky Conformal Prediction: Beyond Class- and Covariate-Conditional Coverage. Proceedings of the 42nd International Conference on Machine Learning, Proceedings of Machine Learning Research, 267, 2581-2602. https://proceedings.mlr.press/v267/bairaktari25a.html

Bao, Y., Hu, Y., Ren, H., Zhao, P., & Zou, C. (2025). Optimal Model Selection for Conformalized Robust Optimization (CROMS). arXiv preprint arXiv:2507.04716. https://arxiv.org/abs/2507.04716

Bates, S., Angelopoulos, A. N., Lei, L., Malik, J., & Jordan, M. I. (2021). Distribution-Free, Risk-Controlling Prediction Sets. Journal of the ACM, 68(6), 43:1-43:34. https://doi.org/10.1145/3478535

Bertsimas, D., & Sim, M. (2004). The Price of Robustness. Operations Research. https://doi.org/10.1287/opre.1030.0065

Boström, H., Johansson, U., & Löfström, T. (2021). Mondrian Conformal Predictive Distributions. Proceedings of the Tenth Symposium on Conformal and Probabilistic Prediction and Applications, Proceedings of Machine Learning Research, 152, 24-38. https://proceedings.mlr.press/v152/bostrom21a.html

Botha, M., & Verster, T. (2026). Approaches for modelling term-structure of default risk under IFRS 9. International Journal of Data Science and Analytics. https://arxiv.org/abs/2501.04975

Causal Inference for Banking, Finance, and Insurance: A Survey. (2023). https://arxiv.org/abs/2307.16427

Chan, T. C. Y., Delage, E., & Lin, B. (2024). Conformal Inverse Optimization. NeurIPS 2024. https://arxiv.org/abs/2402.01489

Chen, C. (2024). Practical Credit Risk and Capital Modeling, and Validation: CECL, Basel Capital, CCAR, and Credit Scoring with Examples. Springer Cham. https://doi.org/10.1007/978-3-031-52542-1

Chenreddy, A. R., & Delage, E. (2024). End-to-End Conditional Robust Optimization. Proceedings of the Fortieth Conference on Uncertainty in Artificial Intelligence, Proceedings of Machine Learning Research, 244, 736-748. https://arxiv.org/abs/2403.04670

Chernozhukov, V., Chetverikov, D., Demirer, M., Duflo, E., Hansen, C., Newey, W., & Robins, J. (2018). Double/Debiased Machine Learning for Treatment and Structural Parameters. The Econometrics Journal, 21(1), C1-C68. https://doi.org/10.1111/ectj.12097

Chi, G., Ding, S., & Peng, X. (2019). Data-Driven Robust Credit Portfolio Optimization for Investment Decisions in P2P Lending. Mathematical Problems in Engineering, 2019, 1902970. https://doi.org/10.1155/2019/1902970

Defining and comparing SICR-events under IFRS 9. (2025). Annals of Operations Research.

Ding, T., Angelopoulos, A. N., Bates, S., Jordan, M. I., & Tibshirani, R. J. (2023). Class-Conditional Conformal Prediction with Many Classes. Advances in Neural Information Processing Systems, 36, 64555-64576. https://arxiv.org/abs/2306.09335

Donti, P. L., Amos, B., & Kolter, J. Z. (2017). Task-based End-to-end Model Learning in Stochastic Optimization. NeurIPS. https://arxiv.org/abs/1703.04529

Elmachtoub, A. N., & Grigas, P. (2022). Smart «Predict, then Optimize». Management Science, 68(1). https://doi.org/10.1287/mnsc.2020.3922

European Central Bank. (2024). IFRS 9 overlays and model improvements for novel risks. ECB Banking Supervision.

Fantazzini, D. (2024). Adaptive Conformal Inference for Computing Market Risk Measures. Journal of Risk and Financial Management.

Gibbs, I., Cherian, J. J., & Candès, E. J. (2025). Conformal Prediction With Conditional Guarantees. Journal of the Royal Statistical Society Series B: Statistical Methodology, 87(4), 1100-1126. https://doi.org/10.1093/jrsssb/qkaf008

Guo, Y., Zhou, W., Luo, C., Liu, C., & Xiong, H. (2016). Instance-Based Credit Risk Assessment for Investment Decisions in P2P Lending. European Journal of Operational Research, 249(2), 417-426. https://doi.org/10.1016/j.ejor.2015.05.050

Huangfu, Q., & Hall, J. A. J. (2018). Parallelizing the dual revised simplex method. Mathematical Programming Computation, 10(1), 119-142. https://doi.org/10.1007/s12532-017-0130-5

IFRS Board. (2024). SICR Feedback Analysis. IFRS Foundation.

Iutzeler, F., & Mazoyer, C. (2025). Risk-controlling Prediction with Distributionally Robust Optimization. Transactions on Machine Learning Research.

Johnstone, C., & Cox, B. (2021). Conformal Uncertainty Sets for Robust Optimization. COPA (PMLR v152). https://proceedings.mlr.press/v152/johnstone21a.html

Kato, M. (2025). Conformal Predictive Portfolio Selection. https://arxiv.org/abs/2410.16333

Kawasumi, A., Kato, M., & Duan, L. (2026). Conformal Prediction for Ordinal Credit Scoring (SIG-FIN Technical Report Nos. 036-20). Japanese Society for Artificial Intelligence, Special Interest Group on Financial Informatics. https://doi.org/10.11517/jsaisigtwo.2026.FIN-036_128

Kiyani, S., Pappas, G. J., Roth, A., & Hassani, H. (2025). Decision Theoretic Foundations for Conformal Prediction: Optimal Uncertainty Quantification for Risk-Averse Agents. Proceedings of the 42nd International Conference on Machine Learning, Proceedings of Machine Learning Research, 267, 30943-30965. https://proceedings.mlr.press/v267/kiyani25a.html

Lessmann, S., Baesens, B., Seow, H.-V., & Thomas, L. C. (2015). Benchmarking state-of-the-art classification algorithms for credit scoring: An update of research. European Journal of Operational Research, 247(1), 124-136. https://doi.org/10.1016/j.ejor.2015.05.030

Liu, T., Dobriban, E., & Orabona, F. (2026). Online Conformal Prediction via Universal Portfolio Algorithms. arXiv preprint arXiv:2602.03168. https://arxiv.org/abs/2602.03168

Mandi, J., Kotary, J., Berden, S., Mulamba, M., Bucarey, V., Guns, T., & Fioretto, F. (2024). Decision-Focused Learning: Foundations, State of the Art, Benchmark and Future Opportunities. Journal of Artificial Intelligence Research, 81, 1623-1701. https://doi.org/10.1613/jair.1.15320

Noguer i Alonso, M. (2024a). Conformal Portfolio Optimization. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5011129

Noguer i Alonso, M. (2024b). Conformal Prediction in Finance. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4939336

Papadopoulos, H., Proedrou, K., Vovk, V., & Gammerman, A. (2002). Inductive Confidence Machines for Regression. En Machine Learning: ECML 2002 (Vol. 2430, pp. 345-356). Springer. https://doi.org/10.1007/3-540-36755-1_29

Patel, N., Rayan, O., & Tewari, A. (2024). Conformal Contextual Robust Optimization. AISTATS (PMLR v238). https://arxiv.org/abs/2310.10003

Plassier, V., Fishkov, A., Guizani, M., Panov, M., & Moulines, E. (2025). Probabilistic Conformal Prediction with Approximate Conditional Validity. ICLR 2025. https://openreview.net/forum?id=Nfd7z9d6Bb

Platt, J. C. (1999). Probabilistic Outputs for Support Vector Machines. En Advances in Large Margin Classifiers. MIT Press.

Romano, Y., Patterson, E., & Candès, E. J. (2019). Conformalized Quantile Regression. Advances in Neural Information Processing Systems (NeurIPS). https://arxiv.org/abs/1905.03222

Saavedra, C. A. P. B., Fachini-Gomes, J. B., Gomes, E. M. de C., & Kimura, H. (2024). Probability of default for lifetime credit loss for IFRS 9 using machine learning competing risks survival analysis models. Expert Systems with Applications, 249, 123607. https://doi.org/10.1016/j.eswa.2024.123607

Sun, C., Liu, L., & Li, X. (2024). Predict-then-Calibrate: A New Perspective of Robust Contextual LP. arXiv preprint arXiv:2305.15686. https://arxiv.org/abs/2305.15686

Torkian, V., Bamdad, S., & Sarfaraz, A. H. (2026). Integrating AI and OR for Investment Decision-Making in Emerging Digital Lending Businesses: A Risk-Return Multi-Objective Optimization Approach. Journal of the Operational Research Society, 77(3), 716-735. https://doi.org/10.1080/01605682.2025.2498652

Vovk, V., Gammerman, A., & Shafer, G. (2005). Algorithmic Learning in a Random World. Springer. https://doi.org/10.1007/978-3-031-06649-8

Vovk, V., & Petej, I. (2014). Venn-Abers Predictors. UAI. https://arxiv.org/abs/1211.0025

Yeh, C., Christianson, N., Wierman, A., & Yue, Y. (2025). Conformal Risk Training: End-to-End Optimization of Conformal Risk Control. NeurIPS 2025. https://arxiv.org/abs/2510.08748

Yeh, C., Christianson, N., Wu, A., Wierman, A., & Yue, Y. (2025). End-to-End Conformal Calibration for Optimization Under Uncertainty. Transactions on Machine Learning Research. https://arxiv.org/abs/2409.20534

Zadrozny, B., & Elkan, C. (2002). Transforming classifier scores into accurate multiclass probability estimates. KDD. https://doi.org/10.1145/775047.775151

Zhao, L., Jiang, H., & Qi, W. (2026). Conformal Robust Optimization and Satisficing for Prescriptive Analytics with Black-Box Predictors. SSRN Electronic Journal. https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5338354

Zhou, X., Chen, B., Gui, Y., & Cheng, L. (2025). Conformal Prediction: A Data Perspective. ACM Computing Surveys. https://doi.org/10.1145/3736575

Zhou, Y., & Sesia, M. (2024). Conformal Classification with Equalized Coverage for Adaptively Selected Groups. NeurIPS 2024. https://arxiv.org/abs/2405.15106