7 Blueprint del Manuscrito
7.1 Blueprint Journal-Ready
Esta pagina traduce el dossier largo del libro en una arquitectura de paper. No reemplaza las secciones metodologicas previas: las comprime en una forma que pueda convertirse despues en manuscrito para Management Science, Operations Research o European Journal of Operational Research. La regla editorial es mantener una tesis clara: CRPTO no compite por ganar AUC; compite por convertir incertidumbre conformal en una decision de portafolio auditable.
7.1.1 Venue objetivo
La decision editorial activa es escribir primero para INFORMS Journal on Data Science (IJDS) y mantener European Journal of Operational Research (EJOR) como pivote principal. Esta decision queda versionada en configs/crpto_publication_targets.yaml y desarrollada en docs/research/crpto_publication_strategy_2026-05-12.md.
El proyecto ya tiene suficiente evidencia para apuntar a un journal serio, pero el enfasis cambia segun el venue:
| Venue | Enfasis requerido | Que ya tenemos | Que conviene reforzar |
|---|---|---|---|
| INFORMS Journal on Data Science | data science reproducible para decisiones | DVC/DagsHub/MLflow, Quarto companion, pipeline PD -> CP -> LP, tablas/figuras reproducibles | manuscrito anonimo de 25 paginas + online supplement |
| EJOR | metodologia OR y practica de decision | robust optimization, region 45/45, sensibilidad, stress tests |
lenguaje OR mas fuerte y menos pipeline narrativo |
| INFORMS Journal on Optimization | contribucion de optimizacion | bound, LP robusto, satisficing diagnostics | prueba/algoritmo mas fuerte o dependencia-aware theorem |
| Management Science | managerial insight y valor economico | champion economico, governance, auditabilidad | insight gerencial mas generalizable |
| Operations Research | formulacion OR amplia y concisa | relacion CP -> RO, garantia Markov, region robusta | contribucion teorica/OR mas fuerte que el caso Lending Club |
El primer borrador debe escribirse como paper IJDS: cuerpo anonimo, conceptualmente limitado a 25 paginas, con appendix online separado. Si en revision interna sentimos que la historia queda mas OR que data science, se reorienta a EJOR sin cambiar champion ni artefactos.
Los esqueletos activos son paper/CRPTO_ijds.qmd y paper/supplement_ijds.qmd. El archivo paper/CRPTO.qmd queda como entrada generica, no como formato final.
7.1.2 Abstract operativo
Un abstract posible, todavia largo para paper, seria:
We study credit portfolio selection when default probabilities are calibrated but decision uncertainty remains material. We propose Conformal Robust Predict-then-Optimize (CRPTO), a post-hoc auditable framework that maps Mondrian conformal prediction intervals into robust portfolio constraints. On a 276,869-loan out-of-time Lending Club evaluation, the final economic policy earns
$170.5Kon a$1Mbudget while passing the exactalpha=0.01funded-set bound (V=0.03645,Gamma_CP=0.18591, zero violation). The full promoted robust region contains45/45alpha01-safe policies, suggesting the result is not a single-point artifact. The contribution is not higher AUC, but a reproducible bridge from calibrated probabilistic learning to auditable robust credit decisions.
Este abstract ya contiene la diferencia central: el valor esta en la decision robusta verificable, no en otro leaderboard predictivo.
7.1.3 Claims numerados del paper
| Claim | Formulacion para paper | Estatus | Evidencia primaria |
|---|---|---|---|
| C1 | La base PD calibrada es suficientemente estable para alimentar incertidumbre conformal. | Empirico | AUC 0.7124, Brier 0.1546, ECE 0.0064, tests de calibracion |
| C2 | La capa conformal Mondrian produce cobertura util y trazable para decision. | Empirico-conformal | coverage 90 92.97%, min group coverage 91.90%, Winkler 1.111 |
| C3 | El intervalo conformal se puede mapear a un conjunto de incertidumbre usado por un LP robusto. | Metodologico | definiciones u_i(alpha), Gamma_CP, policy modes |
| C4 | El bound controla no-cobertura ponderada del funded set bajo supuestos distribution-free. | Teorico | thm-conformal-feasibility, Markov, V <= sqrt(alpha) |
| C5 | La policy oficial es economic champion, no theorem-tight. | Empirico-editorial | final_project_promotion.json, retorno $170.5K, alpha01_exact_pass=true |
| C6 | La region robusta final es completa, no un punto aislado. | Empirico | 45/45 policies pass en el OOT completo 276k |
| C7 | La evidencia CRPTO y journal-package muestra robustez adicional sin cambiar la direccion del paper. | Robustez | A3–A21, Figuras 12–15 |
La secuencia C1–C7 tambien evita una tentacion peligrosa: contar la historia como si el champion apareciera por magia al final. El paper debe mostrar que el sistema aprendio a mover el cuello de botella desde prediccion, hacia incertidumbre, hacia composicion del funded set.
7.1.4 Estructura del manuscrito
| Seccion | Papel en el manuscrito | Material fuente |
|---|---|---|
| 1. Introduction | gap, pregunta, contribuciones C1–C7 | 14a, 14f, esta pagina |
| 2. Related work | CP/CRC/RCPS, RO, Predict-then-Calibrate, DFL/SPO+ | 14a, 14f, referencias [1]–[17] |
| 3. Method | PD calibrada -> CP Mondrian -> uncertainty set -> LP robusto | 14b, 14c |
| 4. Theory | Gamma_CP, V, Markov, tightening condicional como appendix |
14b, appendix condicional |
| 5. Experimental design | Lending Club OOT, artifacts, compatible leaderboards | 14c, docs de sincronizacion |
| 6. Results | champion, region robusta, comparadores, SPO+ y alpha frontier | 14d |
| 7. Robustness | nested/temporal holdout, funded set, shift, tail risk | 14d, 14h, A3–A21 |
| 8. Discussion | limitaciones, governance, future work sin overclaim | 14e |
| Appendix | pruebas, tablas A3–A21, reproducibility checklist | 14b, 14h |
7.1.5 Figuras y tablas finales
El libro puede guardar mas material que el paper. Para el manuscrito, la seleccion sugerida es:
| Elemento | Ubicacion probable | Razon | Artefacto |
|---|---|---|---|
| Figura 1: pipeline CRPTO | cuerpo | explica el aporte en una sola vista | crpto_fig12_crpto_conceptual_pipeline.png |
Figura 2: alpha -> Gamma_CP -> funded set |
teoria/metodo | une parametro conformal y decision | crpto_fig13_alpha_gamma_funded_set.png |
Figura 3: region robusta 45/45 |
resultados | muestra que el champion no es aislado | crpto_fig14_robust_region_heatmap.png |
| Tabla 1: metricas core | resultados | fija PD, CP y portfolio sin mezclar familias | crpto_table0_key_metrics.csv |
| Tabla 2: champion y comparadores | resultados | economic vs theorem-tight vs balanced | crpto_table1_champion_policy.csv y A13 |
| Tabla 3: robustez P1 | appendix corto | post-seleccion, temporal, selector, shift | A3–A11 |
| Tabla 4: robustness journal | appendix largo | tail risk, bootstrap, dependencia, LGD/caps, regret-auditability | A12–A21 |
El paper no necesita mostrar todas las tablas en el cuerpo. El cuerpo debe proteger tres mensajes: la metodologia, el champion oficial y la region robusta. El appendix puede cargar la evidencia de stress y trazabilidad.
7.1.6 Mapa claim -> artifact -> test -> paper location
| Claim | Artifact canonico | Test/guardrail | Donde va |
|---|---|---|---|
| C1 | reports/dvc/metrics_summary.json, data/processed/pipeline_summary.json |
doc guardrails de baseline operacional | resultados, Tabla 1 |
| C2 | conformal_upstream.winner_metrics, alpha_sweep_pareto_mondrian.parquet |
tests de CRPTO y guardrails conformales | metodo/resultados |
| C3 | scripts/run_portfolio_bound_aware_search.py, champion_portfolio_policy.json |
consistency tests de champion | metodo |
| C4 | scripts/validate_alpha_gamma_bound.py, bound eval 276k |
test_crpto_champion_artifacts_agree |
teoria y appendix |
| C5 | models/final_project_promotion.json |
test_crpto_champion_artifacts_agree |
resultados |
| C6 | portfolio_bound_aware_shortlist.parquet, A18 |
journal package guardrail | resultados/appendix |
| C7 | A3–A21, status P1 y journal package | P1 evidence tests | robustness |
7.1.7 Notacion unica
| Simbolo | Significado | Donde se usa | Regla editorial |
|---|---|---|---|
Y_i |
default observado o target acotado evaluado | bound, exact eval | no llamarlo PD latente sin supuesto adicional |
p_hat_i |
PD puntual calibrada | PD, CP, LP | viene de CatBoost + Venn-Abers |
u_i(alpha) |
cota superior conformal | uncertainty set | entrada prudente del optimizador |
x_i |
decision o fraccion de asignacion | LP | puede ser continua en el solver operativo |
a_i |
monto del prestamo | presupuesto | normaliza exposicion |
w_i |
peso de portafolio financiado | bound | w_i = x_i a_i / sum_j x_j a_j |
tau |
techo de riesgo ponderado | LP robusto | se reporta como risk_tolerance |
Gamma_CP |
prima conformal ponderada | teoria/resultados | no mezclar con gamma del solver |
gamma |
parametro de policy del robust LP | search de portafolio | se reporta junto con risk_tolerance |
V |
no-cobertura ponderada del funded set | exact eval | cantidad principal del bound empirico |
La distincion mas delicada es Gamma_CP vs gamma. Gamma_CP es una metrica inducida por los intervalos y pesos del funded set; gamma es un parametro de la policy robusta. En el texto final deben aparecer juntos solo cuando se explique como una policy con cierto gamma genera cierto Gamma_CP.
7.1.9 Contribuciones redactadas para introduccion
Una version fuerte y honesta de las contribuciones seria:
- Proponemos CRPTO, un framework post-hoc que conecta PD calibrada, intervalos conformales Mondrian y optimizacion robusta de portafolio.
- Derivamos un bound distribution-free sobre no-cobertura ponderada del funded set y separamos explicitamente el tightening condicional de la garantia principal.
- Mostramos que el enfoque produce una policy economica promovida con retorno
$170.5K,V=0.03645,Gamma_CP=0.18591, cero violacion y pass exacto aalpha=0.01. - Documentamos que la region final completa pasa el bound (
45/45policies), por lo que el resultado no depende de un unico punto elegido despues de ver los datos. - Entregamos trazabilidad reproducible desde artefactos DVC/MLflow/DagsHub hasta tablas de paper, funded set loan-level y guardrails documentales.
Lo que no decimos: que CRPTO domina SPO+ en regret, que Markov es una cota apretada en todos los regimenes o que A6/A11 equivalen a validacion externa. Esa cautela es una fortaleza, no una debilidad.
7.1.10 Checklist de aceptacion del borrador
Antes de convertir esto en paper .tex o .qmd independiente, el borrador debe pasar este checklist:
- El champion oficial es siempre
bound_aware_276k_economic_champion. - El retorno oficial sale de
final_project_promotion.json, no de tablas diagnosticas repriced. theorem-tightaparece como comparador, nunca como champion.Y_ise define como target observado/acotado; PD latente queda como lectura adicional bajo supuesto.- Las familias de metricas no se mezclan en un solo leaderboard.
- Las tablas A12–A21 se presentan como robustness/journal package, no como una nueva busqueda de champion.
- El related work incluye CP/CRC/RCPS, RO, Predict-then-Calibrate, DFL, CROMS, MDCP, online CP y conformal risk training.
- El appendix contiene los comandos exactos para regenerar tablas, renderizar Quarto y correr guardrails.