Del riesgo sistémico a la decisión bajo incertidumbre (Algorithms for Decision Making)

 

El paralelismo central: del riesgo sistémico a la decisión bajo incertidumbre

Diagnóstico 

No estamos ante shocks aislados, sino ante deriva de riesgo en un entorno incierto, adversarial y dinámico.

Es el problema canónico que aborda Algorithms for Decision Making:

  • estados inciertos,

  • información incompleta,

  • agentes estratégicos,

  • recompensas diferidas,

  • necesidad de políticas robustas, no óptimas “en papel”.

👉 La geopolítica actual es un problema algorítmico mal resuelto.


2. Estados, acciones y recompensas: Europa como agente decisor

En este marco, Europa puede modelarse como un agente racional limitado, no omnisciente, que decide en un entorno hostil.

Estados (S)

Ejemplos de estados relevantes:

  • grado de fragmentación del orden internacional,

  • dependencia industrial (China / EEUU),

  • nivel de coerción económica,

  • salud institucional multilateral,

  • estabilidad de cadenas críticas.

Estos estados no son observables perfectamente → entorno parcialmente observable.


Acciones (A)

Europa puede elegir, por ejemplo:

  • no actuar (absorción pasiva),

  • defensa selectiva (aranceles, ayudas puntuales),

  • respuesta sistémica (política industrial + capacidad ejecutiva),

  • alineamiento con un “comité” externo,

  • construcción de instituciones propias.


Recompensas (R)

Aportación clave frente al debate político habitual:

  • la “recompensa” no es crecimiento a corto plazo,

  • sino viabilidad sistémica, resiliencia y margen estratégico a medio plazo.

👉 Esto encaja con la idea de utilidad a largo horizonte del libro.


3. Procesos de Decisión de Markov (MDP): por qué Europa no puede ser miope

El análisis RMS  muestra que, en un MDP, una política que maximiza beneficios inmediatos puede ser subóptima o destructiva a largo plazo.

Traducción directa al análisis:

Política europeaLectura MDP
No actuar porque “sale caro”Maximiza recompensa inmediata
Evitar conflicto hoyDescuenta excesivamente el futuro
No invertir en institucionesIgnora estados futuros adversos

👉 Europa ha estado usando un factor de descuento excesivo (β muy bajo):valora demasiado el presente y muy poco la supervivencia futura.


4. POMDP: por qué la incertidumbre actual es estructural

El entorno actual no es solo Markoviano, es parcialmente observable:

  • no conocemos las verdaderas intenciones de EEUU, China o Rusia,

  • las reglas cambian,

  • las instituciones pueden fallar sin previo aviso.

Esto encaja con los POMDP del analisis:

  • decisiones basadas en creencias (belief states),

  • actualización continua de probabilidades,

  • necesidad de políticas robustas, no “perfectamente informadas”.

👉 Se insiste en planes de contingencia , en términos formales,una política robusta para POMDP, no un “plan B político”.


5. Sistemas multiagente: el mundo como juego estratégico

El analisis dedica un bloque central a sistemas multiagente y teoría de juegos.

El diagnóstico es :

  • EEUU, China, Rusia, UE, Sur Global = agentes estratégicos,

  • con funciones de utilidad distintas,

  • algunos cooperativos, otros adversariales.

Clave RMS

El error europeo ha sido asumir un juego cooperativo cuando el sistema ha pasado a ser no cooperativo / adversarial.

👉 En juegos no cooperativos:

  • la inacción no es neutral,

  • es una estrategia dominada.


6. Trumpismo como política adversarial (visión algorítmica)

La caracterización del trumpismo como patrón oportunista encaja perfectamente con:

  • agentes que maximizan utilidad bajo reglas cambiantes,

  • estrategias de perturbación del entorno (“fomentar el caos”),

  • creación deliberada de estados inciertos para forzar negociación.

En términos del analisis:

  • Trump actúa como un agente adversarial que modifica el espacio de estados para cambiar el equilibrio del juego.

👉 El riesgo señado es algorítmico: cuando demasiados agentes adoptan estrategias caóticas,
el sistema entra en inestabilidad no lineal.


7. Aprendizaje por refuerzo: por qué China aprende y Europa no

Uno de los contrastes más potentes:

  • China opera como un sistema de aprendizaje por refuerzo:

    • experimenta,

    • escala lo que funciona,

    • corrige errores sin ideología rígida.

  • Europa opera con reglas fijas:

    • aprende lentamente,

    • penaliza el error,

    • no itera políticas.

En términos del analisis:

  • China optimiza políticas mediante exploración–explotación,

  • Europa está atrapada en explotación estática de reglas pasadas.


8. Hacia agentes autónomos robustos: instituciones como “policy engines”

Aquí está la síntesis final, clave para el informe:

Las nuevas instituciones supranacionales no deben verse como foros normativos, sino como agentes autónomos de decisión, con mandato, feedback y capacidad de ejecución.

Inspirado en Algorithms for Decision Making:

Una institución robusta debería:

  • observar estados,

  • actualizar creencias,

  • elegir acciones,

  • evaluar resultados,

  • aprender.

👉 Es decir: instituciones como políticas óptimas aproximadas, no como constituciones estáticas.


9. Traducción directa como propuesta europea

Analisis RMSTraducción geopolítica
MDP / POMDPPolítica europea bajo incertidumbre
MultiagenteMundo multipolar adversarial
Reward a largo plazoViabilidad sistémica
Robust policyPlanes de contingencia
LearningPolítica industrial adaptativa
Autonomous agentUE con capacidad ejecutiva

10. Cierre conceptual 

El problema europeo no es falta de valores, sino falta de arquitectura de decisión.

En un mundo de agentes estratégicos,solo sobreviven los sistemas capaces de decidir, aprender y adaptarse bajo incertidumbre.


Comentarios

Entradas populares de este blog

2. Competencia clásica VS Competencia sistemica

Sistema Ejecutivo de Decisión bajo Riesgo Sistémico (SED-RS)-Risk Belief Vector (RBV)