Del riesgo sistémico a la decisión bajo incertidumbre (Algorithms for Decision Making)

El paralelismo central: del riesgo sistémico a la decisión bajo incertidumbre

Diagnóstico

No estamos ante shocks aislados, sino ante deriva de riesgo en un entorno incierto, adversarial y dinámico.

Es el problema canónico que aborda Algorithms for Decision Making:

estados inciertos,
información incompleta,
agentes estratégicos,
recompensas diferidas,
necesidad de políticas robustas, no óptimas “en papel”.

👉 La geopolítica actual es un problema algorítmico mal resuelto.

2. Estados, acciones y recompensas: Europa como agente decisor

En este marco, Europa puede modelarse como un agente racional limitado, no omnisciente, que decide en un entorno hostil.

Estados (S)

Ejemplos de estados relevantes:

grado de fragmentación del orden internacional,
dependencia industrial (China / EEUU),
nivel de coerción económica,
salud institucional multilateral,
estabilidad de cadenas críticas.

Estos estados no son observables perfectamente → entorno parcialmente observable.

Acciones (A)

Europa puede elegir, por ejemplo:

no actuar (absorción pasiva),
defensa selectiva (aranceles, ayudas puntuales),
respuesta sistémica (política industrial + capacidad ejecutiva),
alineamiento con un “comité” externo,
construcción de instituciones propias.

Recompensas (R)

Aportación clave frente al debate político habitual:

la “recompensa” no es crecimiento a corto plazo,
sino viabilidad sistémica, resiliencia y margen estratégico a medio plazo.

👉 Esto encaja con la idea de utilidad a largo horizonte del libro.

3. Procesos de Decisión de Markov (MDP): por qué Europa no puede ser miope

El análisis RMS muestra que, en un MDP, una política que maximiza beneficios inmediatos puede ser subóptima o destructiva a largo plazo.

Traducción directa al análisis:

Política europea	Lectura MDP
No actuar porque “sale caro”	Maximiza recompensa inmediata
Evitar conflicto hoy	Descuenta excesivamente el futuro
No invertir en instituciones	Ignora estados futuros adversos

👉 Europa ha estado usando un factor de descuento excesivo (β muy bajo):valora demasiado el presente y muy poco la supervivencia futura.

4. POMDP: por qué la incertidumbre actual es estructural

El entorno actual no es solo Markoviano, es parcialmente observable:

no conocemos las verdaderas intenciones de EEUU, China o Rusia,
las reglas cambian,
las instituciones pueden fallar sin previo aviso.

Esto encaja con los POMDP del analisis:

decisiones basadas en creencias (belief states),
actualización continua de probabilidades,
necesidad de políticas robustas, no “perfectamente informadas”.

👉 Se insiste en planes de contingencia , en términos formales,una política robusta para POMDP, no un “plan B político”.

5. Sistemas multiagente: el mundo como juego estratégico

El analisis dedica un bloque central a sistemas multiagente y teoría de juegos.

El diagnóstico es :

EEUU, China, Rusia, UE, Sur Global = agentes estratégicos,
con funciones de utilidad distintas,
algunos cooperativos, otros adversariales.

Clave RMS

El error europeo ha sido asumir un juego cooperativo cuando el sistema ha pasado a ser no cooperativo / adversarial.

👉 En juegos no cooperativos:

la inacción no es neutral,
es una estrategia dominada.

6. Trumpismo como política adversarial (visión algorítmica)

La caracterización del trumpismo como patrón oportunista encaja perfectamente con:

agentes que maximizan utilidad bajo reglas cambiantes,
estrategias de perturbación del entorno (“fomentar el caos”),
creación deliberada de estados inciertos para forzar negociación.

En términos del analisis:

Trump actúa como un agente adversarial que modifica el espacio de estados para cambiar el equilibrio del juego.

👉 El riesgo señado es algorítmico: cuando demasiados agentes adoptan estrategias caóticas,
el sistema entra en inestabilidad no lineal.

7. Aprendizaje por refuerzo: por qué China aprende y Europa no

Uno de los contrastes más potentes:

China opera como un sistema de aprendizaje por refuerzo:
- experimenta,
- escala lo que funciona,
- corrige errores sin ideología rígida.
Europa opera con reglas fijas:
- aprende lentamente,
- penaliza el error,
- no itera políticas.

En términos del analisis:

China optimiza políticas mediante exploración–explotación,
Europa está atrapada en explotación estática de reglas pasadas.

8. Hacia agentes autónomos robustos: instituciones como “policy engines”

Aquí está la síntesis final, clave para el informe:

Las nuevas instituciones supranacionales no deben verse como foros normativos, sino como agentes autónomos de decisión, con mandato, feedback y capacidad de ejecución.

Inspirado en Algorithms for Decision Making:

Una institución robusta debería:

observar estados,
actualizar creencias,
elegir acciones,
evaluar resultados,
aprender.

👉 Es decir: instituciones como políticas óptimas aproximadas, no como constituciones estáticas.

9. Traducción directa como propuesta europea

Analisis RMS	Traducción geopolítica
MDP / POMDP	Política europea bajo incertidumbre
Multiagente	Mundo multipolar adversarial
Reward a largo plazo	Viabilidad sistémica
Robust policy	Planes de contingencia
Learning	Política industrial adaptativa
Autonomous agent	UE con capacidad ejecutiva

10. Cierre conceptual

El problema europeo no es falta de valores, sino falta de arquitectura de decisión.

En un mundo de agentes estratégicos,solo sobreviven los sistemas capaces de decidir, aprender y adaptarse bajo incertidumbre.

Buscar este blog

Analisis y Riesgos