Docencia/Teoría de Juegos/Fundamentos de Teoría de Juegos

Definición formal de un juego

Un juego en forma normal se define como la tupla:

G=(I,{Si}iI,{ui}iI)G = \left(I, \{S_i\}_{i \in I}, \{u_i\}_{i \in I}\right)

Donde II es el conjunto finito de jugadores, SiS_i es el conjunto de estrategias puras disponibles para el jugador ii, y ui:SRu_i: S \to \mathbb{R} es la función de utilidad (payoff) del jugador ii sobre el espacio de perfiles de estrategias S=iISiS = \prod_{i \in I} S_i.

Equilibrio de Nash

Un perfil de estrategias s=(s1,,sn)s^* = (s_1^*, \ldots, s_n^*) es un Equilibrio de Nash si para todo jugador iIi \in I:

ui(si,si)ui(si,si)siSiu_i(s_i^*, s_{-i}^*) \geq u_i(s_i, s_{-i}^*) \quad \forall s_i \in S_i

Es decir, ningún jugador puede mejorar su utilidad desviándose unilateralmente, dado que los demás mantienen sus estrategias de equilibrio.

Estrategias mixtas y el teorema de Nash

Una estrategia mixta para el jugador ii es una distribución de probabilidad σiΔ(Si)\sigma_i \in \Delta(S_i) sobre sus estrategias puras. El Teorema de Nash (1950) garantiza que todo juego finito en forma normal tiene al menos un equilibrio en estrategias mixtas.

La utilidad esperada del jugador ii bajo un perfil de estrategias mixtas σ\sigma es:

Ui(σ)=sS(jIσj(sj))ui(s)U_i(\sigma) = \sum_{s \in S} \left(\prod_{j \in I} \sigma_j(s_j)\right) u_i(s)

Juegos dinámicos e inducción hacia atrás

En juegos extensivos con información perfecta, el Equilibrio Perfecto en Subjuegos (EPS) se obtiene por inducción hacia atrás: se resuelve desde los nodos terminales hacia el nodo raíz, eligiendo en cada subárbol la acción que maximiza la utilidad del jugador que mueve en ese nodo.

El EPS refina el concepto de Equilibrio de Nash eliminando amenazas no creíbles fuera del camino de equilibrio.

Información asimétrica y señalización

En el modelo de señalización de Spence (1973), un agente de tipo θ{θL,θH}\theta \in \{\theta_L, \theta_H\} elige un nivel de educación e0e \geq 0 a un costo c(e,θ)c(e, \theta) con cθ<0c_\theta < 0 (el tipo alto tiene menor costo de señalizar). En un equilibrio separador, la educación ee^* satisface las restricciones de incentivos:

u(θH,e)c(e,θH)u(θH,eL)c(eL,θH)u(\theta_H, e^*) - c(e^*, \theta_H) \geq u(\theta_H, e_L) - c(e_L, \theta_H)
u(θL,e)c(e,θL)u(θL,eL)c(eL,θL)u(\theta_L, e^*) - c(e^*, \theta_L) \leq u(\theta_L, e_L) - c(e_L, \theta_L)

Donde eL=0e_L = 0 es el nivel de educación del tipo bajo en el equilibrio separador.