La negociación integradora

La cooperación voluntaria

Axelrod analiza el problema de la cooperación intentando prescindir de la autoridad central. Investiga bajo qué condiciones puede surgir -y de hecho surge- la cooperación en un mundo de egoístas, es decir, entre sujetos que persiguen su propio interés, sin la ayuda de una autoridad central que les fuerce a cooperar unos con otros. Esta aproximación es particularmente interesante a los efectos de la negociación, la cual opera precisamente, como ya hemos explicado, cuando las leyes o el mercado no han resuelto la cuestión de alguna forma. También las interacciones entre las naciones, como señala el propio Axelrod, se producen en muchos casos con ausencia de una supraautoridad. Y efectivamente, las relaciones entre las naciones constituyen un ejemplo clásicamente negocial.

Sin embargo, si contemplamos la cuestión desde un punto de vista puramente estratégico (la interdependencia de resultados y la estructura de incentivos), el factor verdaderamente relevante en la superación del dilema del prisionero es que sea factible identificar al traidor e imponerle un castigo disuasorio. Que esa función esté atribuida a una autoridad central o a los propios jugadores es una variable secundaria a efectos estratégicos y que responde más bien, en principio, a si se trata de una materia regulada imperativamente o que puede o debe ser objeto de acuerdos libremente adoptados y configurados.

Lo que sí es necesario en todo caso, para que el castigo en forma de coste futuro afecte a las evaluaciones presentes, es que el juego -metafóricamente- sea repetitivo, es decir, que no se agote en una sola jugada y que los jugadores puedan encontrarse de nuevo, de manera que...


	..."las decisiones adoptadas hoy no sólo determinan el resultado de esta jugada, sino que también pueden influir en las elecciones posteriores de los jugadores".

Axelrod propone para el dilema del prisionero repetitivo una estrategia cooperativa fundada en el principio de empezar cooperando en la primera jugada y, en las jugadas sucesivas, aplicar la norma del tit for tat, que podemos también llamar del ojo por ojo: hacer con el otro lo que el otro nos haya hecho, esto es, cooperar si en la jugada anterior (que es la inmediatamente observable) el otro ha cooperado y no cooperar si en la jugada anterior el otro no ha cooperado. En cuanto el otro vuelve a cooperar nosotros restauramos la cooperación en la jugada siguiente y así sucesivamente.

Los resultados de la aplicación de esa estrategia revelarían cuatro propiedades que pueden hacer que una regla de decisión tienda a generar cooperación: la evitación de conflictos innecesarios (gracias a cooperar mientras el otro lo haga), la provocabilidad (castiga inmediatamente la traición del otro), la indulgencia (está dispuesta a perdonar tras responder a la provocación) y la claridad de comportamiento (de manera que el otro puede adaptarse a un patrón reconocible de actuación).

Efectivamente, la estrategia propuesta por Axelrod tiene las propiedades que él mismo enumera y además otra propiedad muy relevante desde el punto de vista ético y negocial: la reciprocidad. Es una estrategia que si es adoptada por los dos jugadores a la vez optimiza el resultado sin que nadie salga perjudicado. La reciprocidad es una cualidad de las estrategias cooperativas, las cuales suelen producir buenos resultados si juegan contra sí mismas.

En cambio, las estrategias competitivas están pensadas para que las utilice una sola parte. Como observa Axelrod, en las estructuras del tipo del dilema del prisionero, "la estrategia que mejor funciona depende directamente de qué estrategia está usando el otro jugador y, particularmente, de si tal estrategia deja espacio para el desarrollo de la mutua cooperación". Es decir, no existe una mejor estrategia independientemente de la estrategia que está usando el otro jugador.

Esta estrategia propuesta por Axelrod ha sido puesta a prueba en un torneo que consistía en jugar series de 150 repeticiones del dilema del prisionero por parejas de jugadores siguiendo estrategias en forma de programas de ordenador. La estrategia del tit for tat fue la más productiva globalmente considerada, es decir, resultó ser la estrategia que más cooperación generaba. Sin embargo, es una estrategia que referida al juego entre dos jugadores no puede ganar nunca. Como máximo empata, y en el peor de los casos pierde por una sola jugada. Es una estrategia que consigue motivar la cooperación siempre que ésta sea posible, a la vez que disuade la explotación. Otros concursantes o bien eran demasiado confiados y se exponían constantemente a la explotación, o bien seguían estrategias demasiado agresivas y destruían todas las posibilidades de cooperación. Los resultados de la aplicación de la estrategia de Axelrod demostrarían que bajo condiciones adecuadas la cooperación puede realmente surgir en un mundo de egoístas sin autoridad central.

Dixit y Nalebuff proponen una adaptación de la táctica del tit for tat a las condiciones bajo las cuales tiene lugar la negociación real. Consideran que en la vida real se dan demasiados malentendidos o errores de percepción (podemos creer erróneamente que el otro no ha colaborado en la jugada anterior o viceversa) como para ser tan drásticos. Un error de percepción provoca un desencadenamiento de respuestas y contrarrespuestas que perpetúan el malentendido y van rebotando de uno a otro como el eco. Entienden que hay que ser más indulgentes cuando la ofensa parece un error más que la regla, si bien hay que mantenerse muy atento a si la ofensa se repite. En consecuencia, proponen la siguiente regla de conducta:

Empezad cooperando y seguid así pero llevad la cuenta de las veces en que vuestro adversario parece haberos traicionado mientras vosotros cooperabais. Si el porcentaje llega a ser inaceptable, recurrid al ojo por ojo. Para ello, aplicad estas reglas:

Primera impresión: no se puede aceptar una traición en la primera jugada. Al ojo por ojo.
Corto plazo: no se pueden aceptar dos traiciones en tres turnos. Al ojo por ojo.
Medio plazo: no se pueden aceptar tres traiciones en los últimos veinte periodos. Al ojo por ojo.
Largo plazo: no se pueden aceptar cinco traiciones en los últimos cien periodos. Al ojo por ojo.

A partir de los resultados obtenidos con la aplicación de la estrategia del tit for tat y a partir también de su propia construcción teórica relativa a la evolución de la cooperación en el dilema del prisionero repetitivo, Axelrod propone un patrón de mutua cooperación con el otro jugador que permita obtener a largo plazo mejores resultados que los que proporcionaría el seguir el incentivo inmediato a no cooperar que cada jugador tiene a corto plazo (incentivo inherente a la estructura del dilema del prisionero). Para que la mutua cooperación tenga sentido desde el punto de vista individual, se supone que cada jugador tiene como objetivo el marcar lo más posible a lo largo de una serie de interacciones con otro jugador que también intenta obtener un buen resultado. El patrón de comportamiento propuesto por Axelrod se formula mediante cuatro propuestas:

1.ª No ser envidioso.

No se trata de una prescripción moral. La propuesta implica que en un juego de suma-positiva no tiene sentido medir los propios beneficios por comparación con los beneficios que obtiene el otro jugador, ya que ese patrón de comparación sería más propio de los juegos de suma-cero en los que lo que uno gana el otro necesariamente lo pierde. En un juego de suma-positiva, los propios beneficios sólo pueden medirse en relación con lo que es razonablemente posible obtener en esa situación determinada (por ejemplo: ¿qué podría conseguir otro jugador en mi lugar?). Insistir en compararse con el otro jugador conduce a la envidia, la envidia lleva a la no cooperación a fin de intentar contrarrestar los beneficios del otro y la no cooperación, a las represalias y al fracaso conjunto. Es decir, la envidia es autodestructiva. Un buen ejemplo de estrategia que genera mucha cooperación y que no es envidiosa es precisamente la del tit for tat: nunca puede ganar al otro jugador, ya que nunca es la primera en no cooperar, pero cuando jugamos a juegos de suma-positiva ganar no significa necesariamente ganar al otro siempre que uno consiga obtener los resultados individuales que se derivan de la mutua cooperación.

2.ª No ser el primero en no cooperar. Si las relaciones van a ser continuadas y si atribuimos suficiente importancia a las interacciones futuras, siempre dará mejor resultado cooperar mientras el otro jugador también coopere que empezar no cooperando o dejar de cooperar mientras el otro coopera. Los experimentos sugieren que ser el primero en no cooperar provoca las represalias y el conflicto consiguiente anula los beneficios de la cooperación presente y futura. A la inversa, si no cabe esperar interacción futura o si uno de los dos jugadores por lo menos no le atribuye valor suficiente al futuro, una estrategia de no cooperación puede dar mejor resultado que ser cooperativo.

3.ª Responder con reciprocidad tanto a la cooperación como a la no cooperación. Empezar cooperando y, a continuación, simplemente hacer lo mismo que el otro nos ha hecho en la jugada anterior. Responder a la cooperación con cooperación evita el conflicto innecesario y las pérdidas derivadas de la consiguiente sucesión de represalias. Responder inmediatamente a la no cooperación con no cooperación desincentiva la explotación. La reciprocidad implica, por último, que cuando el otro jugador restablece la cooperación volvemos a cooperar, es decir, introduce un ajustado equilibrio entre el castigo y el perdón.

4.ª No pasarse de listo. Al planear estrategias para las situaciones del tipo dilema del prisionero es fácil pasarse de listo. Una forma de pasarse de listo es adoptar estrategias muy sofisticadas de maximización de resultados y olvidarse de tomar en cuenta las reacciones del otro jugador a nuestro patrón de actuación. Ahora bien, una característica básica de la interacción en los juegos de suma-positiva es que el otro jugador no es un elemento fijo del conjunto, sino que nuestro propio comportamiento es tomado en cuenta por el otro jugador para decidir el suyo. Cada jugador se adapta y readapta sucesivamente a los movimientos del otro. En los juegos de suma positiva, en los que es posible obtener ganancias conjuntas, el otro jugador observa las señales que emite nuestra forma de actuar para evaluar si vamos a responder o no a la cooperación con cooperación. Es decir, que es muy probable que nuestro comportamiento se vuelva contra nosotros como un eco.

Otra forma de pasarse de listo es usar una estrategia de represalias permanentes. Es decir, una estrategia de cooperar mientras el otro coopera pero de no volver a cooperar nunca más después de una traición aislada del otro. Es una estrategia demasiado dura porque pierde las posibilidades de cooperación que siguen existiendo cuando el otro jugador ha intentado una traición ocasional pero está dispuesto a volver a cooperar tras el castigo.

Una tercera forma de pasarse de listo es usar estrategias probabilísticas tan complejas que las elecciones parecen resultado del azar. Mucha complejidad resulta incomprensible y parece simplemente caos. El otro jugador perderá todo incentivo a cooperar si nuestra regla de actuación resulta impredecible.

El tit for tat es muy claro y comprensible para el otro jugador. Cuando adoptamos esta regla se puede predecir nuestro comportamiento futuro con gran facilidad y el otro jugador comprende también muy fácilmente que la mejor manera de tratar con el tit for tat es cooperar con él mientras exista la probabilidad de que habrá por lo menos una interacción más en la que va a recibir una respuesta cooperativa.

En los juegos de suma-cero, como sabemos, es útil esconder nuestras intenciones. Por el contrario, en los juegos de suma-positiva, en los que se obtiene un beneficio de la cooperación del otro, si queremos estimular tal cooperación es útil dejar clara nuestra intención de actuar con reciprocidad. La aplicación del tit for tat lo deja totalmente claro.

Las cuatro propuestas de Axelrod son directamente aplicables al negociador que quiere superar el dilema del negociador. Si la negociación se puede representar como un juego de suma positiva y por consiguiente obtenemos beneficios de la mutua cooperación, si existe algún medio, público o privado de asegurar el castigo a la traición, entonces la aplicación de las cuatro propuestas, adaptadas cuidadosamente al contexto de que se trate, tenderán a obtener mejores resultados de promedio.