¿Cómo toman decisiones los humanos cuando los resultados son inciertos?
Una forma posible sería calcular el valor esperado de cada opción multiplicando cada posible cantidad de resultado por su probabilidad y luego eligiendo la opción con el valor esperado más alto.
Si bien esta estrategia maximizaría la recompensa en las expectativas, esto no es lo que la gente tiende a hacer. En particular, las personas parecen estar irracionalmente influenciadas por los resultados pasados de sus decisiones al tomar decisiones posteriores.
Investigadores de la Universidad de Tsukuba han desarrollado y validado un modelo («teoría de la perspectiva dinámica») que integra el modelo más popular en economía conductual para describir la toma de decisiones bajo incertidumbre: la teoría de la prospectiva y un modelo bien establecido de aprendizaje de la neurociencia: la teoría del aprendizaje por refuerzo.
Este modelo describió con mayor precisión las decisiones que las personas y los monos tomaron mientras enfrentaban riesgos que la teoría prospectiva o la teoría del aprendizaje por refuerzo solas.
Específicamente, los investigadores pidieron a 70 personas que eligieran repetidamente entre dos loterías en las que pudieran obtener alguna recompensa con cierta probabilidad. Las loterías variaban en el tamaño de la recompensa, la probabilidad de recibirla y la cantidad de riesgo involucrado.
Los resultados mostraron que inmediatamente después de experimentar un resultado que era mayor que el valor esperado de la opción seleccionada, los participantes se comportaron como si la probabilidad de ganar en la próxima lotería aumentara.
El autor principal del estudio, el profesor asistente Hiroshi Yamada, dice: «Este comportamiento es sorprendente porque las probabilidades de ganar se describieron claramente a los participantes (los participantes no tuvieron que aprenderlas de la experiencia) y estas probabilidades también fueron completamente independientes de los resultados anteriores».
Usando su modelo de teoría de prospectos dinámicos, los investigadores pudieron determinar que el cambio en el comportamiento es impulsado por un cambio en la percepción de las probabilidades en lugar de por un cambio en la valoración de las recompensas.
Yamada también dice: «Tal aprendizaje de eventos inesperados subyace a la teoría del aprendizaje por refuerzo y es un algoritmo bien conocido que ocurre cuando las personas necesitan aprender las recompensas de la experiencia. Es interesante que ocurra incluso si el aprendizaje no es necesario».
En experimentos similares con monos macacos, cuyos cerebros se parecen mucho a los de los humanos, esencialmente se observaron los mismos resultados. Los investigadores comentaron que la similitud en el comportamiento humano y de monos fue notable en este estudio.
Con base en los resultados de esta investigación, se espera que la investigación del cerebro del mono conduzca a una comprensión de los mecanismos cerebrales involucrados en la percepción de las recompensas y la probabilidad que todos usamos al tomar decisiones arriesgadas, así como la alegría que sentimos cuando tenemos éxito.
Fuente: Universidad de Tsukuba