El complejo juego Go: Una nueva victoria para la inteligencia artificial ¿Futuro jaque a la humanidad?

Por : César Ravello/ CINV

Nuevos avances en inteligencia artificial han permitido crear un sistema que fue capaz de derrotar a un jugador humano profesional. La complejidad del juego hacía pensar que este logro aún estaba a décadas de poder lograrse ¿Cuáles son las implicancias para el futuro?

Los computadores se vuelven cada vez más poderosos, no solo en términos de la velocidad a la que pueden operar o la cantidad de información que pueden manejar, sino que, más importante aún, en la complejidad de las tareas que pueden realizar. ¿Significa esto que son cada vez más inteligentes? Sin duda que cuando hablamos de inteligencia, el referente es la propia mente humana.

Claramente los computadores son muy superiores a nosotros en términos operacionales, ya que con la capacidad de realizar millones de cálculos matemáticos por segundo, son capaces de resolver problemas complicados problemas en un tiempo que para nosotros sería prácticamente imposible.

Sin embargo, éstos problemas matemáticos que para nosotros podrían parecer indescifrables, en realidad son relativamente simples, en términos de que basta conocer los pasos necesarios para resolverlos. Así, basta con crear un programa adecuado que procese los números para obtener la respuesta deseada. Esta capacidad de “fuerza bruta” es la que se ha aprovechado en el pasado para que las máquinas superen al humano en algunas tareas. Cuando el campeón mundial de ajedrez de ese entonces, Garry Kasparov, fue derrotado por el computador Deep Blue creado por IBM, lo que hacía el computador era analizar un gran número de las jugadas posibles para elegir la más apropiada. Ya que el juego tiene un número acotado de reglas y jugadas posibles, fue posible crear un programa diseñado especialmente para llevar a cabo la tarea.

Pero ¿qué pasa cuando los pasos a seguir para llegar a una respuesta no son claros? Es aquí cuando se vuelven esenciales los avances en Inteligencia Artificial. Para evitar confusiones, estamos considerando a la Inteligencia como la capacidad de aprender a resolver problemas, poniendo mucho énfasis en el aprendizaje, y diferenciándola claramente de la capacidad de memorizar. Así, un computador con una gran capacidad de cálculo y que haya “memorizado” la forma de resolver ciertos problemas (mediante su programación), NO es un sistema inteligente.

El juego de Go constituye uno de estos problemas para los que no existe un conjunto de instrucciones simples para obtener la victoria. Originado en la antigua China hace más de 5000 años, tiene pocas reglas y son relativamente simples, pero el tamaño del tablero (19×19 “casillas”, en comparación con el de ajedrez que es de 8×8) y lo abstracto del objetivo (usar las piezas para encerrar territorio, y evitar que el oponente haga lo mismo) lo convierte en un problema que hasta ahora los computadores no habían logrado dominar con éxito. Hasta hace poco tiempo, los sistemas más avanzados sólo lograban jugar a nivel de amateur débil. Se esperaba que desarrollar un sistema capaz de derrotar a un campeón profesional ocurriría al menos en una década más.

Contra este pronóstico, el grupo DeepMind, encabezado por Demis Hassabis, desarrolló AlphaGo, un sistema que hace unos meses fue capaz de derrotar por cinco partidas contra cero al campeón de Europa de los últimos tres años, Fan Hui. Anteriormente este mismo grupo había desarrollado un sistema que era capaz de aprender a jugar por sí mismo juegos de Atari, superando en la mayoría de los juegos el desempeño de un jugador humano profesional y superando a todos los otros sistemas desarrollados hasta ese momento.

¿Cómo lograron la hazaña de que AlphaGo derrotara al campeón? La clave está en la Inteligencia Artificial que desarrollaron, la forma en que el sistema aprende a jugar. El sistema está construido en base a Redes Neuronales Artificiales, un sistema que imita en cierta forma el comportamiento del cerebro: varias capas de muchas neuronas conectadas entre si; cuando una neurona se activa, hará que las neuronas a las que está conectada aumenten su probabilidad de activarse; el aprendizaje se genera modificando la fuerza de cada conexión. El principio básico para ganar el juego sigue siendo el mismo, analizar muchas jugadas posibles y elegir la mejor.

Sin embargo, la complejidad del juego hace que analizar todas las jugadas posibles sea inmanejable, aun para los computadores más poderosos en existencia; dado el tamaño del tablero, la cantidad de formas en que pueden estar puestas las piezas supera el número de átomos que se estima existen en todo el universo, aun considerando sólo las posiciones “legales” dentro de las reglas del juego y no todas las combinaciones matemáticamente posibles. Para ser exactos, el número de estados posibles es de 208.168.199.381.979.984.699.478.633.344.862.770.286.522.453.884.530.548.425.639.456.820.927.419.612.738.015.378.525.648.451.698.519.643.907.259.916.015.628.128.546.089.888.314.427.129.715.319.317.557.736.620.397.247.064.840.935. Se hace obvio entonces que es imposible analizar todas las jugadas, por lo tanto hay que revisar sólo un subconjunto de ellas, pero este subconjunto no puede ser elegido al azar, sino que tiene que ser seleccionado inteligentemente.

En general, para poder jugar con éxito, un sistema debe ser capaz de evaluar cuál es la probabilidad de ganar dado el estado del tablero, y qué jugadas ayudarán más a llevar el tablero a un estado que entregue más probabilidades de ganar. Siguiendo esta idea, AlphaGo está dividido en tres partes. La primera y más básica es una red que le permite “ver” el tablero, es decir, entender el estado del juego a partir de información visual. La segunda es una red encargada de elegir una jugada y la tercera es la encargada de evaluar las probabilidades de ganar dado el estado del juego. Este diseño se implementó para poder entrenar a cada una por separado para que aprenda a cumplir su función.

La parte visual se realizó de forma similar a lo que hacen distintos programas hoy en día para identificar personas en una fotografía, o lugares famosos o tipos de paisajes, es decir, a partir del valor de un conjunto de pixeles se identifica el contenido de la imagen. La red encargada de elegir las jugadas fue entrenada en una primera etapa mediante un sistema llamado Aprendizaje Supervisado. Estudiando una base de datos que contiene la información de muchas partidas jugadas por humanos expertos, el sistema aprende cuáles son las jugadas más probables dado un estado del tablero y así predecir cuáles serían las jugadas que hará el oponente. Luego viene una fase denominada Aprendizaje Reforzado; a partir de lo aprendido en la primera fase se realizan leves modificaciones de la red al azar y se la pone a jugar contra otra red, si gana se le da una recompensa y si pierde una penalización, así la red se va haciendo cada vez mejor a medida que juega más partidas.

Finalmente, la tercera red fue entrenada haciéndole analizar muchas partidas y sus resultados. Uno de los aportes novedosos de este trabajo es la forma en que esto se hizo; los investigadores se dieron cuenta que cuando la red era entrenada con las partidas de la base de datos ya mencionada, el sistema simplemente memorizaba cada una de esas partidas, pero si era entrenada con fragmentos de partidas elegidos al azar entre las partidas que el sistema jugaba consigo mismo, la nueva red era capaz de extrapolar los resultados a partidas y jugadas no vistas durante su entrenamiento.

Con las capacidades logradas con este entrenamiento, AlphaGo fue capaz de derrotar a todos los programas de Go conocidos, pero más importante aún, logró derrotar a un jugador humano profesional. Es importante reiterar que esto no es sólo debido a avances en la potencia de los computadores, como referencia, DeepBlue analizaba una cantidad de jugadas miles de veces mayor que las analizadas por AlphaGo, la ventaja es que AlphaGo elige más inteligentemente qué jugadas analizar, para luego decidir cuál de ellas ejecutará.

A estas alturas podrán preguntarse ¿y cuál es la importancia de ganar un juego? Pues bien, claramente el objetivo final no es ganar un juego con un afán competitivo, más bien lo importante es qué podemos aprender al desarrollar estos sistemas. Las técnicas desarrolladas por este grupo de investigadores mientras creaban AlphaGo podrán ser aplicadas a otros problemas y seguir avanzando en el desarrollo de la inteligencia artificial.

Pero es aquí donde para muchos empiezan a aparecer los temores ¿Hasta dónde hay que seguir avanzando?¿Qué pasará cuando creemos una inteligencia artificial superior a la humana? Las opiniones están bastante divididas en este aspecto. Claramente la ciencia ficción ha pintado un cuadro bastante oscuro al respecto, con innumerables historias de robots que se rebelan y destruyen o esclavizan a la humanidad. ¿Existe realmente un peligro? Algunos científicos, entre ellos el renombrado Stephen Hawking, han advertido que sería peligroso crear una inteligencia superior a la humana, incluso anunciando que tal cosa sólo provocará el fin de la humanidad. Otros tienen temores más mundanos, como la pérdida de puestos de trabajo, similar a los temores que se generaron en la revolución industrial, en que las máquinas reemplazaron el trabajo de muchos obreros. Pero los que están a favor descartan estos medios. Tal como la revolución industrial significó a la larga un progreso para la humanidad, las posibilidades de la inteligencia artificial nos traerán mejoras en nuestras vidas.

¿Qué tan lejos están estos cambios? Claramente una inteligencia artificial igual o superior a la humana aún está bastante lejos de ser posible. Sin embargo, para bien o para mal, no es necesario llegar a ese nivel de sofisticación para que haya un impacto en el mundo, no es necesario que una inteligencia tenga las mismas capacidades que un humano, basta con que hagan una cosa bien, la tarea para la que estén destinadas. Un ejemplo que se espera que llegue pronto son los automóviles que se conduzcan por si solos ¿Serán estos automóviles tan inteligentes como un humano?

Claramente no, pero aun así se pronostica que la cantidad de accidentes de tránsito disminuirá drásticamente con esta tecnología. De la misma forma, nuevos robots podrían aumentar la productividad en distintas industrias. Algunos de estos avances ya tienen aplicaciones prácticas. Muchas de las prótesis robóticas que ayudan a personas que han perdido miembros o el control sobre ellos, usan inteligencia artificial para entender las señales nerviosas que envía el cerebro de la persona y transformarlas en movimientos.

¿Dónde está el peligro entonces? Según el experto Nigel Shadbolt, el peligro está en las tareas que le asignemos a una inteligencia artificial y no en sus limitaciones. Con cualquier tarea que le asignemos, es posible obtener resultados que no se esperaban, lo que no significa en absoluto que la IA esté actuando con intenciones malignas, sólo estará actuando dentro de sus capacidades. Entonces, si les damos el control de cosas esenciales, las consecuencias podrían ser graves. En sus propias palabras, “el peligro no es la inteligencia artificial, sino la estupidez natural”.

Artículo original: http://www.nature.com/nature/journal/v529/n7587/full/nature16961.html

Blog de los autores: https://research.googleblog.com/2016/01/alphago-mastering-ancient-game-of-go.html