Los 3 tipos de inteligencia artificial en el Rey León 🦁🤖

El Rey León nos cuenta la historia de Simba, un joven león que está destinado a ser rey. Todos conocemos la historia o hemos visto la película alguna vez. Pues bien, cuando alguien de mi entorno me pregunta cómo aprenden las máquinas intento usar esta película para explicarlo.

¿Y qué tiene que ver el rey león con la inteligencia artificial? Pues, en mi cabeza, mucho y en este post os lo cuento.

Antes de nada, “Inteligencia artificial” es un término un poco vago y más marketiniano que real. Cuando decimos inteligencia artificial nos referimos, entre otras cosas, al aprendizaje automático. Un conjunto de técnicas que nos permiten hacer que un programa aprenda lo que hacer sólo en base a datos, sin que nadie le diga específicamente cómo hacerlo, es decir, en base a la experiencia.

Actualmente hay tres maneras de que las máquinas aprendan, tres tipos de aprendizaje bien diferenciados. El primero de ellos se llama aprendizaje supervisado y … ahora volvemos a Simba!

Aprendizaje supervisado

Simba nace, es pequeñito y necesita de la supervisión de su padre. Él le da lecciones para que Simba se convierta en un gran rey y este sería un buen ejemplo de aprendizaje supervisado.

En este tipo de aprendizaje se tienen unas variables de entrada (datos que el algoritmo observa) y una variable objetivo (datos que tiene que calcular). A base de muchos ejemplos y sobretodo de prueba y error (e iterar un montón de veces), logramos que el programa aprenda lo que hacer.

En el caso de un algoritmo las variables de entrada podrían ser texto, imágenes, audio; y la variable objetivo podría ser el mismo texto pero en otro idioma, detectar objetos en la imagen introducida o saber qué canción se está reproduciendo en el caso de audio.

En el caso de Simba las variables de entrada serían todo lo que le rodea, lo que ve, lo que escucha, lo que siente; y la variable objetivo sería convertirse en un buen rey. Con todo lo que está observando y sintiendo, ¿qué tiene que hacer para parecerse a su padre?

Cuando Simba se desvía de su camino para convertirse en un buen rey, su padre le corrige!

Simba, después de la traición de Scar a Mufasa, se queda sin su padre… Se queda sin ese supervisor que le ayudaba a aprender a ser un buen rey y huye. Huye de todo lo que conoce y solo, en el desierto, deshidratado… se encuentra con Timón y Pumba.

Aprendizaje NO supervisado

Ahora, para aprender, solo tiene a Timón y Pumba, y estos no son buenos supervisores que digamos. Su lema en la vida es Hakuna Matata, vive y deja vivir.

Al principio dudaba de que Simba simplemente no sustituyese a Mufasa por Timón y Pumba como supervisores pero en serio… ellos no le supervisan.

Simba crece y va aprendiendo sin supervisión, no tiene ningún objetivo, simplemente observa su entorno y trata de interpretarlo como buenamente puede. 

En la escena de las estrellas se ilustra muy bien lo que quiero decir. Simba, Timón y Pumba están tumbados mirando las estrellas y empiezan a interpretar lo que son, cada uno de forma distinta.

Timón dice que son luciérnagas que se han quedado pegadas en la cúpula celeste. Pumba cree que son bolas de gas en eterna combustión a millones de kilómetros de distancia (muy accurate para un jabalí) y Simba opina que son grandes reyes del pasado.

Aunque los tres interpretan las estrellas de una manera, lo cierto es que los tres pueden distinguir cuando una estrella está más cerca que otra en el cielo, cuando una es más brillante que otra, grupos de estrellas, constelaciones, etc.

¿En la vida real esto en que traduce? podemos poner el ejemplo de Youtube. 

Cuando el famoso algoritmo de Youtube observa que estás mirando un cierto video, para él eres una estrella, un punto. Un punto junto a millones de puntos más y dependiendo de lo cerca que estés de los otros puntos pueden mostrarte anuncios personalizados o recomendarte contenido que quizás te interese, ¿por qué? porque a las “estrellas” de tu alrededor también les ha gustado.

Aprendizaje reforzado

En esta etapa aparece Nala, la amiga de la infancia de Simba, y le devuelve la inquietud por ser rey, por recuperar lo que era suyo y por supuesto, también está el amor, reproducirse y esas cosas. 

Nala cree que Simba quiere luchar por el trono de su padre y a él le da un poco igual. Nala le sermonea, discuten y lo deja tirado (castigo) aquí Simba ya sospecha que si quiere seguir retozando con Nala (recompensa) tiene que recuperar el trono.

Empezamos a ver lo que caracteriza al aprendizaje reforzado: el castigo y la recompensa. ¡La escena de Rafiki golpeandole la cabeza escenifica muy bien este tipo de aprendizaje!

En este momento Simba no tiene un objetivo, simplemente sabe que no quiere que le golpeen y ni le den sermones (castigos), que quiere ser respetado y volver a ver a su familia (recompensas).

No hay un objetivo claro pero parece que va a tener que volver a casa. No tiene a nadie que lo supervise, simplemente tiene incentivos, castigos y recompensas.

Viene la batalla contra Scar y, en medio de la batalla, tenemos otro ejemplo de aprendizaje reforzado. Simba se compadece de Scar (acción) y Scar lo golpea desprevenido (castigo), Simba vuelve a la pelea pero esta vez sin dejarse engañar (acción) y vence a Scar (recompensa).

En la vida real los ejemplos más característicos del aprendizaje por refuerzo son basados en juegos. AlphaGo es una IA que venció al mejor jugador del mundo de Go, AlphaStar lo mismo pero en el videojuego StarCraft, y así con muchos ejemplos más.

Conclusión

Después de años de reinado de Scar donde la sequía y el hambre abundaba, la pelicula termina con Simba coronado y con los guionistas haciendo que vuelva a llover, que se llenen los rios, crezcan las plantas y la vida vuelva al reino; muy oportuno.

¡Sé que hay cosas en esta explicación cogidas con pinzas, pero creo que es una forma divertida de explicar lo que hacemos sin palabras raras ni tanta pomposidad!

Deja una respuesta