Se resume aquí un interesante artículo de Daniel Lange sobre la aplicación de la inteligencia artificial y el aprendizaje profundo al desarrollo de juegos, cuyo título original es
Bringing gaming to life with AI and deep learning
cuyo autor es Danny Lange
El desarrollo de juegos es un proceso complejo en el que artistas gráficos, narradores y ingenieros de software deben trabajar de forma coordinada. Existen ahora nuevas técnicas que proceden del desarrollo de aspectos de la inteligencia artificial como el aprendizaje profundo y hay grandes esperanzas puestas en el aprendizaje automático.
Como siempre, el desarrollo se alimenta de la necesidad de aumentar los ingresos. El aprendizaje automático lo empezó a utilizar Amazon en el año 2000, desarrollando algoritmos para descubrir las preferencias de los usuarios, lo que supone un aumento de ventas. Amazon había estado trabajando duro en sus propios algoritmos de recomendación, tratando de descubrir las preferencias de los usuarios y a su vez convertir esas preferencias en ventas más altas.
Los algoritmos de recomendación, por ejemplo, han evolucionado desde la recomendación hasta aplicar una mezcla de exploración y explotación para obtener una visión más completa sobre las preferencias de los usuarios. Algoritmos como los bandidos utilizan esta capacidad de explorar y explotar. Estos algoritmos tienen presencia en muchas páginas cuando se visita Amazon.
DeepMind en 2015 introdujo en los juegos el concepto de aprendizaje profundo de refuerzo, capaz de aprender las secuencias de acciones necesarias para maximizar una recompensa acumulativa futura.
Es muy ilustrativo el video que aparece en el artículo sobre el juego en el que un pollo aprende a cruzar una carretera muy concurrida sin que acabe aplastado por un camión que se acerca mientras recoge paquetes de regalo. Se proporciona al pollo una recompensa positiva cuando recoge un paquete de regalo y una recompensa negativa cuando lo golpea un camión. Con cuatro movimientos del pollo, izquierda, derecha, hacia adelante y hacia atrás, los píxeles en bruto y una puntuación como entrada, y estas instrucciones muy sencillas, el pollo logra capacidades extraordinarias.
Para conseguirlo se utilizó un API de Python que permitió conectar el juego Unity a un servicio TensorFlow que se ejecuta en Amazon Web Services (AWS). Cuando se inicia el proceso de entrenamiento, el pollo se dedica a explorar, pero a medida que avanza el proceso de aprendizaje, gradualmente cambia al proceso de explotación. Este mismo procedimiento es el que pueden utilizar Amazon, Netflix y Uber para mejorar el servicio a sus clientes.
Las posibilidades con respecto a los primeros pasos de aprendizaje automático, han aumentado con el desarrollo de redes neuronales recurrentes expresivas (RNN) tales como la memoria a largo plazo (LSTM) para el aprendizaje secuencial y las redes neuronales convolucionales (CNNs) para el aprendizaje espacial de rasgos, así como una potencia computacional combinada y el software escalable y sofisticado.
Si bien el uso del aprendizaje de refuerzo profundo en el desarrollo de juegos aún se encuentra en su fase inicial, será una tecnología de juego disruptiva. Los entornos de aprendizaje automático como TensorFlow que se ejecuta en la nube junto con API de integración están facilitando el acceso a los desarrolladores de juegos y a los investigadores de aprendizaje automático.