Google muestra cómo la tecnología de generación de imágenes mediante IA ofrece una forma totalmente nueva de crear y ejecutar juegos.
Todos hemos visto cómo los generadores de imágenes por IA pueden producir imágenes de lo que quieras. Pero, ¿y si utilizáramos la misma tecnología para generar imágenes de un juego?
Investigadores de Google acaban de utilizar este concepto para desarrollar un modelo de IA capaz de simular el clásico shooter para PC Doom (1993), pero sin utilizar código informático del propio juego. En su lugar, el modelo de los investigadores produce imágenes fijas del juego, como lo hace un generador de imágenes de IA, con la diferencia de que puede hacerlo en tiempo real a más de 20 fotogramas por segundo para ofrecer una experiencia jugable.
El modelo se llama GameNGen y es el tema de un nuevo artículo de investigadores de Google y la Universidad de Tel Aviv: «¿Puede un modelo neuronal que funciona en tiempo real simular un juego complejo con gran calidad? En este trabajo demostramos que la respuesta es sí», escriben. «En concreto, demostramos que un videojuego complejo, el icónico Doom, puede ejecutarse en una red neuronal».
En el artículo, los investigadores señalan que un juego de ordenador funciona fundamentalmente así: el jugador realiza una acción o introduce un dato, el estado del juego se actualiza en consecuencia y, a continuación, se muestra el resultado en la pantalla. Este «bucle de juego» crea la ilusión de estar en un mundo virtual interactivo, aunque el ordenador se limite a mostrar imágenes cambiantes en la pantalla.
Los investigadores utilizaron la versión 1.4 de Stable Diffusion, un generador de imágenes de IA de código abierto. También desarrollaron un modelo de IA independiente para jugar al Doom real mientras grababan las imágenes de un total de 900 millones de fotogramas. Los datos de entrenamiento resultantes los utiliza Stable Diffusion para generar imágenes del juego, adaptándolas a medida que recibe información del jugador.
El equipo ha publicado varios vídeos de GameNGen renderizando Doom, incluidas imágenes de jugadores humanos probándolo. Los resultados muestran que el modelo de IA es capaz de simular con precisión el clásico shooter de PC tanto visualmente como a nivel de jugabilidad. Por ejemplo, el modelo puede simular una puerta que se abre cuando el jugador se acerca y una bola de fuego que golpea al jugador, quitándole algo de salud.
Sin embargo, GameNGen también contiene algunas limitaciones importantes. «El modelo solo tiene acceso a algo más de 3 segundos de historia», escriben los investigadores. Como resultado, los enemigos y objetos pueden aparecer de la nada y desaparecer segundos después. No obstante, GameNGen es capaz de crear la ilusión de que puede recordar el mundo del juego porque cada imagen renderizada permite al modelo deducir la munición, el estado de salud, las armas y la ubicación del jugador.
El otro problema es que un juego de ordenador tradicional puede ser bastante complejo. Además de renderizar píxeles en una pantalla, un juego puede contener diálogos, numerosos personajes, junto con una historia y una mecánica de juego que pueden suceder fuera de la pantalla. Pero a pesar de las limitaciones, los investigadores afirman que GameNGen muestra cómo la IA generativa podría transformar el desarrollo de juegos, lo que podría conducir a juegos creados por IA, algo que el CEO de Nvidia también ha predicho que podría ocurrir en los próximos cinco a diez años.
«Por ejemplo, podríamos convertir un conjunto de fotogramas en un nuevo nivel jugable o crear un nuevo personaje solo basándonos en imágenes de ejemplo, sin tener que crear código», escriben los investigadores en su artículo, al tiempo que añaden: «Hoy en día, los videojuegos los programan los humanos. GameNGen es una prueba de concepto de una parte de un nuevo paradigma en el que los juegos son pesos de un modelo neuronal, no líneas de código.»