The Finals reconoce que utiliza una IA para generar sus voces y ahorrar tiempo en el desarrollo. No ha gustado demasiado

Embark Studios combina actores profesionales con conversión de texto a voz para sus audios

The Finals
1 comentario Facebook Twitter Flipboard E-mail

La popularidad de The Finals ha crecido como la espuma durante la beta abierta que Embark Studios ha lanzado en PS5, Xbox Series y Steam. Cientos de miles de jugadores se han reunido cada día para disfrutar de los tiroteos multijugador de los veteranos creadores de Battlefield, pero la comunidad ha arqueado la ceja.

Varios usuarios comenzaron a notar que las voces que podemos escuchar durante las partidas no suenan todo lo naturales que deberían. Tras varias personas apuntado en este sentido, finalmente la desarrolladora se ha pronunciado al respecto reconociendo que sí han utilizado una IA para generarlas, aunque con matices.

El programa usado se llama TTS y permite combinar voces interpretadas por seres humanos con conversión de texto a voz, tal y como apunta Sven Grundberg, director de comunicaciones de Embark, en declaraciones a Axios. El responsable indica que, si bien los actores reales ofrecen una "profundidad a nuestros mundos de juego que la tecnología no puede emular", en otras ocasiones necesitan recursos sonoros con mayor celeridad.

"Especialmente en lo que respecta a las llamadas de acción contextual dentro del juego, TTS nos permite tener locuciones personalizadas donde de otro modo no podríamos debido a la velocidad de implementación", explica Grundberg. Esto mismo es lo que han relatado Carl Strandberg y Andreas Almström, diseñadores de sonido del título.

"Usamos inteligencia artificial con algunas excepciones, por lo que todas las voces de los concursantes, como los ladridos y los locutores de voz en off, son generadas por texto a voz por IA. El resto de las voces para cosas misceláneas, como los gruñidos y los sonidos de dolor, se hacen en nuestro estudio.
La razón por la que elegimos este enfoque es que la inteligencia artificial para texto a voz finalmente es extremadamente poderosa. Nos lleva lo suficientemente lejos en términos de calidad y nos permite ser extremadamente reactivos a nuevas ideas... si un diseñador de juegos tiene una nueva idea para un modo de juego, podemos tener una locución que la represente en cuestión de horas en lugar de meses".

Por ejemplo, en el caso de The Finals, las voces generadas por IA resultan en una combinación entre actores profesionales y voces de empleados de Embark. "Hacer juegos sin actores no es un objetivo final para Embark. La tecnología TTS ha introducido nuevas formas de trabajar juntos", señala Grundberg.

En VidaExtra | Estos son los mejores FPS multijugador y de historia que puedes jugar

En VidaExtra | Me aburro: 13 momentos emocionantes que los FPS han matado por repetitivos

Inicio