doxa.comunicación | 29, pp. 255-274 | 269

julio-diciembre de 2019

Renato Essenfelder, João Canavilhas, Haline Costa Maia y Ricardo Jorge Pinto

ISSN: 1696-019X / e-ISSN: 2386-3978

El segundo texto fue generado por el lenguaje computacional AidaLang, que ha sido creado para facilitar la creación de templates de texto. “Con él, puede definir cómo se verán las plantillas de empate, la evolución, la descripción del can-didato, etc. sin tener que cambiar el código de Python y más intuitivamente. Este es el primer paso para luego crear la herramienta que permitirá a un periodista crear plantillas.”, dando así más poder al redactor humano para modificar el output de AIDA (Bottari, 2019).

Según el propio desarrollador, no es fácil clasificar AIDA como un sistema de Inteligencia Artificial, lo que confirma la literatura sobre el tema donde resulta difícil conceptualizar la expresión con claridad. “Lo que tenemos es un lenguaje (AidaLang) que facilita la generación de texto en lenguaje natural” (Bottari, 2019). De acuerdo con el ingeniero, “podemos decir que AIDA no es un sistema de IA, pero no es un sistema de reglas (ifs) puro y simple, ya que tenemos una heurística para los empates”. A saber, el sistema estaría en la frontera entre una IA y una automatización más simple.

La heurística señalada por el desarrollador se basa en la teoría de grafos9, un concepto importante dentro de la progra-mación del lenguaje NLP. Para el proyecto AIDA, se desarrolló un modelo para abarcar candidatos como nodos y empates como aristas, conceptos que describen un camino posible desde cualquier par de A hacia B. El objetivo del problema es encontrar una manera de “comprimir” los empates para que el hablante tenga que leer el menor número de nombres al mencionar los empates.

Por ejemplo, es mejor decir “A y C están vinculados con B” (3 nombres) que decir “A está vinculado con C y B está vinculado con C” (4 nombres). En el modelo, empezamos con un conjunto de empates, por ejemplo, {A} -> {B} y {B} -> {C}. Lo que hace la heurística es tratar de disminuir el número de nodos. Para esto, ella hace las siguientes pruebas:

{A} -> {B} + {B} -> {C} (no puede unirse);

{A} -> {B} + {C} -> {B} => {A, C} -> {B} (se puede unir). (Bottari, 2019).

Para el futuro, los investigadores de Globo están desarrollando una aplicación para automatizar más el flujo de trabajo. La acción más importante comprende a la automatización de la voz en off en un proceso conocido como conversión de texto a voz, que forma parte del grupo de tecnología AI conocido como NLP (Natural-language Processing). Aquí, la automatización de la voz leída por el robot se acompaña de una animación en 3D hecha con computación gráfica (fig. 4). Bottari aclara:

En esta aplicación, los procesos de síntesis de voz se realizan a través del servicio Microsoft Text-to-Speech. Una vez sintetizada, la voz se mapea en visemas (animaciones bucales que corresponden a los fonemas de las palabras) en tiempo real. A su vez, los visemas pueden componer una representación en tiempo real de un personaje, AIDA, que presenta un noticiero. La simulación funciona como un videojuego y se sintetizó con la plataforma Unreal Engine 4, aplicación general que permite generar personajes más realistas. (Bottari, 2019)10.

9 La teoría de grafos es una rama de las matemáticas que estudia las relaciones entre los objetos en un conjunto dado. Para esto usa estructuras llamadas gráfos, con nodos y aristas. Dos nodos están conectados si hay un camino entre ellos. (Biggs et al.,1986).

10 Original: Nesta aplicação os processos de síntese de voz se realizam por meio do serviço Microsoft Text-to-Speech. Uma vez sintetizada, a voz é mapeada em visemas (animações da boca que correspondem aos fonemas das palavras) em tempo real. Por sua vez, os visemas podem compor um render em real-time de uma personagem, a AIDA, que apresenta um telejornal. A simulação funciona como um videogame e foi sintetizada com a plataforma Unreal Engine 4, aplicação generalista que permite gerar personagens mais realistas. (Bottari, 2019).