Elhuyar presenta la primera plataforma vasca de transcripción y subtitulación automática de audio y vídeo

EL responsable del proyecto Aditu, Igor Leturia, y el director general de Elhuyar, Jon Abril
EL responsable del proyecto Aditu, Igor Leturia, y el director general de Elhuyar, Jon Abril - ELHUYAR
Publicado: jueves, 12 marzo 2020 18:30

SAN SEBASTIÁN, 12 Mar. (EUROPA PRESS) -

Elhuyar ha presentado este jueves su "reconocedor del habla" que lleva por nombre 'Aditu'. Se trata de una plataforma para la transcripción y subtitulación automática de audios y vídeos, desarrollada por investigadores del equipo de I+D de Elhuyar mediante el uso de "tecnología punta".

El director general de Elhuyar, Jon Abril, junto al responsable del proyecto, Igor Leturia, ha presentado la plataforma en un acto en San Sebastián en el que ha destacado que "las lenguas como el euskera están fuera de las estrategias e intereses de mercado de los gigantes tecnológicos".

"Si queremos que el euskera cuente con una buena vitalidad digital, no podemos dejar que los desarrollos tecnológicos clave para nuestra lengua dependan de lo que hagan o no hagan esos gigantes. Por tanto, es imprescindible que desarrollemos nuestra propia estrategia y profundicemos en la soberanía tecnológica", ha remarcado.

De este modo, ha pedido a las instituciones que "pongan en marcha un ambicioso plan de investigación y desarrollo en tecnologías lingüísticas e inteligencia artificial" para poder desarrollar herramientas como 'Aditu', ya que "será lo que aporte nuevas oportunidades al euskera".

Por su parte, Leturia ha explicado que se han utilizado las tecnologías "más innovadoras" en el reconocimiento del habla como "redes neuronales e inteligencia artificial" y ha detallado que el sistema "es capaz de comprender y procesar tanto el euskera como el castellano".

TRANSCRIPCIONES

De este modo, ha apuntado que 'Aditu' es bilingüe, ya que genera transcripciones y subtítulos tanto en castellano como en euskera, y puede ser utilizado tanto en ficheros pregrabados como en directo. Puede procesar archivos de audio, archivos de vídeo, enlaces a audio y vídeo online (EITB, RTVE, Youtube, Facebook, Instagram). También realiza transcripciones simultáneas, ofreciendo la posibilidad de obtener directamente texto escrito al hablar por el micrófono.

Además del texto de las transcripciones, también genera ficheros de subtítulos (tanto en formato VTT como en formato SRT). Asimismo, se le pueden solicitar "las transcripciones con las marcas de tiempo de cada palabra". La propia plataforma cuenta, además, con una interfaz de edición que permite corregir manualmente las transcripciones y los subtítulos creados automáticamente por 'Aditu'.

La herramienta se puede utilizar en la web aditu.eus, pero también permite su integración en otras webs y plataformas. Su responsable ha destacado que "el sistema es totalmente confidencial y flexible, para poder adaptarse a las aplicaciones de los clientes y gestionar sus datos de forma segura y con total garantía".