Emilio
Granell

Conferencia: 

Mejorando la transcripción asistida por ordenador de textos manuscritos con multimodalidad e interacción.

Los sistemas actuales de reconocimiento de lenguaje natural facilitan la  transcripción de documentos digitalizados, tanto en formato de audio, video o imagen. Estos sistemas ofrecen un borrador inicial que puede ser corregido con un esfuerzo menor que el requerido para realizar la transcripción sin asistencia. Sin embargo, incluso los borradores ofrecidos por los sistemas más avanzados basados en técnicas de aprendizaje profundo "Deep Learning" contienen errores. Por lo tanto, la supervisión de estos borradores sigue siendo necesaria para obtener la transcripción correcta. Esta supervisión se puede facilitar utilizando sistemas de transcripción asistida, donde la persona encargada de realizar la transcripción y el sistema automático interactúan y cooperan en el proceso de corrección. Además, el sistema de transcripción interactiva puede combinar diferentes fuentes de información con el objetivo de mejorar su rendimiento.

En esta charla, se presentará un sistema multimodal de transcripción asistida de manuscritos históricos. Veremos que aunque la calidad de la transcripción ofrecida por el sistema de reconocimiento automático de escritura basado en aprendizaje profundo es muy buena, el sistema de  transcripción interactiva ofrece una reducción adicional del esfuerzo de transcripción. Además, también veremos que esta reducción de esfuerzo se incrementa cuando se utiliza el dictado del texto a transcribir sobre un  reconocedor automático del habla, permitiendo de este modo acelerar el proceso de transcripción.

Información:

Emilio trabaja actualmente como ingeniero de investigación y desarrollo  tecnológico en Sciling, una agencia dedicada a facilitar soluciones tecnológicas basadas en aprendizaje automático. En el grupo de investigación Pattern Recognition and Human Language Technologies (PRHLT) de la Universitat Politècnica de València (UPV), Emilio participa en diferentes proyectos de I+D relacionados con inteligencia artificial,reconocimiento de voz y texto manuscrito, ciudades inteligentes, interacción hombre-computadora, sistemas asistenciales de transcripción y combinación multimodal. Es coautor de numerosos artículos publicados en conferencias internacionales, revistas y capítulos de libros, y ha sido revisor y organizador de varias conferencias internacionales. Más información de sus publicaciones en https://orcid.org/0000-0001-5782-7568

Organizan

Nuestros patrocinadores