1. Adaptación de un sistema de búsqueda de palabras clave al castellano
- Author
-
Xu, Junchen, Toledano, Doroteo T., and UAM. Departamento de Tecnología Electrónica y de las Comunicaciones
- Subjects
Voz, Tratamiento automático de la ,Telecomunicaciones ,Reconocimiento automático de la palabra ,Recuperación de la información - Abstract
El objetivo de este proyecto es el desarrollo e implementación de un sistema de búsqueda de palabras clave en castellano, partiendo de un sistema ya existente que funciona en inglés y vietnamita. La base de datos utilizada para entrenar y evaluar el sistema es el corpus Fisher Spanish, perteneciente al Consorcio de Datos Lingüísticos, con sede en Estados Unidos. En primer lugar, se ofrece una breve explicación del sistema de producción del habla humano y el estado del arte en los campos de reconocimiento de voz y de palabras clave. El sistema completo está compuesto por dos subsistemas que se encargan del reconocimiento de voz y búsqueda de palabras clave, respectivamente. El primero es el encargado de generar los lattices, sobre los que el segundo desarrollará la tarea de búsqueda. La modalidad de búsqueda de términos que se utiliza es la llamada Spoken Term Detection (STD). Para evaluar el rendimiento del sistema, se han realizado pruebas de diferente naturaleza para los dos subsistemas. En esta memoria se recogen los resultados de esas pruebas y las conclusiones obtenidas., The objective of this project is to develop and implement a keyword spotting system in Spanish, based on an existing system that works in English and Vietnamese. The database used to train and evaluate the system is the Fisher Spanish corpus, belonging to the Linguistic Data Consortium, which is based in the United States. First of all, a brief description of the human speech production system is provided, followed by the state of the art in speech recognition and keyword spotting. The full system comprises two subsystems, responsible of speech recognition and keyword spotting, respectively. The former is in charge of generating lattices, which are used by the latter to search the keywords. The keyword spotting modality used is called Spoken Term Detection (STD). In order to evaluate the system, different tests have been performed for the two subsystems. The results are captured in this document, as well as the conclusions.
- Published
- 2014