Back to Search Start Over

Speech Emotion Recognition: Un sistema de reconeixement d'emocions per veu basat en Ivectors

Authors :
Pérez Pascual, Francesc
Hernando Pericás, Francisco Javier
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
Source :
UPCommons. Portal del coneixement obert de la UPC, Universitat Politècnica de Catalunya (UPC), Recercat. Dipósit de la Recerca de Catalunya, instname
Publication Year :
2017
Publisher :
Universitat Politècnica de Catalunya, 2017.

Abstract

The Speech Emotion Recognition project verses about the design and implementation of an emotion recognition system by analyzing the characteristics of the voice signal, based on the use of the Ivectors technique, which is considered the state of the art in the area in treatment. The use of this technique is compared with two baseline systems (Gaussian Mixture Models and Speaker factors) and it is shown that the degree of recognition improves. The aim of this project is to recognize, with as much precision as possible, a set of 7 emotions, available in the INTERFACE database, partially developed by UPC. To achieve this, we design a series of experiments that are used to test the performance of the system under different situations. El proyecto Speech Emotion Recognition trata del diseño y la implementación de un sistema de reconocimiento de emociones mediante el análisis de las características de la señal de voz, basado en el uso de la técnica de Ivectors, que se considera el estado del arte del área en cuestión. El uso de esta técnica se compara con dos sistemas base (Gaussian Mixture Modelos y Speaker factores) y se demuestra que el grado de reconocimiento mejora. El objetivo de este proyecto es el de reconocer con la máxima precisión posible un conjunto de 7 emociones, disponibles en la base de datos INTERFACE, desarrollada parcialmente por la UPC. Para lograrlo, se diseñan una serie de experimentos que se utilizan para probar el rendimiento del sistema bajo diferentes casuísticas. El projecte Speech Emotion Recognition tracta del disseny i la implementació d'un sistema de reconeixement d'emocions mitjançant l'anàlisi de les característiques de la senyal de veu, basat en l'ús de la tècnica d'Ivectors, que es considera l'estat de l'art de l'àrea en qüestió. L'ús d'aquesta tècnica es compara amb dos sistemes base (Gaussian Mixture Models i Speaker factors) i es demostra que el grau de reconeixement millora. L'objectiu d'aquest projecte és el de reconèixer amb la màxima precisió possible un conjunt de 7 emociones, disponibles en la base de dades INTERFACE, desenvolupada parcialment per la UPC. Per a assolir-lo, es dissenyen un seguit d'experiments que s'utilitzen per probar el rendiment del sistema sota diferents casuístiques.

Details

Language :
Spanish; Castilian
Database :
OpenAIRE
Journal :
UPCommons. Portal del coneixement obert de la UPC, Universitat Politècnica de Catalunya (UPC), Recercat. Dipósit de la Recerca de Catalunya, instname
Accession number :
edsair.dedup.wf.001..3e2aca7daa4cb56f5f3896e5122fdeed