71 results on '"Salavedra Molí, Josep"'
Search Results
2. Señales y sistemas : apuntes de la asignatura
- Author
-
Rocadenbosch Burillo, Francisco, Salavedra Molí, Josep, Rocadenbosch Burillo, Francisco, and Salavedra Molí, Josep
- Abstract
2022/2023, 1
- Published
- 2022
3. Examen Final
- Author
-
Cabrera Estanyol, Ferran de, Molina Oliveras, Francesc, Liesegang Maria, Sergi, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Cabrera Estanyol, Ferran de, Molina Oliveras, Francesc, Liesegang Maria, Sergi, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
- Abstract
Resolved
- Published
- 2021
4. Examen final del quadrimestre de primavera, curs 2018-2019: enunciat i solucions genèriques
- Author
-
Gasull Llampallas, Antoni, Liesegang Maria, Sergi, Molina Oliveras, Francesc, Sala Álvarez, José, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Liesegang Maria, Sergi, Molina Oliveras, Francesc, Sala Álvarez, José, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
- Abstract
Examen final, del qual existeix la solució ampliada del professor Sisco Vallverdú Bayés, Resolved
- Published
- 2019
5. Examen final de reavaluació, curs 2018-2019: enunciat i solucions genèriques
- Author
-
Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Sayrol Clols, Elisa, Rey Micolau, Francesc, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Sayrol Clols, Elisa, Rey Micolau, Francesc, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
- Abstract
Examen final, del qual existeix la resolució detallada del professor Sisco Vallverdú Bayés, Resolved
- Published
- 2019
6. Examen final del quadrimestre de tardor, curs 2017-2018: enunciat
- Author
-
Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Rey Micolau, Francesc, Sala Álvarez, José, Salavedra Molí, Josep, Sayrol Clols, Elisa, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Rey Micolau, Francesc, Sala Álvarez, José, Salavedra Molí, Josep, Sayrol Clols, Elisa, and Vallverdú Bayés, Sisco
- Abstract
Examen final, del qual existeix la resolució detallada del professor Sisco Vallverdú Bayés
- Published
- 2018
7. Jornada de Docència 2017
- Author
-
Universitat Politècnica de Catalunya. Departament de Matemàtiques, Daza Fernandez, Vanesa, Pascual Gainza, Pere, Carmona Mejías, Ángeles, Salavedra Molí, Josep, Barrera, Marc de la, Sáez Moreno, Germán, Saludes Closa, Jordi, Antonijuan Rull, Josefina, Prat Farran, Joana d'Arc, Universitat Politècnica de Catalunya. Departament de Matemàtiques, Daza Fernandez, Vanesa, Pascual Gainza, Pere, Carmona Mejías, Ángeles, Salavedra Molí, Josep, Barrera, Marc de la, Sáez Moreno, Germán, Saludes Closa, Jordi, Antonijuan Rull, Josefina, and Prat Farran, Joana d'Arc
- Abstract
El dimarts 27 de juny de 2017 va tenir lloc la segona jornada docent del Departament de Matemàtiques de la UPC amb l'objectiu de debatre i reflexionar sobre l'ús de diferents tecnologies en la docència universitària de les Matemàtiques. Comitè organitzador (MAT): Maria Alberich, Santiago Boza, Jordi Guàrdia, Paz Morillo La jornada compta amb el suport del Departament de Matemàtiques, la Facultat de Matemàtiques i Estadística i l'Institut de Ciències de l'Educació., 9h45 h: Obertura de la jornada 10:00 -11:00 h: Conferència plenària “Estudiants participatius: realitat o ficció” Vanesa Daza (Univ. Pompeu Fabra). Parlarem de diferents experiències portades a terme a l’Escola Superior Politècnica de la Universitat Pompeu Fabra amb el principal objectiu de fomentar l’aprenentatge dels estudiants a partir de la seva implicació i participació. Introducció de jocs a l'aula, l'ús de tablets com a pissarra digital, o la plataforma Piazza són algunes de les experiències que ens permetran reflexionar sobre la implicació dels estudiants a l’aula. 11h30 - 12h30: Taula Rodona “Jo en dic Matemàtiques, tu en dius Mates” Reflexionem sobre els continguts en matemàtiques a les nostres titulacions en enginyeria. Sovint hem d'encabir en poques setmanes de classe i a una mateixa assignatura continguts matemàtics de temàtica diversa. Quin és el nivell d'aprofondiment a cada tema? Respon la solució que hi donem a les necessitats de la titulació? A què renunciem? Com ho quadrem tot plegat? Moderador: Pere Pascual (MAT). Ponents: Ángeles Carmona (MAT), Josep Salavedra (TSC), Marc de la Barrera (ex-estudiant CFIS). 12h45 - 13h30: Tallers: 1. Germán Saéz: "Kahoot! per a les classes de matemàtiques" 2. Jordi Saludes: "Control de versions per a la docència" 3. J. Antonijuan, J. Prat: "Geogebra com a eina d'aprenentatge per projectes a Matemàtiques del Disseny"
- Published
- 2017
8. Examen final del quadrimestre de tardor, curs 2014-2015: enunciat
- Author
-
Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Pascual Iserte, Antonio, Rey Micolau, Francesc, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Pascual Iserte, Antonio, Rey Micolau, Francesc, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
- Abstract
Examen final, del qual existeix una resolució detallada, del professor Sisco Vallverdú Bayés
- Published
- 2015
9. Some fast higher order ar estimation techniques applied to parametric wiener filtering
- Author
-
Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, Hernando Pericás, Francisco Javier, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC] ,Processament de la parla ,Algorismes ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] ,Algorithms - Abstract
Some Speech Enhancement algorithms based on the iterative Wiener filtering Method due to L1m-Oppenheim [2] are presented. In the original Lim-Oppenheim algorithm, speech AR estimation is carried out using classic second-order analysis, but our algorithms consider a more robust AR modelling. Two different strategies of speech AR estimation are presented and both estimators are trying to see as less amount of noise as possible. First one uses a previous One-Sided Autocorrelation computation, that is a pole-preserving function, and the actual SNR m the second-order LPC analysis is increased. Second one combines advantages of Higher-Order Statistics [1] with a linear combination of AR coefficients, belonging to two consecutive overlapped frames, to assess a less disturbed speech estimation.
- Published
- 2004
10. Examen final del quadrimestre de tardor, curs 2013-2014: enunciat
- Author
-
Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Rey Micolau, Francesc, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Rey Micolau, Francesc, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
- Abstract
Examen final, del qual existeix la resolució detallada del professor Sisco Vallverdú Bayés
- Published
- 2014
11. Extensió de l'ample de banda de senyals de veu de banda estreta
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Technische Universität Wien, Doblinger, Gerhard, Salavedra Molí, Josep, Expósito Pérez, Miquel, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Technische Universität Wien, Doblinger, Gerhard, Salavedra Molí, Josep, and Expósito Pérez, Miquel
- Abstract
[ANGLÈS] Many telecommunication systems and internet networks (VoIP systems) transmit narrowband speech signals, i.e. signals with a frequency band from 300-3400 Hz, and a sampling frequency of 8 kHz. In order to improve speech quality, it is desirable to artificially increase the bandwidth on both sides of the frequency spectrum. Typically, we would like to transform narrowband speech to wideband speech with approximately 8 kHz bandwidth, and 16 kHz sampling frequency. In this final degree project, many different techniques of audio bandwidth extension have been developed, from less to more complexity and the improvement of the quality regarding the original signal has been analysed by audio testing. First, nonmodel-based algorithms have been developed, like oversampling and imaging that make use of the spectral components that occur when upsampling. Next model-based algorithm like linear mapping has been implemented. After all, both methods have been compared with a CMOS listening test to show the subjective differences between them., [CASTELLÀ] La mayoría de los sistemas de transmisión de voz en telecomunicaciones y redes de internet (VoIP) transmiten las señales en banda estrecha, es decir, señales cuyas componentes frecuenciales oscilan entre los 300 Hz y los 3400 Hz (utilizando una frecuencia de muestreo de 8 kHz), Para poder mejorar la calidad auditiva de estos señales, existen técnicas que permiten aumentar este ancho de banda hasta los 8000 Hz con una frecuencia de muestreo de 16 kHz. En este trabajo de fin de grado se han analizado diferentes técnicas de ensanchado del ancho de banda sobre señales de banda estrecha, de menor a mayor complejidad, y se han analizado auditivamente las mejoras en la claridad del señal respecto del señal original. Primero, usando sistemas no basados en el modelo fuente-filtro, como por ejemplo, las réplicas en frecuencia que aparecen cuando se interpola un señal. Después, con técnicas basadas en el modelo fuente-filtro como la modulación en frecuencia para el ensanchamiento del señal de excitación o el mapeo lineal para estimar el envolvente espectral del señal. También se han realizado tests auditivos CMOS para mostrar las diferencias subjetivas entre ambas técnicas, además de calcular la distancia Itakura para tener una referencia de una distancia objetiva., [CATALÀ] La majoria dels sistemes de transmissió de veu en telecomunicacions i xarxes d’internet (VoIP) transmeten els senyals en banda estreta, és a dir, senyals amb components freqüencials entre els 300 Hz i els 3400 Hz (utilitzant una freqüència de mostreig de 8 kHz). Per a poder millorar la qualitat auditiva d’aquests senyals, existeixen tècniques que permeten augmentar aquest ample de banda fins als 8000 Hz amb una freqüència de mostreig de 16 kHz. En aquest treball de fi de grau, s’han analitzat diferents tècniques d’eixamplament de l’ample de banda de senyals de banda estreta, de menor a major complexitat i s’ha analitzat auditivament la millora en la claredat del senyal respecte al senyal original. Primer, utilitzant sistemes no basats en el model font-filtre, com per exemple, les rèpliques en freqüència que apareixen quan interpolem un senyal. Després, amb altres tècniques basades en el model font-filtre com per exemple la modulació en freqüència per a l’eixamplament de l’excitació del senyal o el mapeig lineal per a eixamplar l’envolupant espectral del senyal. També s’ha realitzat un test auditiu CMOS per a mostrar les diferències subjectives entre ambdues tècniques. També s'ha calculat la distància Itakura entre els senyals per a tenir una referència d'una distància objectiva entre els senyals.
- Published
- 2014
12. Bandwidth extension of narrowband speech
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Expósito Pérez, Miquel, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Expósito Pérez, Miquel, and Salavedra Molí, Josep
- Abstract
Recently, 4G mobile phone systems have been designed to process wideband speech signals whose sampling frequency is 16 kHz. However, most part of mobile and classical phone network, and current 3G mobile phones, still process narrowband speech signals whose sampling frequency is 8 kHz. During next future, all these systems must be living together. Therefore, sometimes a wideband speech signal (with a bandwidth up to 7,2 kHz) should be estimated from an available narrowband one (whose frequency band is 300-3400 Hz). In this work, different techniques of audio bandwidth extension have been implemented and evaluated. First, a simple non-model-based algorithm (interpolation algorithm) has been implemented. Second, a model-based algorithm (linear mapping) have been designed and evaluated in comparison to previous one. Several CMOS (Comparison Mean Opinion Score) [6] listening tests show that performance of Linear Mapping algorithm clearly overcomes the other one. Results of these tests are very close to those corresponding to original wideband speech signal., Postprint (published version)
- Published
- 2014
13. Senyals i sistemes analògics : una introducció pràctica
- Author
-
Gasull Llampallas, Antoni|||0000-0003-3283-6892, Sayrol Clols, Elisa|||0000-0002-0526-9733, Moreno Bilbao, M. Asunción|||0000-0002-1823-5970, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya, and Sayrol Clols, Elisa
- Subjects
Sistemes digitals i analògics ,Enginyeria de la telecomunicació::Processament del senyal [Àrees temàtiques de la UPC] - Abstract
Aquest material didàctic de caràcter experimental s'adreça a aquells alumnes que s'introdueixen en l'estudi dels senyals i els sistemes analògics tant en el domini temporal com en el de freqüència. Els seus continguts han estat desenvolupats per professorat de l'assignatura Senyals i Sistemes I, que s'imparteix en els estudis que ofereix l'ETSETB. El llibre es divideix en quatre temes. El primer (Introducció als senyals i sistemes) se centra en l'anàlisi dels senyals i sistemes anàlogics i fa èmfasi especialment en els sistemes lineals i invariants. El segon (Transformada de Fourier) estudia la caracterització dels senyals i els sistemes en el domini de la freqüència, a partir de l'anàlisi de la transformada de Fourier i les seves propietats fonamentals. El tercer (Filtres) presenta les quatre tècniques clàssiques de disseny de filtres analògics pel que fa a la funció de transferència. Finalment, el tema quart (Correlació i Espectre) introdueix el concepte de correlació per senyals deterministes. El conjunt de l'obra inclou tant el llibre de continguts experimentals com un programari de simulació. L'estructuració del llibre de continguts experimentals presenta, al principi de cada capítol i també de forma intercalada, resums de la matèria teòrica en què se'n ressalten els conceptes més importants. Després d'aquests resums s'inclouen enunciats d'exercicis, problemes i pràctiques, agrupats segons la temàtica i ordenats segons el grau de dificultat.
- Published
- 2002
14. Musical instrument identification system based on a neurally inspired sound onset modelling
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, University of Edinburgh, Salavedra Molí, Josep, Newton, Michael J., Reinés March, Gabriel, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, University of Edinburgh, Salavedra Molí, Josep, Newton, Michael J., and Reinés March, Gabriel
- Abstract
[ANGLÈS] In this project a musical tone classifier based on a neurally inspired onset model is performed, as many physiological and psychoacoustic evidences reveal the importance of the sound onset in the Human Auditory System, specifically in the fields of coding and recognition of sounds. The human inner ear is simulated: the cochlea is performed with a digital filterbank, the inner hair cells' behaviour is modelled with depressing synapses, and the auditory nerve is emulated with Leaky Integrate-and-Fire (LIF) neurons. After that, the onset spike trains obtained are transformed into a description matrix called onset fingerprint. The database used to test the performance of the system consists in 1020 single-note tones performed with five different instrument's families. The onset fingerprints of all these sounds are used to feed a classification system. Three approaches are made: Classification Trees, Quadratic Discriminant Classifier and Neural Networks. The last one gives a mean success classification rate of 75\%, the same performance as other onset-based classifier methods, but consuming less computing time., [CASTELLÀ] En este proyecto se realiza un clasificador de tonos musicales basado en el modelado del inicio del sonido (onset) inspirado en el comportamiento del nervio auditivo humano, ya que muchas evidencias fisiológicas y psicoacústicas ponen de manifiesto la importancia del inicio del sonido en los procesos de codificación y reconocimiento de sonidos del sistema auditivo humano. Con este propósito, se simula el oído interno humano: la cóclea es realizada con un banco de filtros digitales, el comportamiento de las células ciliadas internas se modela con sinapsis depresivas, y el nervio auditivo es emulado utilizando neuronas integradoras con pérdidas (leaky integrate-and-fire neurons). Una vez localizados temporalmente los inicios del sonido para diferentes canales y niveles de amplitud, se construye una matriz de descripción, llamada huella de inicio (onset fingerprint). La base de datos utilizada para evaluar el rendimiento del sistema consta de 1020 tonos realizados con cinco familias de instrumentos musicales diferentes. Las huellas de inicio, calculadas para todos estos sonidos, se utilizan para entrenar y testear tres sistemas de clasificación: árboles de clasificación, análisis discriminante cuadrático y redes neuronales. Este último da una tasa media de acierto del 75%, el mismo rendimiento que otros métodos basados en esta aproximación biológica, pero usando menos tiempo de proceso., [CATALÀ] En aquest projecte es realitza un classificador de tons musicals basat en el modelatge de l'inici del so (onset) inspirat en el comportament del nervi auditiu humà, ja que moltes evidències fisiològiques i psicoacústiques posen de manifest la importància de l'inici del so en els processos de codificació i reconeixement de sons del sistema auditiu humà. Amb aquest propòsit, es simula l'oïda interna dels humans: la còclea és realitzada amb un banc de filtres digitals, el comportament de les cèl·lules ciliades internes es modela amb sinapsis depressives, i el nervi auditiu és emulat utilitzant neurones integradores amb pèrdues (leaky integrate-and-fire neurons). Un cop localitzats temporalment els inicis del so per a diferents canals i nivells d'amplitud, es construeix una matriu de descripció, anomenada empremta d'inici (onset fingerprint). La base de dades utilitzada per avaluar el rendiment del sistema consta de 1020 tons realitzats amb cinc famílies d'instruments musicals diferents. Les empremtes d'inici, calculades per a tots aquests sons, s'utilitzen per entrenar i testejar tres sistemes de classificació: arbres de classificació, anàlisi discriminant quadràtica i xarxes neuronals. Aquest últim dóna una taxa mitjana d'encert del 75%, el mateix rendiment que altres mètodes basats en aquesta aproximació biològica, però emprant menys temps de procés.
- Published
- 2013
15. Examen final del quadrimestre de primavera, curs 2012-2013: enunciat
- Author
-
Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Nadeu Camprubí, Climent, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, Sayrol Clols, Elisa, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Nadeu Camprubí, Climent, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, Sayrol Clols, Elisa, and Vallverdú Bayés, Sisco
- Published
- 2013
16. Examen final del quadrimestre de tardor, curs 2011-2012: enunciat
- Author
-
Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Nogueiras Rodríguez, Albino, and Salavedra Molí, Josep
- Published
- 2012
17. Examen final del quadrimestre de primavera, curs 2011-2012: enunciat
- Author
-
Gasull Llampallas, Antoni, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
- Published
- 2012
18. Una aproximación experimental a las señales y sistemas analógicos
- Author
-
Sayrol Clols, Elisa|||0000-0002-0526-9733, Gasull Llampallas, Antoni|||0000-0003-3283-6892, Moreno Bilbao, M. Asunción|||0000-0002-1823-5970, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. GPI - Grup de Processament d'Imatge i Vídeo, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
Signal processing ,Teaching ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] ,Tractament del senyal ,Ensenyament - Abstract
Se presenta en este artículo un material docente para la enseñanza de las señales y los sistemas analógicos. El enfoque que se ha dado es eminentemente aplicado. Se presenta un conjunto muy completo de ejercicios, problemas y simulaciones que se complementan mutuamente. A parte del contenido y su estructuración, la principal característica de este material reside en el software desarrollado que explota de forma exhaustiva las posibilidades gráficas de MATLAB. Se proporciona una interfície muy amigable y potente para realizar las experiencias que se proponen.
- Published
- 2000
19. Predictive neural networks applied to phoneme recognition
- Author
-
Freitag, Fèlix, Monte Moreno, Enrique, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. CNDS - Xarxes de Computadors i Sistemes Distribuïts, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
ComputingMethodologies_PATTERNRECOGNITION ,Computer Science::Sound ,Processament de la parla ,Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC] ,Computer Science::Computation and Language (Computational Linguistics and Natural Language and Speech Processing) ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] - Abstract
In this paper a phoneme recognition system based on predictive neural networks is proposed. Neural networks are used to predict observation vectors of speech frames. The obtained prediction error is used for phoneme recognition as 1) distortion measure on the frame level and 2) as feature, which is statistically modeled by the Rayleigh distribution. Continuous speech phoneme recognition experiments are performed different settings of the system are evaluated.
- Published
- 1997
- Full Text
- View/download PDF
20. Third-order cumulant-based wiener filtering algorithm applied to robust speech recognition
- Author
-
Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
Computer Science::Sound ,Filters and filtration ,Processament de la parla ,Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC] ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] ,Filtres i filtració - Abstract
In previous works [5], [6], we studied some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim [2], where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors: a cumulant-based Wiener Filtering (AR3_IF) is applied to Robust Speech Recognition. A low complexity approach of this algorithm is tested in presence of bathroom water noise and its performance is compared to classical Spectral Subtraction method. Some results are presented when training task of the speech recognition system (HTK-MFCC) is executed under clean and noisy conditions. These results show a lower sensitivity to the presence of water noise when applying AR3_IF algorithm inside of a speech recognition task.
- Published
- 1996
21. Codificación APVQ de voz en banda ancha para velocidades entre 16 y 32 KBPS
- Author
-
Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
Processament de la parla ,Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC] ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] - Abstract
This paper describes a coding scheme for broadband speech (sampling frequency 16KHz). We present a wideband speech encoder called APVQ (Adaptive Predictive Vector Quantization). It combines Subband Coding, Vector Quantization and Adaptive Prediction as it is represented in Fig. I. Speech signal is split in 16 subbands by means of a QMF filter bank and so every subband is 500Hz wide. This APVQ encoder can be seen as a vectorial extension of a conventional ADPCM encoder. In this scheme, signal vector is formed with one sample of the normalized prediction error signal coming from different subbands and then it is vector quantized. Prediction error signal is normalized by its gain and normalized prediction error signal is the input of the VQ and therefore an adaptive Gain-Shape VQ is considered. This APVQ Encoder combines the advantages of Scalar Prediction and those of Vector Quantization. We evaluate wideband speech coding in the range from 1 to 2 bits/sample, that leads to a coding rate from 16 to 32 kbps.
- Published
- 1996
22. Some fast higher order ar estimation techniques applied to parametric wiener filtering
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, Hernando Pericás, Francisco Javier, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, and Hernando Pericás, Francisco Javier
- Abstract
Some Speech Enhancement algorithms based on the iterative Wiener filtering Method due to L1m-Oppenheim [2] are presented. In the original Lim-Oppenheim algorithm, speech AR estimation is carried out using classic second-order analysis, but our algorithms consider a more robust AR modelling. Two different strategies of speech AR estimation are presented and both estimators are trying to see as less amount of noise as possible. First one uses a previous One-Sided Autocorrelation computation, that is a pole-preserving function, and the actual SNR m the second-order LPC analysis is increased. Second one combines advantages of Higher-Order Statistics [1] with a linear combination of AR coefficients, belonging to two consecutive overlapped frames, to assess a less disturbed speech estimation., Peer Reviewed, Postprint (published version)
- Published
- 2004
23. Robust hos-based techniques applied to speech recognition and enhancement
- Author
-
Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
Computer Science::Sound ,Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC] ,Processament de la parla ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] - Abstract
We study some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim [2], where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors, where information of previous speech frames is taken to initiate speech AR modelling of the current frame. Two parameters are introduced to dessign Wiener filter at first iteration of this iterative algorithm. These parameters are the Interframe Factor (IF) and the Previous Frame Iteration (PFI). A detailed study of them shows they allow a very important noise suppression after processing only first iteration of this algorithm, without any appreciable increase of distortion. Finally, the simplest cumulant-based algorithm is applied to Speech Recognition and some preliminary results are presented.
- Published
- 1995
24. Técnicas de estimación AR usando distintas metodologías de orden superior en ambientes reales
- Author
-
Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
Processament de la parla ,Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC] ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] - Abstract
Some Speech Enhancement algorithms based on the iterative Wiener filtering Method due to LimOppenheim [2] are presented. In the original Lim-Oppenheim algorithm, AR spectral estimation of speech is carried out using a second-order analysis, but our algorithms consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors. Information of previous speech frames is taken to initiate speech AR modeling of the current frame and, so, two parameters are introduced to dessign Wiener Filter at first iteration of every frame. Another algorithm obtains speech AR estimation in the autocorrelation domain. Both algorithms are compared to classical second-order algorithm (AR2) and third-onler cumulant-based algorithm (AR3), when car noise disturbs clean speech signal. A detailed study shows that boths techniques significantly increase noise suppression after first iteration processing and, therefore, convergence speed of this iterative algorithm is strongly accelerated.
- Published
- 1995
25. Speech recognition and enhancement using some robust HOS-based AR estimation techniques
- Author
-
Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
education ,Processament de la parla ,Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC] ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] - Published
- 1995
26. Técnicas de Speech Enhancement considerando estadísticas de orden superior
- Author
-
Salavedra Molí, Josep Maria, Masgrau Gómez, Enrique, and Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
- Subjects
Codificadors de veu ,estadístiques d'ordre superior ,filtrat de wiener ,processament del senyal de veu ,Processament de la parla ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] ,reducció de soroll ,621.3 - Abstract
Las prestaciones de muchos sistemas de procesado de vozse degradan rápidamente en aplicaciones reales ante lapresencia de ruido. Para solucionar este problema lastécnicas de speech enhancement pretenden reducir esteruido realzando la señal de voz degradada. Se hanconsiderado las técnicas basadas en un filtrado dewiener. Tradicionalmente, estas técnicas han mostradounas prestaciones superiores a otras metodologías, comopor ejemplo la sustracción espectral, sin embargo, estastécnicas de filtrado de wiener hacen uso de lasestadísticas de segundo orden (función auto correlación)y, en consecuencia, presentan una elevada sensibilidad alruido. Una aportación importante de este trabajo consisteen la incorporación de las estadísticas de orden superioral proceso de estimación de la voz a partir de la señal de voz ruidosa.
- Published
- 1995
27. Some robust speech enhancement techniques using higher order AR estimation
- Author
-
Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
education ,Processament de la parla ,Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC] ,Algorismes ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] ,Algorithms - Published
- 1994
28. Predicción lineal de la parte causal de la autocorrelación para la identificación del locutor en ambientes ruidosos
- Author
-
Hernando Pericás, Francisco Javier, Nadeu Camprubí, Climent, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
Telecomunicació ,education ,Telecommunication ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] - Published
- 1994
29. Técnicas robustas para un modelo ar de voz usando estadísticas de orden superior
- Author
-
Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
education ,Processament de la parla ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] - Published
- 1994
30. Senyals i sistemes analògics : una introducció pràctica
- Author
-
Universitat Politècnica de Catalunya, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
- Abstract
Aquest material didàctic de caràcter experimental s'adreça a aquells alumnes que s'introdueixen en l'estudi dels senyals i els sistemes analògics tant en el domini temporal com en el de freqüència. Els seus continguts han estat desenvolupats per professorat de l'assignatura Senyals i Sistemes I, que s'imparteix en els estudis que ofereix l'ETSETB. El llibre es divideix en quatre temes. El primer (Introducció als senyals i sistemes) se centra en l'anàlisi dels senyals i sistemes anàlogics i fa èmfasi especialment en els sistemes lineals i invariants. El segon (Transformada de Fourier) estudia la caracterització dels senyals i els sistemes en el domini de la freqüència, a partir de l'anàlisi de la transformada de Fourier i les seves propietats fonamentals. El tercer (Filtres) presenta les quatre tècniques clàssiques de disseny de filtres analògics pel que fa a la funció de transferència. Finalment, el tema quart (Correlació i Espectre) introdueix el concepte de correlació per senyals deterministes. El conjunt de l'obra inclou tant el llibre de continguts experimentals com un programari de simulació. L'estructuració del llibre de continguts experimentals presenta, al principi de cada capítol i també de forma intercalada, resums de la matèria teòrica en què se'n ressalten els conceptes més importants. Després d'aquests resums s'inclouen enunciats d'exercicis, problemes i pràctiques, agrupats segons la temàtica i ordenats segons el grau de dificultat., 2a ed.
- Published
- 2002
31. Senyals i sistemes analògics : una introducció pràctica
- Author
-
Universitat Politècnica de Catalunya, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
- Abstract
Aquest material didàctic de caràcter experimental s'adreça a aquells alumnes que s'introdueixen en l'estudi dels senyals i els sistemes analògics tant en el domini temporal com en el de freqüència. Els seus continguts han estat desenvolupats per professorat de l'assignatura Senyals i Sistemes I, que s'imparteix en els estudis que ofereix l'ETSETB. El llibre es divideix en quatre temes. El primer (Introducció als senyals i sistemes) se centra en l'anàlisi dels senyals i sistemes anàlogics i fa èmfasi especialment en els sistemes lineals i invariants. El segon (Transformada de Fourier) estudia la caracterització dels senyals i els sistemes en el domini de la freqüència, a partir de l'anàlisi de la transformada de Fourier i les seves propietats fonamentals. El tercer (Filtres) presenta les quatre tècniques clàssiques de disseny de filtres analògics pel que fa a la funció de transferència. Finalment, el tema quart (Correlació i Espectre) introdueix el concepte de correlació per senyals deterministes. El conjunt de l'obra inclou tant el llibre de continguts experimentals com un programari de simulació. L'estructuració del llibre de continguts experimentals presenta, al principi de cada capítol i també de forma intercalada, resums de la matèria teòrica en què se'n ressalten els conceptes més importants. Després d'aquests resums s'inclouen enunciats d'exercicis, problemes i pràctiques, agrupats segons la temàtica i ordenats segons el grau de dificultat.
- Published
- 2001
32. Speech enhancement by adaptive wiener filtering based on cumulant ar modelling
- Author
-
Masgrau Gómez, Enrique José, Salavedra Molí, Josep, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
- Subjects
education ,Processament de la parla ,Algorismes ,Speech processing systems ,Enginyeria de la telecomunicació [Àrees temàtiques de la UPC] ,Algorithms - Published
- 1992
33. Una aproximación experimental a las señales y sistemas analógicos
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. GPI - Grup de Processament d'Imatge i Vídeo, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. GPI - Grup de Processament d'Imatge i Vídeo, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
- Abstract
Se presenta en este artículo un material docente para la enseñanza de las señales y los sistemas analógicos. El enfoque que se ha dado es eminentemente aplicado. Se presenta un conjunto muy completo de ejercicios, problemas y simulaciones que se complementan mutuamente. A parte del contenido y su estructuración, la principal característica de este material reside en el software desarrollado que explota de forma exhaustiva las posibilidades gráficas de MATLAB. Se proporciona una interfície muy amigable y potente para realizar las experiencias que se proponen., Peer Reviewed, Postprint (published version)
- Published
- 2000
34. Distortion effects of several cumulant-based wiener filtering algorithms
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, and Salavedra Molí, Josep
- Abstract
Some Single-Microphone Speech Enhancement algorithms based on the iterative Wiener filtering Method due to Lim-Oppenheim [2] are evaluated. In the original Lim-Oppenheim algorithm, AR spectral estimation of speech is carried out using a second-order analysis, but our algorithms consider an AR estimation from a cumulant analysis. This work extends some preceding papers due to the authors [4], [5]. Third- and fourth-order cumulant-based algorithms are compared to classical second-order one. This comparison is evaluated by considering three different noisy environments. A detailed study based on a frame-by-frame analysis leads to an optimum iteration of each algorithm as a trade-off between noise reduction and distortion effects. Voiced and unvoiced sounds are separately discussed. We conclude that third-order cumulant-based algorithm offers a more valuable performance than the others., Peer Reviewed, Postprint (published version)
- Published
- 1999
35. Predictive neural networks applied to phoneme recognition
- Author
-
Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. CNDS - Xarxes de Computadors i Sistemes Distribuïts, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Freitag, Fèlix, Monte Moreno, Enrique, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. CNDS - Xarxes de Computadors i Sistemes Distribuïts, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Freitag, Fèlix, Monte Moreno, Enrique, and Salavedra Molí, Josep
- Abstract
In this paper a phoneme recognition system based on predictive neural networks is proposed. Neural networks are used to predict observation vectors of speech frames. The obtained prediction error is used for phoneme recognition as 1) distortion measure on the frame level and 2) as feature, which is statistically modeled by the Rayleigh distribution. Continuous speech phoneme recognition experiments are performed different settings of the system are evaluated., Peer Reviewed, Postprint (published version)
- Published
- 1997
36. Wideband-speech APVQ coding from 16 to 32 KBPS
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, and Salavedra Molí, Josep
- Abstract
This paper describes a coding scheme for broadband speech (sampling frequency 16KHz). We present a wideband speech encoder called APVQ (Adaptive Predictive Vector Quantization). It combines Subband Coding, Vector Quantization and Adaptive Prediction as it is represented in Fig.1. Speech signal is split in 16 subbands by means of a QMF filter bank and so every subband is 500Hz wide. This APVQ encoder can be seen either as a vectorial extension of a conventional ADPCM encoder or as a scalar Subband AVPC encoder [1],[3]. In this scheme, signal vector is formed with one sample of the normalized prediction error signal coming from different subbands and then it is vector quantized. Prediction error signal is normalized by its gain and normalized prediction error signal is the input of the VQ and therefore an adaptive Gain-Shape VQ is considered. This APVQ Encoder combines the advantages of Scalar Prediction and those of Vector Quantization. We evaluate wideband speech coding in the range from 1 to 2 bits/sample., Peer Reviewed, Postprint (published version)
- Published
- 1997
37. Third-order cumulant-based wiener filtering algorithm applied to robust speech recognition
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, and Hernando Pericás, Francisco Javier
- Abstract
In previous works [5], [6], we studied some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim [2], where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors: a cumulant-based Wiener Filtering (AR3_IF) is applied to Robust Speech Recognition. A low complexity approach of this algorithm is tested in presence of bathroom water noise and its performance is compared to classical Spectral Subtraction method. Some results are presented when training task of the speech recognition system (HTK-MFCC) is executed under clean and noisy conditions. These results show a lower sensitivity to the presence of water noise when applying AR3_IF algorithm inside of a speech recognition task., Peer Reviewed, Postprint (published version)
- Published
- 1996
38. Codificación APVQ de voz en banda ancha para velocidades entre 16 y 32 KBPS
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, and Masgrau Gómez, Enrique José
- Abstract
This paper describes a coding scheme for broadband speech (sampling frequency 16KHz). We present a wideband speech encoder called APVQ (Adaptive Predictive Vector Quantization). It combines Subband Coding, Vector Quantization and Adaptive Prediction as it is represented in Fig. I. Speech signal is split in 16 subbands by means of a QMF filter bank and so every subband is 500Hz wide. This APVQ encoder can be seen as a vectorial extension of a conventional ADPCM encoder. In this scheme, signal vector is formed with one sample of the normalized prediction error signal coming from different subbands and then it is vector quantized. Prediction error signal is normalized by its gain and normalized prediction error signal is the input of the VQ and therefore an adaptive Gain-Shape VQ is considered. This APVQ Encoder combines the advantages of Scalar Prediction and those of Vector Quantization. We evaluate wideband speech coding in the range from 1 to 2 bits/sample, that leads to a coding rate from 16 to 32 kbps., Peer Reviewed, Postprint (published version)
- Published
- 1996
39. APVQ encoder applied to wideband speech coding
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, and Masgrau Gómez, Enrique José
- Abstract
The paper describes a coding scheme for broadband speech (sampling frequency 16 KHz). The authors present a wideband speech encoder called APVQ (adaptive predictive vector quantization). It combines subband coding, vector quantization and adaptive prediction. The speech signal is split into 16 subbands by means of a QMF filter bank and so every subband is 500 Hz wide. This APVQ encoder can be seen as a vectorial extension of a conventional ADPCM encoder. In this scheme, signal vector is formed with one sample of the normalized prediction error signal coming from different subbands and then it is vector quantized. The prediction error signal is normalized by its gain and normalized prediction error signal is the input of the VQ and therefore an adaptive gain-shape VQ is considered. This APVQ encoder combines the advantages of scalar prediction and those of vector quantization. They evaluate wideband speech coding in the range from 1.5 to 2 bits/sample, that leads to a coding rate from 24 to 32 kbps., Peer Reviewed, Postprint (published version)
- Published
- 1996
40. Técnicas de estimación AR usando distintas metodologías de orden superior en ambientes reales
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, and Vallverdú Bayés, Sisco
- Abstract
Some Speech Enhancement algorithms based on the iterative Wiener filtering Method due to LimOppenheim [2] are presented. In the original Lim-Oppenheim algorithm, AR spectral estimation of speech is carried out using a second-order analysis, but our algorithms consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors. Information of previous speech frames is taken to initiate speech AR modeling of the current frame and, so, two parameters are introduced to dessign Wiener Filter at first iteration of every frame. Another algorithm obtains speech AR estimation in the autocorrelation domain. Both algorithms are compared to classical second-order algorithm (AR2) and third-onler cumulant-based algorithm (AR3), when car noise disturbs clean speech signal. A detailed study shows that boths techniques significantly increase noise suppression after first iteration processing and, therefore, convergence speed of this iterative algorithm is strongly accelerated., Peer Reviewed, Postprint (published version)
- Published
- 1995
41. Robust HOS-based techniques applied to speech recognition and enchancement
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, and Moreno Bilbao, M. Asunción
- Abstract
We study some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim [2], where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors, where information of previous speech frames is taken to initiate speech AR modelling of the current frame. Two parameters arc introduced to dessign Wiener filter at first iteration of this iterative algorithm. These parameters arc the Interframe Factor (IF) and the Previous Frame Iteration (PFI). A detailed study of them shows they ailow a very important noise suppression after processing only first iteration of this algorithm, without any appreciable increase of distortion. Finally the simplest cumulant-based algorithm is applied to Speech Recognition and some preliminary results are presented., Peer Reviewed, Postprint (published version)
- Published
- 1995
42. Técnicas de Speech Enhancement considerando estadísticas de orden superior
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Masgrau Gómez, Enrique, Salavedra Molí, Josep Maria, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Masgrau Gómez, Enrique, and Salavedra Molí, Josep Maria
- Abstract
Las prestaciones de muchos sistemas de procesado de vozse degradan rápidamente en aplicaciones reales ante lapresencia de ruido. Para solucionar este problema lastécnicas de speech enhancement pretenden reducir esteruido realzando la señal de voz degradada. Se hanconsiderado las técnicas basadas en un filtrado dewiener. Tradicionalmente, estas técnicas han mostradounas prestaciones superiores a otras metodologías, comopor ejemplo la sustracción espectral, sin embargo, estastécnicas de filtrado de wiener hacen uso de lasestadísticas de segundo orden (función auto correlación)y, en consecuencia, presentan una elevada sensibilidad alruido. Una aportación importante de este trabajo consisteen la incorporación de las estadísticas de orden superioral proceso de estimación de la voz a partir de la señal de voz ruidosa., Postprint (published version)
- Published
- 1995
43. Speech recognition and enhancement using some robust HOS-based AR estimation techniques
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, and Moreno Bilbao, M. Asunción
- Abstract
Peer Reviewed, Postprint (published version)
- Published
- 1995
44. Codificación APVQ de voz en banda ancha usando asignación dinámica de bits
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, and Salavedra Molí, Josep
- Abstract
This paper describes a coding scheme for broadband speech. It can be seen as a vectorial extension of a conventional ADPCM encoder. In this scheme, signal vector is formed with one sample of the normalized prediction error of each subband and then it is vector quantized. It combines the advantages of the scalar prediction and those of vector quantization (VQ). We handle the high vector dimensionality by using a multiVQ. It requires a previous subvector division and an adequate bit assignment among them. This scheme shows a high capacity to drive large dynamic range signals like broadband speech. Predictor and codebook dessigns are discussed. Some results about speech prediction and coding are reported., Peer Reviewed, Postprint (published version)
- Published
- 1995
45. Técnicas robustas para un modelo ar de voz usando estadísticas de orden superior
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, and Moreno Bilbao, M. Asunción
- Abstract
Peer Reviewed, Postprint (published version)
- Published
- 1994
46. Predicción lineal de la parte causal de la autocorrelación para la identificación del locutor en ambientes ruidosos
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Hernando Pericás, Francisco Javier, Nadeu Camprubí, Climent, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Hernando Pericás, Francisco Javier, Nadeu Camprubí, Climent, and Salavedra Molí, Josep
- Abstract
Peer Reviewed, Postprint (published version)
- Published
- 1994
47. Some robust speech enhancement techniques using higher order AR estimation
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, and Moreno Bilbao, M. Asunción
- Abstract
Peer Reviewed, Postprint (published version)
- Published
- 1994
48. Robust coefficients of a higher order AR modelling in a speech enhancement system using parameterized Wiener filtering
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, Jove, X, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, and Jove, X
- Abstract
We study some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim (1978), where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors, providing a generalization of third- and fourth-order algorithms by means of adding two parameters in the general expression of Wiener filtering. These parameters allow a better control of their performance. Some results are presented considering AWGN but listening tests give similar performance when other noises (diesel engine) are considered., Peer Reviewed, Postprint (published version)
- Published
- 1994
49. Codificación APVQ-extendida de voz de banda ancha
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Masgrau Gómez, Enrique José, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Masgrau Gómez, Enrique José, and Salavedra Molí, Josep
- Abstract
This paper describes a coding scheme for broadband speech. It can be seen as a vectorial extension of an conventional ADPCM encoder. In this scheme, the vector signal is formed with one sample of the normalizaed prediction error of each subband and then, it is vector quantized. It combines the advantages of the scalar prediction and of the vector quantization (VQ) . We handle the high vector dimensionality by using a multi-VQ. It requires a previous subvector division and an adequate bit assignement among them. This scheme shows an high capacity to drive large dynamic range signals like broadband speech., Peer Reviewed, Postprint (published version)
- Published
- 1994
50. Variable frame length of a higher order speech AR estimation in a speech enhancement system
- Author
-
Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, and Estarellas, J
- Abstract
Peer Reviewed, Postprint (published version)
- Published
- 1994
Catalog
Discovery Service for Jio Institute Digital Library
For full access to our library's resources, please sign in.