Author: "Salavedra Molí, Josep" - Searchworks@Jio Institute Digital Library Search Results

Your search keyword '"Salavedra Molí, Josep"' showing total 71 results

Start Over Author "Salavedra Molí, Josep"

71 results on '"Salavedra Molí, Josep"'

1. Señales y sistemas : apuntes de la asignatura

Author: Rocadenbosch Burillo, Francisco, Salavedra Molí, Josep, Rocadenbosch Burillo, Francisco, and Salavedra Molí, Josep
Abstract: 2023/2024, 2, corregida y mejorada
Published: 2023

2. Señales y sistemas : apuntes de la asignatura

Author: Rocadenbosch Burillo, Francisco, Salavedra Molí, Josep, Rocadenbosch Burillo, Francisco, and Salavedra Molí, Josep
Abstract: 2022/2023, 1
Published: 2022

3. Examen Final

Author: Cabrera Estanyol, Ferran de, Molina Oliveras, Francesc, Liesegang Maria, Sergi, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Cabrera Estanyol, Ferran de, Molina Oliveras, Francesc, Liesegang Maria, Sergi, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
Abstract: Resolved
Published: 2021

4. Examen final del quadrimestre de primavera, curs 2018-2019: enunciat i solucions genèriques

Author: Gasull Llampallas, Antoni, Liesegang Maria, Sergi, Molina Oliveras, Francesc, Sala Álvarez, José, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Liesegang Maria, Sergi, Molina Oliveras, Francesc, Sala Álvarez, José, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
Abstract: Examen final, del qual existeix la solució ampliada del professor Sisco Vallverdú Bayés, Resolved
Published: 2019

5. Examen final de reavaluació, curs 2018-2019: enunciat i solucions genèriques

Author: Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Sayrol Clols, Elisa, Rey Micolau, Francesc, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Sayrol Clols, Elisa, Rey Micolau, Francesc, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
Abstract: Examen final, del qual existeix la resolució detallada del professor Sisco Vallverdú Bayés, Resolved
Published: 2019

6. Examen final del quadrimestre de tardor, curs 2017-2018: enunciat

Author: Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Rey Micolau, Francesc, Sala Álvarez, José, Salavedra Molí, Josep, Sayrol Clols, Elisa, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Rey Micolau, Francesc, Sala Álvarez, José, Salavedra Molí, Josep, Sayrol Clols, Elisa, and Vallverdú Bayés, Sisco
Abstract: Examen final, del qual existeix la resolució detallada del professor Sisco Vallverdú Bayés
Published: 2018

7. Jornada de Docència 2017

Author: Universitat Politècnica de Catalunya. Departament de Matemàtiques, Daza Fernandez, Vanesa, Pascual Gainza, Pere, Carmona Mejías, Ángeles, Salavedra Molí, Josep, Barrera, Marc de la, Sáez Moreno, Germán, Saludes Closa, Jordi, Antonijuan Rull, Josefina, Prat Farran, Joana d'Arc, Universitat Politècnica de Catalunya. Departament de Matemàtiques, Daza Fernandez, Vanesa, Pascual Gainza, Pere, Carmona Mejías, Ángeles, Salavedra Molí, Josep, Barrera, Marc de la, Sáez Moreno, Germán, Saludes Closa, Jordi, Antonijuan Rull, Josefina, and Prat Farran, Joana d'Arc
Abstract: El dimarts 27 de juny de 2017 va tenir lloc la segona jornada docent del Departament de Matemàtiques de la UPC amb l'objectiu de debatre i reflexionar sobre l'ús de diferents tecnologies en la docència universitària de les Matemàtiques. Comitè organitzador (MAT): Maria Alberich, Santiago Boza, Jordi Guàrdia, Paz Morillo La jornada compta amb el suport del Departament de Matemàtiques, la Facultat de Matemàtiques i Estadística i l'Institut de Ciències de l'Educació., 9h45 h: Obertura de la jornada 10:00 -11:00 h: Conferència plenària “Estudiants participatius: realitat o ficció” Vanesa Daza (Univ. Pompeu Fabra). Parlarem de diferents experiències portades a terme a l’Escola Superior Politècnica de la Universitat Pompeu Fabra amb el principal objectiu de fomentar l’aprenentatge dels estudiants a partir de la seva implicació i participació. Introducció de jocs a l'aula, l'ús de tablets com a pissarra digital, o la plataforma Piazza són algunes de les experiències que ens permetran reflexionar sobre la implicació dels estudiants a l’aula. 11h30 - 12h30: Taula Rodona “Jo en dic Matemàtiques, tu en dius Mates” Reflexionem sobre els continguts en matemàtiques a les nostres titulacions en enginyeria. Sovint hem d'encabir en poques setmanes de classe i a una mateixa assignatura continguts matemàtics de temàtica diversa. Quin és el nivell d'aprofondiment a cada tema? Respon la solució que hi donem a les necessitats de la titulació? A què renunciem? Com ho quadrem tot plegat? Moderador: Pere Pascual (MAT). Ponents: Ángeles Carmona (MAT), Josep Salavedra (TSC), Marc de la Barrera (ex-estudiant CFIS). 12h45 - 13h30: Tallers: 1. Germán Saéz: "Kahoot! per a les classes de matemàtiques" 2. Jordi Saludes: "Control de versions per a la docència" 3. J. Antonijuan, J. Prat: "Geogebra com a eina d'aprenentatge per projectes a Matemàtiques del Disseny"
Published: 2017

8. Examen final del quadrimestre de tardor, curs 2014-2015: enunciat

Author: Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Pascual Iserte, Antonio, Rey Micolau, Francesc, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Pascual Iserte, Antonio, Rey Micolau, Francesc, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
Abstract: Examen final, del qual existeix una resolució detallada, del professor Sisco Vallverdú Bayés
Published: 2015

9. Some fast higher order ar estimation techniques applied to parametric wiener filtering

Author: Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, Hernando Pericás, Francisco Javier, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC], Processament de la parla, Algorismes, Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC], Algorithms
Abstract: Some Speech Enhancement algorithms based on the iterative Wiener filtering Method due to L1m-Oppenheim [2] are presented. In the original Lim-Oppenheim algorithm, speech AR estimation is carried out using classic second-order analysis, but our algorithms consider a more robust AR modelling. Two different strategies of speech AR estimation are presented and both estimators are trying to see as less amount of noise as possible. First one uses a previous One-Sided Autocorrelation computation, that is a pole-preserving function, and the actual SNR m the second-order LPC analysis is increased. Second one combines advantages of Higher-Order Statistics [1] with a linear combination of AR coefficients, belonging to two consecutive overlapped frames, to assess a less disturbed speech estimation.
Published: 2004

10. Examen final del quadrimestre de tardor, curs 2013-2014: enunciat

Author: Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Rey Micolau, Francesc, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Rey Micolau, Francesc, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
Abstract: Examen final, del qual existeix la resolució detallada del professor Sisco Vallverdú Bayés
Published: 2014

11. Extensió de l'ample de banda de senyals de veu de banda estreta

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Technische Universität Wien, Doblinger, Gerhard, Salavedra Molí, Josep, Expósito Pérez, Miquel, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Technische Universität Wien, Doblinger, Gerhard, Salavedra Molí, Josep, and Expósito Pérez, Miquel
Abstract: [ANGLÈS] Many telecommunication systems and internet networks (VoIP systems) transmit narrowband speech signals, i.e. signals with a frequency band from 300-3400 Hz, and a sampling frequency of 8 kHz. In order to improve speech quality, it is desirable to artificially increase the bandwidth on both sides of the frequency spectrum. Typically, we would like to transform narrowband speech to wideband speech with approximately 8 kHz bandwidth, and 16 kHz sampling frequency. In this final degree project, many different techniques of audio bandwidth extension have been developed, from less to more complexity and the improvement of the quality regarding the original signal has been analysed by audio testing. First, nonmodel-based algorithms have been developed, like oversampling and imaging that make use of the spectral components that occur when upsampling. Next model-based algorithm like linear mapping has been implemented. After all, both methods have been compared with a CMOS listening test to show the subjective differences between them., [CASTELLÀ] La mayoría de los sistemas de transmisión de voz en telecomunicaciones y redes de internet (VoIP) transmiten las señales en banda estrecha, es decir, señales cuyas componentes frecuenciales oscilan entre los 300 Hz y los 3400 Hz (utilizando una frecuencia de muestreo de 8 kHz), Para poder mejorar la calidad auditiva de estos señales, existen técnicas que permiten aumentar este ancho de banda hasta los 8000 Hz con una frecuencia de muestreo de 16 kHz. En este trabajo de fin de grado se han analizado diferentes técnicas de ensanchado del ancho de banda sobre señales de banda estrecha, de menor a mayor complejidad, y se han analizado auditivamente las mejoras en la claridad del señal respecto del señal original. Primero, usando sistemas no basados en el modelo fuente-filtro, como por ejemplo, las réplicas en frecuencia que aparecen cuando se interpola un señal. Después, con técnicas basadas en el modelo fuente-filtro como la modulación en frecuencia para el ensanchamiento del señal de excitación o el mapeo lineal para estimar el envolvente espectral del señal. También se han realizado tests auditivos CMOS para mostrar las diferencias subjetivas entre ambas técnicas, además de calcular la distancia Itakura para tener una referencia de una distancia objetiva., [CATALÀ] La majoria dels sistemes de transmissió de veu en telecomunicacions i xarxes d’internet (VoIP) transmeten els senyals en banda estreta, és a dir, senyals amb components freqüencials entre els 300 Hz i els 3400 Hz (utilitzant una freqüència de mostreig de 8 kHz). Per a poder millorar la qualitat auditiva d’aquests senyals, existeixen tècniques que permeten augmentar aquest ample de banda fins als 8000 Hz amb una freqüència de mostreig de 16 kHz. En aquest treball de fi de grau, s’han analitzat diferents tècniques d’eixamplament de l’ample de banda de senyals de banda estreta, de menor a major complexitat i s’ha analitzat auditivament la millora en la claredat del senyal respecte al senyal original. Primer, utilitzant sistemes no basats en el model font-filtre, com per exemple, les rèpliques en freqüència que apareixen quan interpolem un senyal. Després, amb altres tècniques basades en el model font-filtre com per exemple la modulació en freqüència per a l’eixamplament de l’excitació del senyal o el mapeig lineal per a eixamplar l’envolupant espectral del senyal. També s’ha realitzat un test auditiu CMOS per a mostrar les diferències subjectives entre ambdues tècniques. També s'ha calculat la distància Itakura entre els senyals per a tenir una referència d'una distància objectiva entre els senyals.
Published: 2014

12. Bandwidth extension of narrowband speech

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Expósito Pérez, Miquel, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Expósito Pérez, Miquel, and Salavedra Molí, Josep
Abstract: Recently, 4G mobile phone systems have been designed to process wideband speech signals whose sampling frequency is 16 kHz. However, most part of mobile and classical phone network, and current 3G mobile phones, still process narrowband speech signals whose sampling frequency is 8 kHz. During next future, all these systems must be living together. Therefore, sometimes a wideband speech signal (with a bandwidth up to 7,2 kHz) should be estimated from an available narrowband one (whose frequency band is 300-3400 Hz). In this work, different techniques of audio bandwidth extension have been implemented and evaluated. First, a simple non-model-based algorithm (interpolation algorithm) has been implemented. Second, a model-based algorithm (linear mapping) have been designed and evaluated in comparison to previous one. Several CMOS (Comparison Mean Opinion Score) [6] listening tests show that performance of Linear Mapping algorithm clearly overcomes the other one. Results of these tests are very close to those corresponding to original wideband speech signal., Postprint (published version)
Published: 2014

13. Senyals i sistemes analògics : una introducció pràctica

Author: Gasull Llampallas, Antoni|||0000-0003-3283-6892, Sayrol Clols, Elisa|||0000-0002-0526-9733, Moreno Bilbao, M. Asunción|||0000-0002-1823-5970, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya, and Sayrol Clols, Elisa
Subjects: Sistemes digitals i analògics, Enginyeria de la telecomunicació::Processament del senyal [Àrees temàtiques de la UPC]
Abstract: Aquest material didàctic de caràcter experimental s'adreça a aquells alumnes que s'introdueixen en l'estudi dels senyals i els sistemes analògics tant en el domini temporal com en el de freqüència. Els seus continguts han estat desenvolupats per professorat de l'assignatura Senyals i Sistemes I, que s'imparteix en els estudis que ofereix l'ETSETB. El llibre es divideix en quatre temes. El primer (Introducció als senyals i sistemes) se centra en l'anàlisi dels senyals i sistemes anàlogics i fa èmfasi especialment en els sistemes lineals i invariants. El segon (Transformada de Fourier) estudia la caracterització dels senyals i els sistemes en el domini de la freqüència, a partir de l'anàlisi de la transformada de Fourier i les seves propietats fonamentals. El tercer (Filtres) presenta les quatre tècniques clàssiques de disseny de filtres analògics pel que fa a la funció de transferència. Finalment, el tema quart (Correlació i Espectre) introdueix el concepte de correlació per senyals deterministes. El conjunt de l'obra inclou tant el llibre de continguts experimentals com un programari de simulació. L'estructuració del llibre de continguts experimentals presenta, al principi de cada capítol i també de forma intercalada, resums de la matèria teòrica en què se'n ressalten els conceptes més importants. Després d'aquests resums s'inclouen enunciats d'exercicis, problemes i pràctiques, agrupats segons la temàtica i ordenats segons el grau de dificultat.
Published: 2002

14. Musical instrument identification system based on a neurally inspired sound onset modelling

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, University of Edinburgh, Salavedra Molí, Josep, Newton, Michael J., Reinés March, Gabriel, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, University of Edinburgh, Salavedra Molí, Josep, Newton, Michael J., and Reinés March, Gabriel
Abstract: [ANGLÈS] In this project a musical tone classifier based on a neurally inspired onset model is performed, as many physiological and psychoacoustic evidences reveal the importance of the sound onset in the Human Auditory System, specifically in the fields of coding and recognition of sounds. The human inner ear is simulated: the cochlea is performed with a digital filterbank, the inner hair cells' behaviour is modelled with depressing synapses, and the auditory nerve is emulated with Leaky Integrate-and-Fire (LIF) neurons. After that, the onset spike trains obtained are transformed into a description matrix called onset fingerprint. The database used to test the performance of the system consists in 1020 single-note tones performed with five different instrument's families. The onset fingerprints of all these sounds are used to feed a classification system. Three approaches are made: Classification Trees, Quadratic Discriminant Classifier and Neural Networks. The last one gives a mean success classification rate of 75\%, the same performance as other onset-based classifier methods, but consuming less computing time., [CASTELLÀ] En este proyecto se realiza un clasificador de tonos musicales basado en el modelado del inicio del sonido (onset) inspirado en el comportamiento del nervio auditivo humano, ya que muchas evidencias fisiológicas y psicoacústicas ponen de manifiesto la importancia del inicio del sonido en los procesos de codificación y reconocimiento de sonidos del sistema auditivo humano. Con este propósito, se simula el oído interno humano: la cóclea es realizada con un banco de filtros digitales, el comportamiento de las células ciliadas internas se modela con sinapsis depresivas, y el nervio auditivo es emulado utilizando neuronas integradoras con pérdidas (leaky integrate-and-fire neurons). Una vez localizados temporalmente los inicios del sonido para diferentes canales y niveles de amplitud, se construye una matriz de descripción, llamada huella de inicio (onset fingerprint). La base de datos utilizada para evaluar el rendimiento del sistema consta de 1020 tonos realizados con cinco familias de instrumentos musicales diferentes. Las huellas de inicio, calculadas para todos estos sonidos, se utilizan para entrenar y testear tres sistemas de clasificación: árboles de clasificación, análisis discriminante cuadrático y redes neuronales. Este último da una tasa media de acierto del 75%, el mismo rendimiento que otros métodos basados en esta aproximación biológica, pero usando menos tiempo de proceso., [CATALÀ] En aquest projecte es realitza un classificador de tons musicals basat en el modelatge de l'inici del so (onset) inspirat en el comportament del nervi auditiu humà, ja que moltes evidències fisiològiques i psicoacústiques posen de manifest la importància de l'inici del so en els processos de codificació i reconeixement de sons del sistema auditiu humà. Amb aquest propòsit, es simula l'oïda interna dels humans: la còclea és realitzada amb un banc de filtres digitals, el comportament de les cèl·lules ciliades internes es modela amb sinapsis depressives, i el nervi auditiu és emulat utilitzant neurones integradores amb pèrdues (leaky integrate-and-fire neurons). Un cop localitzats temporalment els inicis del so per a diferents canals i nivells d'amplitud, es construeix una matriu de descripció, anomenada empremta d'inici (onset fingerprint). La base de dades utilitzada per avaluar el rendiment del sistema consta de 1020 tons realitzats amb cinc famílies d'instruments musicals diferents. Les empremtes d'inici, calculades per a tots aquests sons, s'utilitzen per entrenar i testejar tres sistemes de classificació: arbres de classificació, anàlisi discriminant quadràtica i xarxes neuronals. Aquest últim dóna una taxa mitjana d'encert del 75%, el mateix rendiment que altres mètodes basats en aquesta aproximació biològica, però emprant menys temps de procés.
Published: 2013

15. Examen final del quadrimestre de primavera, curs 2012-2013: enunciat

Author: Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Nadeu Camprubí, Climent, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, Sayrol Clols, Elisa, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Nadeu Camprubí, Climent, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, Sayrol Clols, Elisa, and Vallverdú Bayés, Sisco
Published: 2013

16. Examen final del quadrimestre de tardor, curs 2011-2012: enunciat

Author: Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Nogueiras Rodríguez, Albino, and Salavedra Molí, Josep
Published: 2012

17. Examen final del quadrimestre de primavera, curs 2011-2012: enunciat

Author: Gasull Llampallas, Antoni, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Gasull Llampallas, Antoni, Nogueiras Rodríguez, Albino, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
Published: 2012

18. Una aproximación experimental a las señales y sistemas analógicos

Author: Sayrol Clols, Elisa|||0000-0002-0526-9733, Gasull Llampallas, Antoni|||0000-0003-3283-6892, Moreno Bilbao, M. Asunción|||0000-0002-1823-5970, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. GPI - Grup de Processament d'Imatge i Vídeo, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: Signal processing, Teaching, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC], Tractament del senyal, Ensenyament
Abstract: Se presenta en este artículo un material docente para la enseñanza de las señales y los sistemas analógicos. El enfoque que se ha dado es eminentemente aplicado. Se presenta un conjunto muy completo de ejercicios, problemas y simulaciones que se complementan mutuamente. A parte del contenido y su estructuración, la principal característica de este material reside en el software desarrollado que explota de forma exhaustiva las posibilidades gráficas de MATLAB. Se proporciona una interfície muy amigable y potente para realizar las experiencias que se proponen.
Published: 2000

19. Predictive neural networks applied to phoneme recognition

Author: Freitag, Fèlix, Monte Moreno, Enrique, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. CNDS - Xarxes de Computadors i Sistemes Distribuïts, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: ComputingMethodologies_PATTERNRECOGNITION, Computer Science::Sound, Processament de la parla, Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC], Computer Science::Computation and Language (Computational Linguistics and Natural Language and Speech Processing), Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC]
Abstract: In this paper a phoneme recognition system based on predictive neural networks is proposed. Neural networks are used to predict observation vectors of speech frames. The obtained prediction error is used for phoneme recognition as 1) distortion measure on the frame level and 2) as feature, which is statistically modeled by the Rayleigh distribution. Continuous speech phoneme recognition experiments are performed different settings of the system are evaluated.
Published: 1997
Full Text: View/download PDF

20. Third-order cumulant-based wiener filtering algorithm applied to robust speech recognition

Author: Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: Computer Science::Sound, Filters and filtration, Processament de la parla, Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC], Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC], Filtres i filtració
Abstract: In previous works [5], [6], we studied some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim [2], where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors: a cumulant-based Wiener Filtering (AR3_IF) is applied to Robust Speech Recognition. A low complexity approach of this algorithm is tested in presence of bathroom water noise and its performance is compared to classical Spectral Subtraction method. Some results are presented when training task of the speech recognition system (HTK-MFCC) is executed under clean and noisy conditions. These results show a lower sensitivity to the presence of water noise when applying AR3_IF algorithm inside of a speech recognition task.
Published: 1996

21. Codificación APVQ de voz en banda ancha para velocidades entre 16 y 32 KBPS

Author: Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: Processament de la parla, Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC], Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC]
Abstract: This paper describes a coding scheme for broadband speech (sampling frequency 16KHz). We present a wideband speech encoder called APVQ (Adaptive Predictive Vector Quantization). It combines Subband Coding, Vector Quantization and Adaptive Prediction as it is represented in Fig. I. Speech signal is split in 16 subbands by means of a QMF filter bank and so every subband is 500Hz wide. This APVQ encoder can be seen as a vectorial extension of a conventional ADPCM encoder. In this scheme, signal vector is formed with one sample of the normalized prediction error signal coming from different subbands and then it is vector quantized. Prediction error signal is normalized by its gain and normalized prediction error signal is the input of the VQ and therefore an adaptive Gain-Shape VQ is considered. This APVQ Encoder combines the advantages of Scalar Prediction and those of Vector Quantization. We evaluate wideband speech coding in the range from 1 to 2 bits/sample, that leads to a coding rate from 16 to 32 kbps.
Published: 1996

22. Some fast higher order ar estimation techniques applied to parametric wiener filtering

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, Hernando Pericás, Francisco Javier, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, and Hernando Pericás, Francisco Javier
Abstract: Some Speech Enhancement algorithms based on the iterative Wiener filtering Method due to L1m-Oppenheim [2] are presented. In the original Lim-Oppenheim algorithm, speech AR estimation is carried out using classic second-order analysis, but our algorithms consider a more robust AR modelling. Two different strategies of speech AR estimation are presented and both estimators are trying to see as less amount of noise as possible. First one uses a previous One-Sided Autocorrelation computation, that is a pole-preserving function, and the actual SNR m the second-order LPC analysis is increased. Second one combines advantages of Higher-Order Statistics [1] with a linear combination of AR coefficients, belonging to two consecutive overlapped frames, to assess a less disturbed speech estimation., Peer Reviewed, Postprint (published version)
Published: 2004

23. Robust hos-based techniques applied to speech recognition and enhancement

Author: Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: Computer Science::Sound, Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC], Processament de la parla, Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC]
Abstract: We study some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim [2], where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors, where information of previous speech frames is taken to initiate speech AR modelling of the current frame. Two parameters are introduced to dessign Wiener filter at first iteration of this iterative algorithm. These parameters are the Interframe Factor (IF) and the Previous Frame Iteration (PFI). A detailed study of them shows they allow a very important noise suppression after processing only first iteration of this algorithm, without any appreciable increase of distortion. Finally, the simplest cumulant-based algorithm is applied to Speech Recognition and some preliminary results are presented.
Published: 1995

24. Técnicas de estimación AR usando distintas metodologías de orden superior en ambientes reales

Author: Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: Processament de la parla, Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC], Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC]
Abstract: Some Speech Enhancement algorithms based on the iterative Wiener filtering Method due to LimOppenheim [2] are presented. In the original Lim-Oppenheim algorithm, AR spectral estimation of speech is carried out using a second-order analysis, but our algorithms consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors. Information of previous speech frames is taken to initiate speech AR modeling of the current frame and, so, two parameters are introduced to dessign Wiener Filter at first iteration of every frame. Another algorithm obtains speech AR estimation in the autocorrelation domain. Both algorithms are compared to classical second-order algorithm (AR2) and third-onler cumulant-based algorithm (AR3), when car noise disturbs clean speech signal. A detailed study shows that boths techniques significantly increase noise suppression after first iteration processing and, therefore, convergence speed of this iterative algorithm is strongly accelerated.
Published: 1995

25. Speech recognition and enhancement using some robust HOS-based AR estimation techniques

Author: Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: education, Processament de la parla, Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC], Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC]
Published: 1995

26. Técnicas de Speech Enhancement considerando estadísticas de orden superior

Author: Salavedra Molí, Josep Maria, Masgrau Gómez, Enrique, and Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions
Subjects: Codificadors de veu, estadístiques d'ordre superior, filtrat de wiener, processament del senyal de veu, Processament de la parla, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC], reducció de soroll, 621.3
Abstract: Las prestaciones de muchos sistemas de procesado de vozse degradan rápidamente en aplicaciones reales ante lapresencia de ruido. Para solucionar este problema lastécnicas de speech enhancement pretenden reducir esteruido realzando la señal de voz degradada. Se hanconsiderado las técnicas basadas en un filtrado dewiener. Tradicionalmente, estas técnicas han mostradounas prestaciones superiores a otras metodologías, comopor ejemplo la sustracción espectral, sin embargo, estastécnicas de filtrado de wiener hacen uso de lasestadísticas de segundo orden (función auto correlación)y, en consecuencia, presentan una elevada sensibilidad alruido. Una aportación importante de este trabajo consisteen la incorporación de las estadísticas de orden superioral proceso de estimación de la voz a partir de la señal de voz ruidosa.
Published: 1995

27. Some robust speech enhancement techniques using higher order AR estimation

Author: Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: education, Processament de la parla, Enginyeria de la telecomunicació::Processament del senyal::Processament de la parla i del senyal acústic [Àrees temàtiques de la UPC], Algorismes, Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC], Algorithms
Published: 1994

28. Predicción lineal de la parte causal de la autocorrelación para la identificación del locutor en ambientes ruidosos

Author: Hernando Pericás, Francisco Javier, Nadeu Camprubí, Climent, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: Telecomunicació, education, Telecommunication, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC]
Published: 1994

29. Técnicas robustas para un modelo ar de voz usando estadísticas de orden superior

Author: Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: education, Processament de la parla, Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC]
Published: 1994

30. Senyals i sistemes analògics : una introducció pràctica

Author: Universitat Politècnica de Catalunya, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
Abstract: Aquest material didàctic de caràcter experimental s'adreça a aquells alumnes que s'introdueixen en l'estudi dels senyals i els sistemes analògics tant en el domini temporal com en el de freqüència. Els seus continguts han estat desenvolupats per professorat de l'assignatura Senyals i Sistemes I, que s'imparteix en els estudis que ofereix l'ETSETB. El llibre es divideix en quatre temes. El primer (Introducció als senyals i sistemes) se centra en l'anàlisi dels senyals i sistemes anàlogics i fa èmfasi especialment en els sistemes lineals i invariants. El segon (Transformada de Fourier) estudia la caracterització dels senyals i els sistemes en el domini de la freqüència, a partir de l'anàlisi de la transformada de Fourier i les seves propietats fonamentals. El tercer (Filtres) presenta les quatre tècniques clàssiques de disseny de filtres analògics pel que fa a la funció de transferència. Finalment, el tema quart (Correlació i Espectre) introdueix el concepte de correlació per senyals deterministes. El conjunt de l'obra inclou tant el llibre de continguts experimentals com un programari de simulació. L'estructuració del llibre de continguts experimentals presenta, al principi de cada capítol i també de forma intercalada, resums de la matèria teòrica en què se'n ressalten els conceptes més importants. Després d'aquests resums s'inclouen enunciats d'exercicis, problemes i pràctiques, agrupats segons la temàtica i ordenats segons el grau de dificultat., 2a ed.
Published: 2002

31. Senyals i sistemes analògics : una introducció pràctica

Author: Universitat Politècnica de Catalunya, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
Abstract: Aquest material didàctic de caràcter experimental s'adreça a aquells alumnes que s'introdueixen en l'estudi dels senyals i els sistemes analògics tant en el domini temporal com en el de freqüència. Els seus continguts han estat desenvolupats per professorat de l'assignatura Senyals i Sistemes I, que s'imparteix en els estudis que ofereix l'ETSETB. El llibre es divideix en quatre temes. El primer (Introducció als senyals i sistemes) se centra en l'anàlisi dels senyals i sistemes anàlogics i fa èmfasi especialment en els sistemes lineals i invariants. El segon (Transformada de Fourier) estudia la caracterització dels senyals i els sistemes en el domini de la freqüència, a partir de l'anàlisi de la transformada de Fourier i les seves propietats fonamentals. El tercer (Filtres) presenta les quatre tècniques clàssiques de disseny de filtres analògics pel que fa a la funció de transferència. Finalment, el tema quart (Correlació i Espectre) introdueix el concepte de correlació per senyals deterministes. El conjunt de l'obra inclou tant el llibre de continguts experimentals com un programari de simulació. L'estructuració del llibre de continguts experimentals presenta, al principi de cada capítol i també de forma intercalada, resums de la matèria teòrica en què se'n ressalten els conceptes més importants. Després d'aquests resums s'inclouen enunciats d'exercicis, problemes i pràctiques, agrupats segons la temàtica i ordenats segons el grau de dificultat.
Published: 2001

32. Speech enhancement by adaptive wiener filtering based on cumulant ar modelling

Author: Masgrau Gómez, Enrique José, Salavedra Molí, Josep, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, and Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla
Subjects: education, Processament de la parla, Algorismes, Speech processing systems, Enginyeria de la telecomunicació [Àrees temàtiques de la UPC], Algorithms
Published: 1992

33. Una aproximación experimental a las señales y sistemas analógicos

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. GPI - Grup de Processament d'Imatge i Vídeo, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. GPI - Grup de Processament d'Imatge i Vídeo, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Sayrol Clols, Elisa, Gasull Llampallas, Antoni, Moreno Bilbao, M. Asunción, Salavedra Molí, Josep, and Vallverdú Bayés, Sisco
Abstract: Se presenta en este artículo un material docente para la enseñanza de las señales y los sistemas analógicos. El enfoque que se ha dado es eminentemente aplicado. Se presenta un conjunto muy completo de ejercicios, problemas y simulaciones que se complementan mutuamente. A parte del contenido y su estructuración, la principal característica de este material reside en el software desarrollado que explota de forma exhaustiva las posibilidades gráficas de MATLAB. Se proporciona una interfície muy amigable y potente para realizar las experiencias que se proponen., Peer Reviewed, Postprint (published version)
Published: 2000

34. Distortion effects of several cumulant-based wiener filtering algorithms

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, and Salavedra Molí, Josep
Abstract: Some Single-Microphone Speech Enhancement algorithms based on the iterative Wiener filtering Method due to Lim-Oppenheim [2] are evaluated. In the original Lim-Oppenheim algorithm, AR spectral estimation of speech is carried out using a second-order analysis, but our algorithms consider an AR estimation from a cumulant analysis. This work extends some preceding papers due to the authors [4], [5]. Third- and fourth-order cumulant-based algorithms are compared to classical second-order one. This comparison is evaluated by considering three different noisy environments. A detailed study based on a frame-by-frame analysis leads to an optimum iteration of each algorithm as a trade-off between noise reduction and distortion effects. Voiced and unvoiced sounds are separately discussed. We conclude that third-order cumulant-based algorithm offers a more valuable performance than the others., Peer Reviewed, Postprint (published version)
Published: 1999

35. Predictive neural networks applied to phoneme recognition

Author: Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. CNDS - Xarxes de Computadors i Sistemes Distribuïts, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Freitag, Fèlix, Monte Moreno, Enrique, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament d'Arquitectura de Computadors, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. CNDS - Xarxes de Computadors i Sistemes Distribuïts, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Freitag, Fèlix, Monte Moreno, Enrique, and Salavedra Molí, Josep
Abstract: In this paper a phoneme recognition system based on predictive neural networks is proposed. Neural networks are used to predict observation vectors of speech frames. The obtained prediction error is used for phoneme recognition as 1) distortion measure on the frame level and 2) as feature, which is statistically modeled by the Rayleigh distribution. Continuous speech phoneme recognition experiments are performed different settings of the system are evaluated., Peer Reviewed, Postprint (published version)
Published: 1997

36. Wideband-speech APVQ coding from 16 to 32 KBPS

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, and Salavedra Molí, Josep
Abstract: This paper describes a coding scheme for broadband speech (sampling frequency 16KHz). We present a wideband speech encoder called APVQ (Adaptive Predictive Vector Quantization). It combines Subband Coding, Vector Quantization and Adaptive Prediction as it is represented in Fig.1. Speech signal is split in 16 subbands by means of a QMF filter bank and so every subband is 500Hz wide. This APVQ encoder can be seen either as a vectorial extension of a conventional ADPCM encoder or as a scalar Subband AVPC encoder [1],[3]. In this scheme, signal vector is formed with one sample of the normalized prediction error signal coming from different subbands and then it is vector quantized. Prediction error signal is normalized by its gain and normalized prediction error signal is the input of the VQ and therefore an adaptive Gain-Shape VQ is considered. This APVQ Encoder combines the advantages of Scalar Prediction and those of Vector Quantization. We evaluate wideband speech coding in the range from 1 to 2 bits/sample., Peer Reviewed, Postprint (published version)
Published: 1997

37. Third-order cumulant-based wiener filtering algorithm applied to robust speech recognition

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, and Hernando Pericás, Francisco Javier
Abstract: In previous works [5], [6], we studied some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim [2], where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors: a cumulant-based Wiener Filtering (AR3_IF) is applied to Robust Speech Recognition. A low complexity approach of this algorithm is tested in presence of bathroom water noise and its performance is compared to classical Spectral Subtraction method. Some results are presented when training task of the speech recognition system (HTK-MFCC) is executed under clean and noisy conditions. These results show a lower sensitivity to the presence of water noise when applying AR3_IF algorithm inside of a speech recognition task., Peer Reviewed, Postprint (published version)
Published: 1996

38. Codificación APVQ de voz en banda ancha para velocidades entre 16 y 32 KBPS

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, and Masgrau Gómez, Enrique José
Abstract: This paper describes a coding scheme for broadband speech (sampling frequency 16KHz). We present a wideband speech encoder called APVQ (Adaptive Predictive Vector Quantization). It combines Subband Coding, Vector Quantization and Adaptive Prediction as it is represented in Fig. I. Speech signal is split in 16 subbands by means of a QMF filter bank and so every subband is 500Hz wide. This APVQ encoder can be seen as a vectorial extension of a conventional ADPCM encoder. In this scheme, signal vector is formed with one sample of the normalized prediction error signal coming from different subbands and then it is vector quantized. Prediction error signal is normalized by its gain and normalized prediction error signal is the input of the VQ and therefore an adaptive Gain-Shape VQ is considered. This APVQ Encoder combines the advantages of Scalar Prediction and those of Vector Quantization. We evaluate wideband speech coding in the range from 1 to 2 bits/sample, that leads to a coding rate from 16 to 32 kbps., Peer Reviewed, Postprint (published version)
Published: 1996

39. APVQ encoder applied to wideband speech coding

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, and Masgrau Gómez, Enrique José
Abstract: The paper describes a coding scheme for broadband speech (sampling frequency 16 KHz). The authors present a wideband speech encoder called APVQ (adaptive predictive vector quantization). It combines subband coding, vector quantization and adaptive prediction. The speech signal is split into 16 subbands by means of a QMF filter bank and so every subband is 500 Hz wide. This APVQ encoder can be seen as a vectorial extension of a conventional ADPCM encoder. In this scheme, signal vector is formed with one sample of the normalized prediction error signal coming from different subbands and then it is vector quantized. The prediction error signal is normalized by its gain and normalized prediction error signal is the input of the VQ and therefore an adaptive gain-shape VQ is considered. This APVQ encoder combines the advantages of scalar prediction and those of vector quantization. They evaluate wideband speech coding in the range from 1.5 to 2 bits/sample, that leads to a coding rate from 24 to 32 kbps., Peer Reviewed, Postprint (published version)
Published: 1996

40. Técnicas de estimación AR usando distintas metodologías de orden superior en ambientes reales

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Vallverdú Bayés, Sisco, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, and Vallverdú Bayés, Sisco
Abstract: Some Speech Enhancement algorithms based on the iterative Wiener filtering Method due to LimOppenheim [2] are presented. In the original Lim-Oppenheim algorithm, AR spectral estimation of speech is carried out using a second-order analysis, but our algorithms consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors. Information of previous speech frames is taken to initiate speech AR modeling of the current frame and, so, two parameters are introduced to dessign Wiener Filter at first iteration of every frame. Another algorithm obtains speech AR estimation in the autocorrelation domain. Both algorithms are compared to classical second-order algorithm (AR2) and third-onler cumulant-based algorithm (AR3), when car noise disturbs clean speech signal. A detailed study shows that boths techniques significantly increase noise suppression after first iteration processing and, therefore, convergence speed of this iterative algorithm is strongly accelerated., Peer Reviewed, Postprint (published version)
Published: 1995

41. Robust HOS-based techniques applied to speech recognition and enchancement

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, and Moreno Bilbao, M. Asunción
Abstract: We study some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim [2], where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors, where information of previous speech frames is taken to initiate speech AR modelling of the current frame. Two parameters arc introduced to dessign Wiener filter at first iteration of this iterative algorithm. These parameters arc the Interframe Factor (IF) and the Previous Frame Iteration (PFI). A detailed study of them shows they ailow a very important noise suppression after processing only first iteration of this algorithm, without any appreciable increase of distortion. Finally the simplest cumulant-based algorithm is applied to Speech Recognition and some preliminary results are presented., Peer Reviewed, Postprint (published version)
Published: 1995

42. Técnicas de Speech Enhancement considerando estadísticas de orden superior

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Masgrau Gómez, Enrique, Salavedra Molí, Josep Maria, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Masgrau Gómez, Enrique, and Salavedra Molí, Josep Maria
Abstract: Las prestaciones de muchos sistemas de procesado de vozse degradan rápidamente en aplicaciones reales ante lapresencia de ruido. Para solucionar este problema lastécnicas de speech enhancement pretenden reducir esteruido realzando la señal de voz degradada. Se hanconsiderado las técnicas basadas en un filtrado dewiener. Tradicionalmente, estas técnicas han mostradounas prestaciones superiores a otras metodologías, comopor ejemplo la sustracción espectral, sin embargo, estastécnicas de filtrado de wiener hacen uso de lasestadísticas de segundo orden (función auto correlación)y, en consecuencia, presentan una elevada sensibilidad alruido. Una aportación importante de este trabajo consisteen la incorporación de las estadísticas de orden superioral proceso de estimación de la voz a partir de la señal de voz ruidosa., Postprint (published version)
Published: 1995

43. Speech recognition and enhancement using some robust HOS-based AR estimation techniques

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Hernando Pericás, Francisco Javier, Masgrau Gómez, Enrique José, and Moreno Bilbao, M. Asunción
Abstract: Peer Reviewed, Postprint (published version)
Published: 1995

44. Codificación APVQ de voz en banda ancha usando asignación dinámica de bits

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, and Salavedra Molí, Josep
Abstract: This paper describes a coding scheme for broadband speech. It can be seen as a vectorial extension of a conventional ADPCM encoder. In this scheme, signal vector is formed with one sample of the normalized prediction error of each subband and then it is vector quantized. It combines the advantages of the scalar prediction and those of vector quantization (VQ). We handle the high vector dimensionality by using a multiVQ. It requires a previous subvector division and an adequate bit assignment among them. This scheme shows a high capacity to drive large dynamic range signals like broadband speech. Predictor and codebook dessigns are discussed. Some results about speech prediction and coding are reported., Peer Reviewed, Postprint (published version)
Published: 1995

45. Técnicas robustas para un modelo ar de voz usando estadísticas de orden superior

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, and Moreno Bilbao, M. Asunción
Abstract: Peer Reviewed, Postprint (published version)
Published: 1994

46. Predicción lineal de la parte causal de la autocorrelación para la identificación del locutor en ambientes ruidosos

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Hernando Pericás, Francisco Javier, Nadeu Camprubí, Climent, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Hernando Pericás, Francisco Javier, Nadeu Camprubí, Climent, and Salavedra Molí, Josep
Abstract: Peer Reviewed, Postprint (published version)
Published: 1994

47. Some robust speech enhancement techniques using higher order AR estimation

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, and Moreno Bilbao, M. Asunción
Abstract: Peer Reviewed, Postprint (published version)
Published: 1994

48. Robust coefficients of a higher order AR modelling in a speech enhancement system using parameterized Wiener filtering

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, Jove, X, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, and Jove, X
Abstract: We study some speech enhancement algorithms based on the iterative Wiener filtering method due to Lim-Oppenheim (1978), where the AR spectral estimation of the speech is carried out using a second-order analysis. But in our algorithms we consider an AR estimation by means of cumulant analysis. This work extends some preceding papers due to the authors, providing a generalization of third- and fourth-order algorithms by means of adding two parameters in the general expression of Wiener filtering. These parameters allow a better control of their performance. Some results are presented considering AWGN but listening tests give similar performance when other noises (diesel engine) are considered., Peer Reviewed, Postprint (published version)
Published: 1994

49. Codificación APVQ-extendida de voz de banda ancha

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Masgrau Gómez, Enrique José, Salavedra Molí, Josep, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Masgrau Gómez, Enrique José, and Salavedra Molí, Josep
Abstract: This paper describes a coding scheme for broadband speech. It can be seen as a vectorial extension of an conventional ADPCM encoder. In this scheme, the vector signal is formed with one sample of the normalizaed prediction error of each subband and then, it is vector quantized. It combines the advantages of the scalar prediction and of the vector quantization (VQ) . We handle the high vector dimensionality by using a multi-VQ. It requires a previous subvector division and an adequate bit assignement among them. This scheme shows an high capacity to drive large dynamic range signals like broadband speech., Peer Reviewed, Postprint (published version)
Published: 1994

50. Variable frame length of a higher order speech AR estimation in a speech enhancement system

Author: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, Estarellas, J, Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. VEU - Grup de Tractament de la Parla, Salavedra Molí, Josep, Masgrau Gómez, Enrique José, Moreno Bilbao, M. Asunción, and Estarellas, J
Abstract: Peer Reviewed, Postprint (published version)
Published: 1994

Catalog

Books, media, physical & digital resources

See catalog results

Searchworks

Select search scope, currently: Articles Catalog books, media & more in Jio Institute collections Articles journal articles & other e-resources

Search

Search Constraints

Refine your results

Search Limiters

Topic

Publication Year Range

Language

Publication Type

Database

Publisher

71 results on '"Salavedra Molí, Josep"'

Search Results

Catalog

Select search scope, currently: Articles

Catalog

books, media & more in Jio Institute collections

Articles

journal articles & other e-resources