SciELO - Scientific Electronic Library Online

 
vol.12 número1INNOVACIÓN METODOLÓGICA APLICADA A LA ENSEÑANZA DE SISTEMAS ELÉCTRICOS DE POTENCIAGRAPHIC SPECIFICATION OF ABSTRACT DATA TYPES índice de autoresíndice de materiabúsqueda de artículos
Home Pagelista alfabética de revistas  

Servicios Personalizados

Revista

Articulo

Indicadores

Links relacionados

Compartir


Revista Facultad de Ingeniería - Universidad de Tarapacá

versión On-line ISSN 0718-1337

Rev. Fac. Ing. - Univ. Tarapacá v.12 n.1 Arica mayo 2004

http://dx.doi.org/10.4067/S0718-13372004000100002 

 

REVISTA FACULTAD DE INGENIERIA, U.T.A. (CHILE), VOL. 12 Nº1, 2004, pp. 9-14

 

IMPLEMENTACIÓN DE UN RECONOCEDOR DE PALABRAS AISLADAS DEPENDIENTE DEL LOCUTOR

 

César San Martín S.1     Roberto Carrillo A.1

1 Universidad de La Frontera, Depto. de Ingeniería Eléctrica, Casilla 54-D, Temuco – Chile, csmarti@ufro.cl, rcarrill@ufro.cl


 

RESUMEN

En este trabajo se presenta un sistema de reconocimiento de palabras aisladas dependiente del locutor. Cada palabra se codifica mediante las técnicas de Predicción Lineal y Cepstrum real, mientras que la etapa de clasificación se realiza mediante el alineamiento temporal dinámico, que permite independencia del intervalo de tiempo de cada muestra de voz. Los resultados obtenidos demuestran que el uso de estas técnicas permiten obtener un 85% de clasificación correcta.

Palabras claves: Reconocimiento de voz, análisis Cepstral, extracción de parámetros, patrones de voz.

 

ABSTRACT

In this work a speaker dependent isolated word recognition system is presented. While each word is encoded using the Linear Prediction and Cepstrum techniques,  the classification stage is carried out by means of  Dynamic Time-Warping, which allows independence for the interval of time of each voice sample. The results obtained show that using these techniques allows about 85% of correct classification.

Keywords: Speech recognition, Cepstral analysis, extraction of parameters, speech patterns.


REFERENCIAS

[1] J. Proakis, Ch.D.G. Manolakis; "Tratamiento Digital de Señales", Prentice - Hall, 1998.        [ Links ]

[2] A. Oppenheim, R. Schafer; "Discrete-Time Signal Processing", Prentice-Hall, USA., 1989.        [ Links ]

[3] L. Rabiner, B.H. Juang; "Fundamentals of Speech Recognition", Prentice-Hall, USA., 1993.        [ Links ]

[4] A. Procházka, J. Uhlír and P. Sovka; "Signal Analysis and Prediction I", Procházka et al, Prague, Czech Republic, 1998.        [ Links ]

[5] Llamas Bello, Cardeñoso Payo; "Reconocimiento Automático del Habla. Técnicas y aplicaciones", Publicaciones de la Universidad de Valladolid. España, 1997.        [ Links ]

[6] Stuart N. Wrigley; "Speech Recognition By Dynamic Time Warping (DTW)". Disponible en: http://www.dcs.shef.ac.uk/ , 1999.        [ Links ]

[7] Andrés Flores Espinoza; "Reconocimiento de Palabras aisladas". Disponible en: http://www.alek.pucp.%20edu.pe/~dflores/INDEX.html        [ Links ]

[8] S. Zilovich, R.P. Ramachandram; "Speaker Identification Based in the use of Robust Ceptral Features Obtained fron Pole-Zero Transfer Functions", IEEE Transactions on Speech and audio Processing, 6, 3, 1998. pp. 260-267.        [ Links ]

[9] K. Montri, S. Zahorian; "Signal Modeling for High-Performance Robust Isolated Word Recognition". IEEE Transactions on Speech and audio Processing. Vol-9, No 6, September 2001.        [ Links ]

[10] A. Adid, J.P. Barjaktarevic, O. Ozun, M. Smith and P. Steurer; "Automatic Speech Recognition for Isolated Words". Departament of electrical  Engineering. Universite of California, Los Angeles. U.S.A. Disponible  en: http://www.ee.ucla.edu/~psteurer/projects/ee214bprojectreport.pdf           [ Links ]

Recibido el 14 de julio de 2003, aceptado el 3 de mayo de 2004

 

Creative Commons License Todo el contenido de esta revista, excepto dónde está identificado, está bajo una Licencia Creative Commons