Przetwarzanie mowy w celu sterowania urządzeniami mechatronicznymi *
Speech processing work for mechatronics control
Mechanik nr 07/2015 - Różne
STRESZCZENIE: Przedstawiono etapy opracowania metody parametryzacji sygnałów mowy. Adaptowano dekompozycję paczkowej transformacji falkowej oraz zastosowano rozplot homomorficzny. Dzięki wykorzystaniu niejawnych modeli Markowa do rozpoznawania zweryfikowano działanie opracowanej metody. Badania stanowią punkt wyjścia do wdrożenia automatycznego systemu rozpoznawania mowy do sterowania urządzeniami mechatronicznymi.
SŁOWA KLUCZOWE: transformacja falkowa, analiza cepstralna, automatyczne rozpoznawanie mowy.
ABSTRACT: Illustrated are the steps to develop a method of speech parameterization. Adapted for the purpose was packet decomposition of the wavelet transformation with homomorphic deconvolution also applied. The hidden Markov Models for speech recognition as used were providing at the same time for verification of the developed method. These studies should be considered as the starting point for further implementation of an automatic speech recognition system for control of mechatronic devices.
KEYWORDS: wavelet transformation, cepstral analysis, automatic speech recognition.
BIBLIOGRAFIA / BIBLIOGRAPHY:
- Furui S. “Selected topics from 40 years of research in speech and speaker recognition”. Brighton (UK): Interspeech, 2009.
- Gosiewski Z., Tarasiuk M. “Preliminary study of the automatic speech recognition for devices supporting the ill and disabled”. Journal of Vibroengineering. Vol. 11 (2009), No. 3: pp. 497÷503.
- Kasprzak W. „Rozpoznawanie obrazów i sygnałów mowy”. Warszawa: Oficyna Wydawnicza Politechniki Warszawskiej, 2009.
- Rabiner L., Huang B.H. “Historical Perspective of the Filed of ASR/NLU”. “Springer Handbook of Speech Processing”. Springer-Verlag, 2008.
- Sarikaya R., Pellom L.B., Hansen J.H.L. “Wavelet packet transform features with application to speaker identification”. NORSIG’98 (1998): pp. 81÷84.
- Sorensen J.A. “Speech Coding and Recognition Course”. IT University of Copenhagen, TKG, 2005.
- Tarasiuk M., Gosiewski Z. „Segmentacja mowy polskiej z wykorzystaniem transformacji falkowej”. Acta Mechanica et Automatica. Vol. 4 (2010), No. 1: pp. 92÷95.
- Tarasiuk M., Gosiewski Z. “The Application of Wavelets Vector Quantization of Polish Speech”. Journal of Vibroengineering. Vol. 14 (2012), No. 1: pp. 87÷94.
- Zieliński T.P. „Cyfrowe przetwarzanie sygnałów, od teorii do zastosowań”. Warszawa: WKŁ, 2005.