Up

v21_n3_a3_Gabrys_165-169.pdf

v21_n3_a3_Gabrys_165-169.pdf
File Size:
346.49 kB

Rozpoznawanie wieku i płci na podstawie analizy głosu / Age and gender recognition based on analysis of voice (165–169)

Autorzy: Justyna Gabryś, Grzegorz Gil, Piotr Kiszka

 

STRESZCZENIE
Metody automatycznego rozpoznawania wieku i płci pozwalają na rozpoznanie cech osoby mówiącej tylko na podstawie nagrania jej wypowiedzi. Mowa ludzka, poza werbalnym komunikatem, niesie ze sobą informacje dotyczące osoby mówiącej. Nagranie mowy osoby pozwala na wyodrębnienie takich informacji, jak jej płeć, wiek, a także emocje. Zaprezentowano przegląd metod rozpoznawania wieku i płci osób na podstawie ich mowy oraz wykonano implementację i przetestowano połączenie metod wyznaczania parametrów MFCC (współczynniki analizy cepstralnej w skali mel (Mel-frequency Cepstral Coefficients) i wysokości tonu głosu f0 oraz algorytmu SVM (metoda wektorów nośnych - Support Vector Machines) do klasyfikacji próbek głosowych. Testy zaimplementowanego rozwiązania pozwalają stwierdzić, że metoda jest skuteczna w większości przypadków testowych.

 

Słowa kluczowe: automatyczne rozpoznawanie mowy, wiek, płeć, współczynniki MFCC, klasyfikacja mówcy, maszyna wektorów nośnych

 
 
 
Powered by Phoca Download