NEW#DCGAN#Speech Emotion Recognition#Data
Augmentation#Mel-spectrogram#PyTorch#Deep
Learning
DCGAN으로 감정 음성 데이터를 늘려서 인식 성능을 끌어올린 이야기
DCGAN을 활용해 멜 스펙트로그램을 증강하고, CNN+BiLSTM 모델로 음성 감정 인식 성능을 RAVDESS 72.3%, EmoDB 90.4%까지 끌어올린 연구를 정리했습니다.
1
개발하면서 배운 것들을 기록합니다.