Multimodal speech emotion recognition Using Audio and Text

Project for HSE Deep Learning course: emotions recognition from audio and text.

Dataset

IEMOCAMP dataset with 4 largest emotion classes and united class "happy" and "excited". Preprocessed and splitted into train, test, validation as 8:1:1.

Models architectures

ARE model: CNN

baseline/baseline_audio.py

TRE model: GRU

baseline/baseline_text.py

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
baseline		baseline
data_preproccesing		data_preproccesing
AudioClassificationExperiments.ipynb		AudioClassificationExperiments.ipynb
Audio_plus_Text.ipynb		Audio_plus_Text.ipynb
TextClassificationExperiments.ipynb		TextClassificationExperiments.ipynb
photo_2022-06-23 10.58.28.jpeg		photo_2022-06-23 10.58.28.jpeg
readme.md		readme.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Multimodal speech emotion recognition Using Audio and Text

Dataset

Models architectures

About

Releases

Packages

Languages

aapoliakova/SER_TASK

Folders and files

Latest commit

History

Repository files navigation

Multimodal speech emotion recognition Using Audio and Text

Dataset

Models architectures

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages