193.174.19.232Abstract: A. Pentari, P. Iosifidis, G. Kyprakis, C. Tzermia, M. Froudas, V. Skaramagkas, M. Tsiknakis (2023)

Proceedings of the IEEE International Conference on Bioinformatics and Biomedicine (BIBM 2023), 4820–4826p. (2023) DOI:10.1109/BIBM58861.2023.10385734

Multi-channel CNN-based emotion recognition using recurrence plot representations of speech

A. Pentari, P. Iosifidis, G. Kyprakis, C. Tzermia, M. Froudas, V. Skaramagkas, M. Tsiknakis

During the last decades, the problem of speech emotion recognition (SER) has gained the researchers' interest. A variety of previous works aimed to address the SER problem by two main approaches: on the one hand there exist the feature-based combined with the machine learning classifiers methods, while on the other, novel pipelines employing deep learning classifiers have also proven to be effective for emotion recognition. However, the lack of the existing approaches in the exploitation of the dynamic nature of the voice and further, the speech, aroused our curiosity of how the mathematical tool of the recurrence quantification analysis (RQA) and its extracted recurrence plots (RPs) and features could treat the SER problem. Consequently, the purpose of this work is to exploit the RPs and through the use of the RQA features construct a multi-channel convolutional neural network (CNN) which can differentiate the primary emotions, described in the German EMODB database. Our experimental results proved that our proposed pipeline outperforms the existing literature's classification results, reaching an unweighted average recall (UAR) score up to 94%.

back


Creative Commons License © 2024 SOME RIGHTS RESERVED
The content of this web site is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.0 Germany License.

Please note: The abstracts of the bibliography database may underly other copyrights.

Ihr Browser versucht gerade eine Seite aus dem sogenannten Internet auszudrucken. Das Internet ist ein weltweites Netzwerk von Computern, das den Menschen ganz neue Möglichkeiten der Kommunikation bietet.

Da Politiker im Regelfall von neuen Dingen nichts verstehen, halten wir es für notwendig, sie davor zu schützen. Dies ist im beidseitigen Interesse, da unnötige Angstzustände bei Ihnen verhindert werden, ebenso wie es uns vor profilierungs- und machtsüchtigen Politikern schützt.

Sollten Sie der Meinung sein, dass Sie diese Internetseite dennoch sehen sollten, so können Sie jederzeit durch normalen Gebrauch eines Internetbrowsers darauf zugreifen. Dazu sind aber minimale Computerkenntnisse erforderlich. Sollten Sie diese nicht haben, vergessen Sie einfach dieses Internet und lassen uns in Ruhe.

Die Umgehung dieser Ausdrucksperre ist nach §95a UrhG verboten.

Mehr Informationen unter www.politiker-stopp.de.