193.174.19.232Abstract: S. Firooz, F. Almasganj, Y. Shekofteh (2024)

Signal, Image and Video Processing, 18, 1959–1967p. (2024) DOI:10.1007/s11760-023-02921-4

Improvement of automatic speech recognition systems utilizing 2D adaptive wavelet transformation applied to recurrence plot of speech trajectories

S. Firooz, F. Almasganj, Y. Shekofteh

Spectral-based features, typically used in ASR systems, do not capture the phase information of speech signals. Thus, exploiting new features that do not ignore the phase of the signal can be a complementary approach to improve the performance of the feature extraction (FE) block of an ASR system. In this paper, we propose an adaptive FE method that uses the reconstructed phase space (RPS) and recurrence plot (RP) theories as its foundations. The RP transformation can reveal some important aspects of the dynamics of high-dimensional speech trajectories reconstructed in the RPS. In this work, after transforming the speech signal to the image-like RP domain as a matrix, we apply a powerful wavelet-based FE method. We use a two-dimensional adaptive wavelet transform, implemented through a customized filter bank, to extract some beneficial dynamical features from the RP matrix for the ASR task. We evaluate the resulting features in an ASR task alone and in combination with the traditional MFCCs. Using the TIMIT speech corpus, the combination of the proposed and MFCC features results in a relative improvement of 7.79% in phoneme recognition accuracy rate compared to using only the MFCC features.

back


Creative Commons License © 2024 SOME RIGHTS RESERVED
The content of this web site is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 2.0 Germany License.

Please note: The abstracts of the bibliography database may underly other copyrights.

Ihr Browser versucht gerade eine Seite aus dem sogenannten Internet auszudrucken. Das Internet ist ein weltweites Netzwerk von Computern, das den Menschen ganz neue Möglichkeiten der Kommunikation bietet.

Da Politiker im Regelfall von neuen Dingen nichts verstehen, halten wir es für notwendig, sie davor zu schützen. Dies ist im beidseitigen Interesse, da unnötige Angstzustände bei Ihnen verhindert werden, ebenso wie es uns vor profilierungs- und machtsüchtigen Politikern schützt.

Sollten Sie der Meinung sein, dass Sie diese Internetseite dennoch sehen sollten, so können Sie jederzeit durch normalen Gebrauch eines Internetbrowsers darauf zugreifen. Dazu sind aber minimale Computerkenntnisse erforderlich. Sollten Sie diese nicht haben, vergessen Sie einfach dieses Internet und lassen uns in Ruhe.

Die Umgehung dieser Ausdrucksperre ist nach §95a UrhG verboten.

Mehr Informationen unter www.politiker-stopp.de.