Bibliographic Metadata
- TitleStimmbasierte akustische Schläfrigkeitsdetektion (acoustic sleepiness analysis) : eine signalverarbeitungsbasierte und mustererkennungsalgorithmengestützte Verfahrensentwicklung / vorgelegt von: Jarek Krajewski
- Participants
- Published
- Institutional NoteWuppertal, Univ., Diss.
- LanguageGerman
- Document typeDissertation (PhD)
- URN
- The document is publicly available on the WWW
- Social MediaShare
- Reference
- Archive
- IIIF
English
Detecting sleepiness states has been recognized as an important issue in the prevention of accidents. Thus, this paper describes a sleepiness detection approach based on analyzing acoustic speech features, the Acoustic Sleepiness Analysis (ASA). Sleepiness related changes in speech refer to three speech feature classes (a) "prosody" (flat intonation, low pitch), (b) "articulation" (slurred speech) and "voice quality" (nasalization, softening). The present dissertation provides an overview about linguistic-phonetical basics, auditive-perceptual and acoustic speech features, sleepiness induced speech changes, a machine learning based measurement procedure, and empirical validation of the Acoustic Sleepiness Analysis.
We conducted a within-subject sleep deprivation design (N= 24; 8.00 p.m to 4.00 a.m). During the night of sleep deprivation a self-report sleepiness measure, Karolinska Sleepiness Scale (KSS) was used every hour just before the recordings to determine the sleepiness state. During the night, the subjects were confined to the laboratory and supervised throughout the whole period. In order to investigate sleepiness induced speech changes, a standard set of spectral and prosodic features (169 raw and 169 z-normalized features) were extracted from the sentences. After a wrapper-based forward selection (K-NN) was employed on the feature space in an attempt to prune redundant dimensions, different classification models were trained (LDA, MLP, SVM, KNN). The best model (1-Nearest-Neighbour) offers an average mean accuracy rate of 82.0% (Sensitivity = 63.4%; Specifity = 87.8%; r = .55) for the two-class prediction problem.
Deutsch
Ziel der vorliegenden Arbeit ist die konzeptionelle Begründung und experimentelle Validierung eines Verfahrens zur akustischen Schläfrigkeitsmessung. Potenzielle Anwendungsfelder der Echtzeit-Detektion von Schläfrigkeitszuständen liegen in der unfallpräventiven Fahrerzustanderkennung, adaptiven Optimierung des Arbeits-Erholungs-Zyklus und der Komfortsteigerung von sprachgesteuerten Mensch-Maschine-Systemschnittstellen. Das zentrale Messprinzip der akustische Stimmanalyse stützt sich auf die Vorstellung, dass schläfrigkeitsinduzierte Veränderungen des Sprachproduktionsprozesses zu messbaren akustischen Veränderungen innerhalb der Stimmbereiche Prosodie, Artikulation und Stimmqualität führen. Dieser Beitrag gibt einen Überblick zu linguistisch-phonetischen Grundlagen, zentralen auditiv-perzeptiven und akustischen Beschreibungskategorien, schläfrigkeitsbedingten Stimmveränderungen, dem Machine-Learning-basierten Messprozedere sowie empirischen Validierungsbefunden der akustischen Schläfrigkeitsanalyse.Zur Validierung der akustischen Schläfrigkeitsmessung wurden in einer Schlafdeprivationsstudie (20.00 - 04.00; N=24) sowohl Sprachaufnahmen als auch selbst- und fremdberichtete Schläfrigkeitsratings (Karolinska Sleepiness Scale, KSS) erhoben. Das verwendete Sprachmaterial bestand aus aufsteigend komplexen linguistischen Einheiten (extrahierten Vokalen, Worten und ganzen phrasalen Einheiten). Für alle Spracheinheiten wurden 338 akustische Stimmkennzahlen berechnet. Der komplette Messprozess der hier vorgestellten Acoustic Sleepiness Analysis (ASA) folgt dem Ablauf der Mustererkennung (Aufnahme, Vorverarbeitung, Merkmalsberechnung, Dimensionalitätsreduktion, Klassifikation). Zu den erfolgreich eingesetzten Klassifikationsverfahren zählen Künstliche Neuronale Netze, Support Vector Machines und K-Nearest Neighbour Verfahren. Die Validitätskorrelationen von dichotomisierten vorhergesagten Schläfrigkeitszuständen und den selbstberichteten Schläfrigkeitsratings liegen für das erfolgreichste K-Nearest Neighbour Verfahren über alle Sprachmaterialien gemittelt bei durchschnittlich r = .55. Die Klassifikationsgenauigkeit der Schläfrigkeitsvorhersage befindet sich bei durchschnittlich 82.0%.
- The PDF-Document has been downloaded 19 times.