Standardisierte Datenerfassung in Psychotherapiesitzungen: Erleichterung der sprachbasierten digitalen Biomarker-Untersuchung in der psychischen Gesundheit
Im Rahmen des Projekts wurde eine Anwendung entwickelt, mit der Therapeut:innen während Psychotherapiesitzungen standardisierte Sprachproben aufzeichnen und Diagnosen effizient dokumentieren können. Das Ziel besteht darin, die Erforschung stimmbasierter digitaler Biomarker zu unterstützen und eine objektive Diagnostik psychischer Erkrankungen zu ermöglichen.
Für
Universitäre Psychiatrische Dienste Bern & Zürcher Hochschule für Angewandte Wissenschaften
Arbeiten
Analyse
Konzeption
Architektur
Sprachaufnahme
ICD-10-Erfassung
Benutzerfreundlichkeit
Testing
Datenpipeline
Studie
Machine Learning
Dokumentation
Zielsetzung & Projektkontext
In Zusammenarbeit mit den Universitären Psychiatrischen Diensten Bern (UPD) wurde ein System konzipiert, das Therapeut:innen eine benutzerfreundliche Oberfläche zur Erfassung von Diagnosen anhand von ICD-10-Codes bietet. Die Umsetzung beinhaltet den Einsatz moderner Webtechnologien zur Entwicklung einer plattformübergreifenden Anwendung mit Fokus auf Benutzerfreundlichkeit, Datensicherheit und Skalierbarkeit. Die entwickelte Webanwendung bildet die technische Grundlage für die anschliessende empirische Untersuchung im Rahmen der Bachelorarbeit.
Vorgehen
Um die Lösung bestmöglich in die Praxis zu integrieren, wurde eine gründliche Analyse durchgeführt.
1. Theoretische Grundlagen & Forschung: Eine Literaturrecherche lieferte aktuelle wissenschaftliche Erkenntnisse und Grundlagen für die spätere Entwicklung.
2. Nutzeranalyse & Anforderungsdefinition: Ein Experteninterview mit dem Gruppenleiter der UPD Bern lieferte wertvolle Einblicke, die in die Erstellung von Personas und die Definition der Nutzerbedürfnisse einflossen.
3. Modellierung & Spezifikation: Die zentralen Entitäten und ihre Beziehungen wurden in einem Domänenmodell abgebildet, ergänzt durch ein Glossar sowie funktionale und nicht-funktionale Anforderungen.
4. Evaluierung alternativer Entwurfsansätze: Verschiedene Plattformen wie iPad, Web-App oder Spezialgerät wurden hinsichtlich Usability, technischer Machbarkeit und Kosten verglichen.
5. Konzeptentwicklung & Prototyping: Auf Basis von User Stories wurden interaktive Prototypen entwickelt und iterativ getestet, um Optimierungspotenziale frühzeitig zu identifizieren.
6. Umsetzung: Unter Berücksichtigung von Usability-Richtlinien nach ISO-9241 sowie eines konsistenten Styleguides wurde die Anwendung nutzerfreundlich umgesetzt.
7. Qualitätssicherung & Dokumentation: Die Qualität und Nachhaltigkeit der Anwendung wurde durch Usertests, Code-Reviews und eine Dokumentation sichergestellt.
Die folgende Abbildung zeigt exemplarische Artefakte aus Analyse, Design und Umsetzung.
Einblicke
Benutzerfreundlichkeit
Die Benutzeroberfläche bietet eine einfache Navigation und entspricht den Richtlinien der ISO-9241. Eingaben werden validiert.
Patient:innen-Verwaltung
Patient:innen können mit einer eindeutigen Patient-ID erfasst und verwaltet werden. Sie können über eine Suchfunktion gefunden werden.
Fallverwaltung
Fälle können mit einer eindeutigen Fall-ID angelegt und verwaltet werden. Sie gehören immer zu einer Patient:in und verfügen über einen Status.
Sprachaufzeichnung
Die Aufzeichnung der in der Anwendung verwalteten Vorlesetexte funktioniert zuverlässig mit verschiedenen Audioformaten.
ICD-10-Code-Erfassung
Codes können ausgewählt und gesucht werden. Sie werden einem Fall zugeordnet.
Studie
Aufbauend auf dem entwickelten System wurde im Rahmen der Bachelorarbeit eine kontrollierte Studie mit 20 Teilnehmenden durchgeführt. Ziel war es, zu untersuchen, ob sich kurzfristige Stimmungsänderungen – induziert durch Musik – in spezifischen Sprachmerkmalen widerspiegeln.
Standardisiertes Studiendesign: Die Teilnehmenden bewerteten ihre Stimmung vor und nach einer Musikintervention (aufmunternd oder entspannend) und sprachen jeweils einen identischen, neutralen Vorlesetext ein.
Feature-Pipeline: Eine automatisierte Datenpipeline extrahierte prosodische, akustische, spektrale und formantenbasierte Merkmale aus den Aufnahmen, z. B. Pausendauer, Pitch oder MFCCs.
Statistische Auswertung: Signifikante Veränderungen u. a. in der Pausendauer und bei bestimmten MFCCs zeigten, dass Sprache kurzfristige Stimmung widerspiegeln kann.
Machine Learning: Modelle wie Random Forests und Gradient Boosting zeigten vielversprechende Vorhersagekraft für z. B. positiven Affekt (Genauigkeit bis zu 87 %).
Die Ergebnisse belegen das Potenzial sprachbasierter digitaler Biomarker für eine objektive, nicht-invasive Beurteilung psychischer Zustände und bilden eine wertvolle Grundlage für weiterführende Forschung und Anwendungen im klinischen Kontext.