Sprecherdiarisierung — Wer hat was in Audioaufnahmen gesagt?
Definition
Sprecherdiarisierung ist der automatische Prozess, bei dem eine Audioaufnahme in Segmente aufgeteilt wird, die jeweils einem Sprecher zugeordnet sind. Sie beantwortet die Frage „Wer hat wann gesprochen?" – ohne vorab die Stimmen der Sprecher zu kennen. Im Bereich Meeting Intelligence verwandelt die Diarisierung einen monolithischen Audiostrom in ein strukturiertes, sprecherzugeordnetes Transkript, das sprecherspezifische Analysen ermöglicht.
Warum es wichtig ist
Ohne Diarisierung ist ein Transkript nur eine Textwand. Mit ihr wird jede Aussage einer bestimmten Person zugeordnet – und das ermöglicht tiefergehende Analysen: Wer hat das Gespräch dominiert? Wer hat den entscheidenden Einwand geäußert? Bei welchem Sprecher hat das Engagement im Laufe der Zeit nachgelassen? Genaue Sprecherzuordnung ist die Grundlage, auf der jede höhere Meeting-Intelligence aufbaut – Zusammenfassungen, Verhaltensanalysen und sprecherspezifische Erkenntnisse hängen alle davon ab, das „Wer" korrekt zu erfassen.
Haufige Fehler
- [object Object]
- [object Object]
- [object Object]
Tools die es nutzen sprecherdiarisierung
Die meisten Meeting-Intelligence-Tools umfassen eine Form der Sprecherdiarisierung – von einfachem Stimm-Clustering (Otter.ai, Fireflies.ai) bis hin zu unternehmensgerechter Sprecherzuordnung (Gong). auraScribe verfolgt einen besonderen Ansatz mit seiner 2-Pass-Architektur – akustische Diarisierung in Pass 1, gefolgt von textbasierter Identifikation in Pass 1.5 – und ergänzt dies um einen menschlichen Überprüfungsschritt, bei dem Nutzer die Zuordnungen korrigieren können, bevor die Verhaltensanalyse beginnt.