Raw Audio Cues: Wie die Verhaltensanalyse funktioniert
Raw Audio Cues ist das umfassende chronologische Protokoll von auraScribe mit beobachtbaren Verhaltenssignalen, die direkt aus dem Meeting-Audio erfasst werden. Es ist die Grundlage für alles, was auraScribe von einem Transkriptionstool unterscheidet.
Was Raw Audio Cues erfasst
Während des zweiten Durchgangs der 3-Pass-Pipeline hört sich die KI von auraScribe das Audio zusammen mit dem Transkript an und protokolliert jedes beobachtbare Verhaltenssignal:
- Stimmmuster: Tonwechsel, Tempoänderungen, Lautstärkeschwankungen, knarrende Stimme (Vocal Fry), Hauchigkeit
- Gesprächssignale: Zögern, Füllwörter, Selbstkorrekturen, leiser werdende Stimme
- Interaktionsdynamik: Unterbrechungen, überschneidendes Sprechen, Back-Channeling, Schweigen
- Engagement-Marker: Lachen, hörbare Zustimmung/Ablehnung, Begeisterungswechsel
- Machtdynamik: Wer bestimmt die Agenda, wer ordnet sich unter, wer lenkt um, wer wird ins Abseits gedrängt
- Zeitliche Muster: Energieveränderungen im gesamten Meeting, Aufmerksamkeitsabfälle, Momente des erneuten Engagements
Beobachtbares Verhalten, keine Emotionen
Eine wichtige Unterscheidung: auraScribe analysiert beobachtbares Verhalten, keine Emotionen. Es wird anmerken, dass „das Tempo von Sprecher 2 zunahm und die Tonhöhe während der Preisdiskussion anstieg“ — eine objektive Beobachtung. Es wird nicht behaupten, dass „Sprecher 2 wegen der Preisgestaltung ängstlich war“ — eine emotionale Schlussfolgerung.
Diese Unterscheidung ist nicht nur philosophisch. Der EU AI Act (Art. 50 und verwandte Bestimmungen) schränkt Systeme zur Emotionserkennung ein. auraScribe ist von Grund auf so konzipiert, dass es innerhalb dieser Grenzen funktioniert. Es nutzt eine Compliance-Engine, die automatisch jede Analyse umschreibt, die vom beobachtbaren Verhalten zur emotionalen Zuschreibung übergeht.
Warum dies wichtig ist
Transkripte erfassen Worte. Raw Audio Cues erfassen alles andere. Ein Meeting, bei dem alle oberflächlich „zustimmten“, kann in den Audiosignalen Zögern, mangelndes Engagement oder passiven Widerstand zeigen. Eine Verhandlung, die routinemäßig schien, kann Machtverschiebungen offenbaren, die erst im Nachhinein offensichtlich werden.
Indem auraScribe diese Signale objektiv aufzeigt, gibt es Fachleuten die Selbsterkenntnis, sich besser vorzubereiten, präziser zu kommunizieren und zu verstehen, was in jedem Gespräch wirklich passiert ist.
Wie dies die Analyse füttert
Raw Audio Cues sind nicht nur ein Protokoll — sie sind die primäre Eingabe für die Verhaltenszusammenfassung von Pass 3 und die individuellen Anmerkungen pro Sprecher. Die KI liest das Transkript zusammen mit den Hinweisen, um Folgendes zu generieren:
- Eine Verhaltenszusammenfassung der Gruppendynamik (10-15 Stichpunkte)
- Individuelle Anmerkungen pro Sprecher mit Coaching-Punkten (jeweils 5-8 Sätze)
- Kaufsignale, wenn kommerzielle Muster erkannt werden
Ohne Raw Audio Cues wären diese Ausgaben generische Zusammenfassungen, die nur auf Worten basieren — im Wesentlichen das, was jedes andere Transkriptionstool produziert.