Link Search Menu Expand Document

Was ist ein Sprachassistent?

Ein Sprachassistent ist ein System, dass verschiedene Sprachbefehle verarbeiten kann und durch diese bestimmte Aktionen ausführt. Sprachassistenten zeichnen sich durch fünf Merkmale und gleichzeitig chronolgische Nutzungsschichten aus, die hier vereinfach am Beispiel eines Sprachbefehls und der Aktion des Sprachassistenten darauf verdeutlicht werden sollen:

Sprachbefehl: “MaxMax? … Wie ist das Wetter in Köln?” Antwort: “das wetter in köln ist sonnig”

  1. Wake Word Spotter - Weckworterkennung
    Wenn der Sprachassistent eingeschaltet ist, hört die Weckworterkennung immer zu und wartet darauf das sie ein bestimmtes Muster im Audioeingangssignal erkennt.
    Erst wenn dieses Weckwort erkannt wird, verarbeitet der Sprachassistent die nachfolgenden Wörter oder Sätze.
    Beispiel: “MaxMax”

  2. Speech To Text - Sprache-Zu-Text
    In der zweiten Schicht wandelt der Sprachassistent, den auf das Weckwort folgenden Sprachbefehl in Text um, um ihn dann weiterverarbeiten zu können.
    Beispiel: “wie ist das wetter in köln”

  3. Intent Parsing And Entity Recognition - Absichtsanalyse und Entitätenerkennung
    Der Sprachassistent entschlüsselt aus dem Text eine Absicht und erkennt mitgegebene Entitäten des Nutzers.
    Beispiel: 1. “wie”+”wetter” = Wetterabfrage | 2. “köln” = Wetterabfrage für Köln

  4. Skills - Fähigkeiten
    Die vierte Schicht sind dann Skills, also in etwa Programme oder Apps auf einem Sprachassistenten.
    Anhand der Absicht und der Entitäten wird eine passende Funktion für den Nutzer ausgeführt.
    Beispiel: Wetterabfrage für Köln = Datenquelle für Wetter abfragen

  5. Text To Speech - Text-Zu-Sprache
    Als letzte Schicht kommt das Feedback.
    In der Regel antwortet ein Sprachassistent mit Sprache.
    Beispiel: “das wetter in köln ist sonnig”
    Es gibt jedoch auch andere oft zusätzlich genutzte Feedback-Arten (Licht-Feedback, Bildschirm-Feedback, Vibrationsfeedback, etc.).