Stand vom 03.08.2021:
Laufende Container auf Pi:
Name | Link auf Docker Hub |
---|---|
Mosquitto | arm32v6/eclipse-mosquitto |
Node-Red | nodered/node-red |
Music Player Daemon | easypi/mpd-arm |
Rhasspy | rhasspy/rhasspy |
Verwendete Technologien innerhalb von Rhasspy:
Bereich | Name der Technologie | Zustätzliche Bemerkung |
---|---|---|
Audio Recording | PyAudio | |
Wake Word | Rhasspy Raven | Probleme mit Frauenstimmen! |
Speech to Text | Mozilla Deepspeech (deutsch) | Verwendung von AASHISHAG’s deepspeech-german v0.9.0 |
Intent Recognition | Fsticuffs | |
Text to Speech | NanoTTS | |
Audio Playing | aplay | |
Dialogue Management | Rhasspy | |
MQTT | External - Mosquitto |
Bisher umgesetzte Skills:
- Informiert den Nutzer wenn er einen Befehl nicht verstanden hat -> NF-023, F-036, F-037, F-038
- Kann die aktuelle Uhrzeit ansagen -> F-040, F-041
- Kann einen Timer stellen und nach Ablauf alarmieren -> F-042, F-043, F-048
- Kann einen Wecker stellen und bei Erreichen alarmieren -> F-044, F-045, F-049
- Kann das aktuelle Wetter für eine der 701. größten Groß- und Mittelstädte ansagen (Nutzung der Current Weather Data API von OpenWeather) -> F-050, F-055
- Kann die Wiedergabe von bestimmten RadioWebStreams starten. Stoppen und Wechseln des Senders mit Einschränkungen!
Zukunfsaussichten:
- ggf. WakeWord verbessern?
- Ausarbeiten und Verfeinern des Prototypen
- Upload des Codes vom Sprachassistenten und Komponenten auf GitHub
- Abschließen der Dokumentation
- Vorbereitung der mediengestützten Präsentation
- Mediengestützten Präsentation terminieren und halten (Frühstens Anfang September?)