class: center, middle  # Piper ## Texte lokal vorlesen lassen ### Hauke Goos-Habermann #### https://goos-habermann.de --- ### Über mich - Entwickler des
Softwareverteilungssystems m23
- Organisator der
Kieler Open Source und Linux Tage
-
Dienstleister zu m23, Linux und Freier Software
- Softwareentwicklung (PHP, BASH, C/C++, JS, Python und was sonst so gebraucht wird...) - Administration - Schulungen - Support - Beratung - quasi **alles**, *was mit Linux zu tun hat* - Wöchentlicher Livestream *"Jean und Hauke Show"* auf https://www.youtube.com/c/LinuxGuides - *"Nicht der Weisheit letzter Schluß"* mit **beruflichen** oder **privaten Projekten** auf
tube.tchncs.de/c/ndwls
und
youtube.com/@nichtderweisheit
- Hat eine lokale Sprachsynthese entdeckt :-) --- ### Piper?  **Piper** ist ein freies OpenSource-Programm (MIT-Lizenz), mit dem **Texte in Sprachdateien umgewandelt** werden können. Die Sprache wird hierbei (anders als bei
Applio
(Video)) **lokal** mit **künstlichen neuronalen Netzen** erzeugt. Piper kann Texte in **38 Sprachen** bzw. **Sprachvarianten** (z.B. britisches und amerikanisches Englisch) vorlesen. Mit dabei sind auch deutsche Sprachmodelle :-) **Projektseite:** https://github.com/rhasspy/piper **Beispiele:** https://rhasspy.github.io/piper-samples **Sprachen:** https://github.com/rhasspy/piper/blob/master/VOICES.md --- ### Installation  Die Installation geschieht (üblicherweise) durch Herunterladen und Entpacken eines Archivs, das es für **AMD64**, **32-** und **64-bittige** arm-CPUs (Raspberry Pi) gibt. ```bash # Herunterladen wget https://github.com/rhasspy/piper/\ releases/download/v1.2.0/piper_amd64.tar.gz # Entpacken tar xfvz piper_amd64.tar.gz # Ins Verzeichnis wechseln cd piper ``` PS Die enthaltenen **Binärdateien** der AMD64-Version habe ich am 29.3.25 bei **
VirusTotal
** getestet und keine Beanstandung gefunden. --- ### Sprachmodelle  Die
Sprachmodelle
sind in jeweis zwei Dateien (.onnx und .onnx.json) aufgeteilt. Diese beiden Dateien müßt Ihr in dasselbe Verzeichnis herunterladen. Deutsche Stimmen und Varianten: * eva_k-x_low * karlsson-low * kerstin-low * mls-medium * pavoque-low * ramona-low * thorsten_emotional-medium * thorsten-high * thorsten-low * thorsten-medium --- ### Sprache generieren  Der zu sprechende Text wird einfach per **Standardeingabe** übergeben. Z.B. so: ```bash echo 'Moin Moin und Herzlich Willkommen zu\ einer neuen Ausgabe von "Nicht der\ Weisheit letzter Schluss!"' | ./piper\ --model de_DE-kerstin-low.onnx\ --output_file de_DE-kerstin-low.wav ``` Alternativ kann auch eine Textdatei **"hineingepiped"** werden: ```bash ./piper --model de_DE-kerstin-low.onnx\ --output_file de_DE-kerstin-low2.wav\ < ping.txt ``` --- ### Weitere Tests  Test mit **thorsten_emotional-medium**: *"Moin moin und Herzlich Willkommen, in diesem Kanal geht es um Linux- und OpenSource-Projekte, mit denen ich mich sowohl beruflich als auch privat beschäftige. Je nach Zeit und Lust können das kleinere oder größere Projekte sein."* --- ### Weitere Tests  Test mit **thorsten-high**: *"Moin moin und Herzlich Willkommen, in diesem Kanal geht es um Linux- und OpenSource-Projekte, mit denen ich mich sowohl beruflich als auch privat beschäftige. Je nach Zeit und Lust können das kleinere oder größere Projekte sein."* --- ### Weitere Tests  Test mit **thorsten-low**: *"Moin moin und Herzlich Willkommen, in diesem Kanal geht es um Linux- und OpenSource-Projekte, mit denen ich mich sowohl beruflich als auch privat beschäftige. Je nach Zeit und Lust können das kleinere oder größere Projekte sein."* --- ### Weitere Tests  Test mit **thorsten-medium**: *"Moin moin und Herzlich Willkommen, in diesem Kanal geht es um Linux- und OpenSource-Projekte, mit denen ich mich sowohl beruflich als auch privat beschäftige. Je nach Zeit und Lust können das kleinere oder größere Projekte sein."* --- class: center, middle ### Informationen zu mir und meinen Dienstleistungen, m23, ... ### https://goos-habermann.de