Piper: Texte lokal vorlesen lassen

class: center, middle
![img33r](robopinguin1.webp)
# Piper
## Texte lokal vorlesen lassen
### Hauke Goos-Habermann
#### https://goos-habermann.de
---

<!--
Moin Moin und Herzlich Willkommen zu einer neuen Ausgabe von "Nicht der Weisheit letzter Schluss!"

Da ich mir von den Chemnitzer Linuxtagen nicht nur knuddelige Pinguine, sondern auch eine saftige Erkältung mitgebracht habe, spreche ich diese Folge nicht selbst.

Dieses Mal geht es nochmal um Sprachsynthese, aber anders bei der Folge zu Applio, welches die Cloud von Microsoft einspannt, geschieht diese lokal auf Eurem Rechner. Schauen wir mal, wie gut das ganze funktioniert.
-->

### Über mich

- Entwickler des <a href="https://m23.sourceforge.io">Softwareverteilungssystems m23</a>

- Organisator der <a href="https://kielux.de">Kieler Open Source und Linux Tage</a>

- <a href="https://goos-habermann.de/">Dienstleister zu m23, Linux und Freier Software</a>

- Softwareentwicklung (PHP, BASH, C/C++, JS, Python und was sonst so gebraucht wird...)
  - Administration
  - Schulungen
  - Support
  - Beratung
  - quasi **alles**, *was mit Linux zu tun hat*

- Wöchentlicher Livestream *"Jean und Hauke Show"* auf https://www.youtube.com/c/LinuxGuides

- *"Nicht der Weisheit letzter Schluß"* mit **beruflichen** oder **privaten Projekten** auf <a href="https://tube.tchncs.de/c/ndwls">tube.tchncs.de/c/ndwls</a> und <a href="https://youtube.com/@nichtderweisheit">youtube.com/@nichtderweisheit</a>

- Hat eine lokale Sprachsynthese entdeckt :-)
---

### Piper?

![img33r](robopinguin2.webp)

**Piper** ist ein freies OpenSource-Programm (MIT-Lizenz), mit dem **Texte in Sprachdateien umgewandelt** werden können.

Die Sprache wird hierbei (anders als bei <a href="https://goos-habermann.de/weisheit-10206-Stimmen-klonen-und-Texte-vorlesen-lassen-mit-Applio">Applio</a> (Video)) **lokal** mit **künstlichen neuronalen Netzen** erzeugt.

Piper kann Texte in **38 Sprachen** bzw. **Sprachvarianten** (z.B. britisches und amerikanisches Englisch) vorlesen. Mit dabei sind auch deutsche Sprachmodelle :-)

**Projektseite:** https://github.com/rhasspy/piper
**Beispiele:** https://rhasspy.github.io/piper-samples
**Sprachen:** https://github.com/rhasspy/piper/blob/master/VOICES.md

---

### Installation

![img33r](robopinguin3.webp)

Die Installation geschieht (üblicherweise) durch Herunterladen und Entpacken eines Archivs, das es für **AMD64**, **32-** und **64-bittige** arm-CPUs (Raspberry Pi) gibt.

```bash
# Herunterladen
wget https://github.com/rhasspy/piper/\
releases/download/v1.2.0/piper_amd64.tar.gz

# Entpacken
tar xfvz piper_amd64.tar.gz

# Ins Verzeichnis wechseln
cd piper
```

PS Die enthaltenen **Binärdateien** der AMD64-Version habe ich am 29.3.25 bei **<a href="https://virustotal.com">VirusTotal</a>** getestet und keine Beanstandung gefunden.
---

### Sprachmodelle

![img33r](robopinguin4.webp)

Die <a href="https://github.com/rhasspy/piper/blob/master/VOICES.md">Sprachmodelle</a> sind in jeweis zwei Dateien (.onnx und .onnx.json) aufgeteilt.

Diese beiden Dateien müßt Ihr in dasselbe Verzeichnis herunterladen.

Deutsche Stimmen und Varianten:

* eva_k-x_low
* karlsson-low
* kerstin-low
* mls-medium
* pavoque-low
* ramona-low
* thorsten_emotional-medium
* thorsten-high
* thorsten-low
* thorsten-medium
---

### Sprache generieren

![img33r](robopinguin5.webp)

Der zu sprechende Text wird einfach per **Standardeingabe** übergeben. Z.B. so:

```bash
echo 'Moin Moin und Herzlich Willkommen zu\
 einer neuen Ausgabe von "Nicht der\
 Weisheit letzter Schluss!"' | ./piper\
 --model de_DE-kerstin-low.onnx\
 --output_file de_DE-kerstin-low.wav
```

Alternativ kann auch eine Textdatei **"hineingepiped"** werden:

```bash
./piper --model de_DE-kerstin-low.onnx\
 --output_file de_DE-kerstin-low2.wav\
 < ping.txt
```
---

### Weitere Tests

![img33r](robopinguin6.webp)

Test mit **thorsten_emotional-medium**:

*"Moin moin und Herzlich Willkommen,</br></br>
in diesem Kanal geht es um Linux- und OpenSource-Projekte, mit denen ich mich sowohl beruflich als auch privat beschäftige. Je nach Zeit und Lust können das kleinere oder größere Projekte sein."*
---

### Weitere Tests

![img33r](robopinguin7.webp)

Test mit **thorsten-high**:

### Weitere Tests

![img33r](robopinguin8.webp)

Test mit **thorsten-low**:

### Weitere Tests

![img33r](robopinguin5.webp)

Test mit **thorsten-medium**:

class: center, middle
### Informationen zu mir und meinen Dienstleistungen, m23, ...
### https://goos-habermann.de