Hinweis: Klicken Sie auf die Spaltenüberschriften, um die Tabelle nach Ihren Wünschen zu sortieren.
| Modellname | Qualität (DE) | Voice Cloning | Besonderheit | VRAM | Lizenz |
|---|---|---|---|---|---|
| Qwen3-TTS | ⭐⭐⭐⭐⭐ | 3s Zero-Shot | Beste deutsche Emotionen | 8 GB | Apache 2.0 |
| Fish Speech 1.5 | ⭐⭐⭐⭐⭐ | SOTA Cloning | Sehr stabil bei Dialekten | 4 GB | BSD-3 |
| CosyVoice 2.0 | ⭐⭐⭐⭐ | Präzise | Extrem geringe Latenz | 4 GB | Apache 2.0 |
| Kokoro v1.0 | ⭐⭐⭐ | Nein (Presets) | Läuft auf Toaster/CPU | < 2 GB | Apache 2.0 |
| XTTS v2.5 | ⭐⭐⭐ | Einfach | Große Community-Base | 4 GB | CPML |