Pipeline VC
Pipeline VoiceConversion
Méta-package unifié — sélection automatique ZeroShot (OpenVoice) ou Locuteurs (RVC)
Présentation
Méta-package de conversion vocale pour le français, offrant une façade unifiée VCEngine qui sélectionne automatiquement le bon sous-module selon le mode demandé :
- VC ZeroShot (
lectura-vc-zeroshot, ~126 Mo) : OpenVoice v2 — conversion vers n’importe quelle voix via un extrait de référence ou un preset - VC Locuteurs (
lectura-vc-locuteurs, ~1.4 Go) : RVC — conversion vers 6 voix françaises pré-entraînées
| Caractéristique | Valeur |
|---|---|
| Modes | rvc, zeroshot, cascade (RVC + OpenVoice), auto |
| Voix RVC | 6 speakers (3F + 3M) |
| Zero-shot | N’importe quelle voix avec un preset ou 5-10s de référence |
| Presets | 6 voix pré-calculées |
| Blend | Mélange pondéré de presets ou d’extraits audio |
| Backends | ONNX Runtime pur (pas de PyTorch) |
Essayer en ligne
La démo utilise l’API Lectura — aucun téléchargement nécessaire.
Sélectionnez un fichier audio ou enregistrez votre voix, puis cliquez sur Convertir.
Exemple de code
from lectura_vc import creer_engine
engine = creer_engine(mode="auto")
# Mode RVC (voix pré-entraînée)
audio, sr = engine.convert(audio="input.wav", speaker="bernard", mode="rvc")
# Mode Zero-shot (preset)
audio, sr = engine.convert(audio="input.wav", reference="siwis", mode="zeroshot")
# Blend pondéré
audio, sr = engine.convert(
audio="input.wav",
reference={"siwis": 0.5, "nadine": 0.3, "ezwa": 0.2},
mode="zeroshot",
)
# Mode cascade : RVC (proxy genre) + OpenVoice (timbre exact)
audio, sr = engine.convert(
audio="input.wav", speaker="nadine", reference="cible.wav", mode="cascade",
)
Architecture
lectura-vc (meta-package)
┌────────────┴────────────┐
v v
lectura-vc-zeroshot lectura-vc-locuteurs
OpenVoice v2 ONNX RVC ONNX (6 voix)
~126 Mo ~1.4 Go
Briques utilisées
| Brique | Rôle |
|---|---|
| VC ZeroShot | OpenVoice v2 — conversion zero-shot |
| VC Locuteurs | RVC — 6 voix pré-entraînées |
Installation
# Meta-package complet (RVC + zero-shot)
pip install lectura-vc
# Sous-module zero-shot seul (léger, ~126 Mo)
pip install lectura-vc-zeroshot
# Sous-module RVC seul (6 voix, ~1.4 Go)
pip install lectura-vc-locuteurs
Les modules publics utilisent l’API Lectura pour l’inférence. Les backends locaux ONNX nécessitent les modèles pré-entraînés, disponibles sous licence commerciale.