VC Locuteurs

Lectura VC Locuteurs

Conversion vocale RVC vers 6 voix françaises pré-entraînées — ONNX pur

PyPI GitHub pip install lectura-vc-locuteurs

Présentation

Brique atomique de conversion vocale basée sur RVC (Retrieval-based Voice Conversion) avec 6 voix françaises pré-entraînées. Chaque voix dispose de son propre modèle synthesizer, entraîné sur un corpus de haute qualité.

Caractéristique	Valeur
Voix	6 speakers (3F + 3M) : Ezwa, Nadine, Siwis, Bernard, Gilles, Zeckou
Backend	HuBERT + RMVPE + Synthesizer — ONNX Runtime pur
Modèles	8 fichiers ONNX (~1.4 Go total)
Sortie	Audio @ 48000 Hz
Contrôles	protect, pitch_modification
Auto-adaptation	Pitch et protection ajustés selon le genre du speaker

Brique vs Meta-package : Le VC Locuteurs est la brique RVC seule. Pour le méta-package unifié (ZeroShot + RVC Locuteurs), voir lectura-vc.

Essayer en ligne

Essayer la conversion vocale en ligne →

Voix disponibles

Speaker	Genre	Caractère
siwis	F	Voix féminine claire, studio
ezwa	F	Voix féminine douce, chaleureuse
nadine	F	Voix féminine naturelle
bernard	M	Voix masculine posée
gilles	M	Voix masculine grave
zeckou	M	Voix masculine dynamique

Exemple de code

from lectura_vc_locuteurs import creer_engine, RVC_SPEAKERS

engine = creer_engine()

# Conversion vers Bernard
audio, sr = engine.convert(
    audio="input.wav",
    speaker="bernard",
)
# sr == 48000

# Liste des speakers
print(RVC_SPEAKERS)
# ['ezwa', 'nadine', 'bernard', 'gilles', 'zeckou', 'siwis']

# Avec ajustement de pitch
audio, sr = engine.convert(
    audio="input.wav",
    speaker="nadine",
    pitch_modification=2,    # monter de 2 demi-tons
)

# Fonction de commodité (crée un engine éphémère)
from lectura_vc_locuteurs import convertir

audio, sr = convertir("input.wav", speaker="siwis")

Architecture

Audio source --> HuBERT (features vocales) --> RMVPE (estimation F0)
                                                      |
                                         Synthesizer_{speaker} (ONNX)
                                                      |
                                               Audio converti @ 48000 Hz

Les 8 modèles ONNX :

hubert.onnx (361 Mo) — extraction de features vocales
rmvpe.onnx (345 Mo) — estimation de fréquence fondamentale (F0)
6x synthesizer_{speaker}.onnx (~116 Mo chacun) — synthesizers RVC par voix

Installation

pip install lectura-vc-locuteurs   # module public (~7 Ko)

Le module public utilise l’API Lectura pour l’inférence. Le backend local ONNX nécessite les modèles pré-entraînés (~1.4 Go), disponibles sous licence commerciale.

Caractéristiques techniques

RVC ONNX : HuBERT + RMVPE + Synthesizer, 6 voix pré-entraînées
Auto-adaptation : détection automatique du pitch source, ajustement selon le speaker cible
Lazy loading : chaque synthesizer chargé à la demande (premier appel)
ONNX Runtime pur : pas de dépendance PyTorch
Python 3.10+ avec type hints complets (PEP-561)
Licence : AGPL-3.0 (code) — les modèles sont sous licence commerciale