Pipeline VC

Pipeline VoiceConversion

Méta-package unifié — sélection automatique ZeroShot (OpenVoice) ou Locuteurs (RVC)

Présentation

Méta-package de conversion vocale pour le français, offrant une façade unifiée VCEngine qui sélectionne automatiquement le bon sous-module selon le mode demandé :

  • VC ZeroShot (lectura-vc-zeroshot, ~126 Mo) : OpenVoice v2 — conversion vers n’importe quelle voix via un extrait de référence ou un preset
  • VC Locuteurs (lectura-vc-locuteurs, ~1.4 Go) : RVC — conversion vers 6 voix françaises pré-entraînées
Caractéristique Valeur
Modes rvc, zeroshot, cascade (RVC + OpenVoice), auto
Voix RVC 6 speakers (3F + 3M)
Zero-shot N’importe quelle voix avec un preset ou 5-10s de référence
Presets 6 voix pré-calculées
Blend Mélange pondéré de presets ou d’extraits audio
Backends ONNX Runtime pur (pas de PyTorch)

Essayer en ligne

La démo utilise l’API Lectura — aucun téléchargement nécessaire.

(Aucun fichier sélectionné) ou
Sélectionnez un fichier audio ou enregistrez votre voix, puis cliquez sur Convertir.

Exemple de code

from lectura_vc import creer_engine

engine = creer_engine(mode="auto")

# Mode RVC (voix pré-entraînée)
audio, sr = engine.convert(audio="input.wav", speaker="bernard", mode="rvc")

# Mode Zero-shot (preset)
audio, sr = engine.convert(audio="input.wav", reference="siwis", mode="zeroshot")

# Blend pondéré
audio, sr = engine.convert(
    audio="input.wav",
    reference={"siwis": 0.5, "nadine": 0.3, "ezwa": 0.2},
    mode="zeroshot",
)

# Mode cascade : RVC (proxy genre) + OpenVoice (timbre exact)
audio, sr = engine.convert(
    audio="input.wav", speaker="nadine", reference="cible.wav", mode="cascade",
)

Architecture

                    lectura-vc (meta-package)
                 ┌────────────┴────────────┐
                 v                         v
     lectura-vc-zeroshot          lectura-vc-locuteurs
       OpenVoice v2 ONNX            RVC ONNX (6 voix)
         ~126 Mo                       ~1.4 Go

Briques utilisées

Brique Rôle
VC ZeroShot OpenVoice v2 — conversion zero-shot
VC Locuteurs RVC — 6 voix pré-entraînées

Installation

# Meta-package complet (RVC + zero-shot)
pip install lectura-vc

# Sous-module zero-shot seul (léger, ~126 Mo)
pip install lectura-vc-zeroshot

# Sous-module RVC seul (6 voix, ~1.4 Go)
pip install lectura-vc-locuteurs

Les modules publics utilisent l’API Lectura pour l’inférence. Les backends locaux ONNX nécessitent les modèles pré-entraînés, disponibles sous licence commerciale.