Modules outils

Briques atomiques réutilisables du pipeline Lectura. Chaque module est autonome et peut être utilisé indépendamment. Les briques sont combinées par les pipelines métiers pour former des applications complètes.

Traitement du texte

Tokeniseur

Normalisation et tokenisation du français, détection de 15+ types de formules. Extra [formules] pour l'enrichissement automatique.

pip install lectura-tokeniseur

Formules

Lecture des nombres, dates, heures, sigles, monnaies, fractions — avec phonétique IPA.

pip install lectura-formules

Phonémiseur

Modèle BiLSTM multi-tête (1.75M params) : G2P 98.5%, POS, morphologie, liaison. Extras [onnx], [lexique], [all].

pip install lectura-phonemiseur

Graphémiseur

Modèle BiLSTM V7 (3.2M params) : P2G ~95%, attention cross, lex_select. Extras [onnx], [lexique], [all].

pip install lectura-graphemiseur

Aligneur-Syllabeur

Pivot central : alignement graphème-phonème, groupes de lecture, syllabation avec attaque/noyau/coda. Extra [phonemiseur].

pip install lectura-aligneur

Lexique

Outil générique d'accès à un lexique français : conjugaison, rimes, synonymes, anagrammes.

pip install lectura-lexique

Synthèse, reconnaissance et conversion vocale

TTS Monospeaker

Matcha-Conformer + HiFi-GAN (17.9M params) : 7 styles, flow-matching, ~30x temps-réel.

pip install lectura-monospeaker

TTS Multi-Speaker

FastPitch-Lite v6 (24.3M params) : 6 voix, 7 styles, encodeur unifié, ~50x temps-réel.

pip install lectura-multispeaker

TTS Diphone

Concaténation WORLD (1290 diphones) : prosodie réglée, 3 modes de lecture, 44.1 kHz.

pip install lectura-diphone

Décodeur

Décodeur phonétique neural CNN-BiGRU-CTC (10.6M params, PER ~4.34%) + STT-Formules (600K params). Extra [onnx].

pip install lectura-decodeur

VC ZeroShot

OpenVoice v2 ONNX : conversion zero-shot, presets, blend pondéré, trick SR formants (~126 Mo).

pip install lectura-vc-zeroshot

VC Locuteurs

RVC ONNX : 6 voix françaises pré-entraînées (3F + 3M), HuBERT + RMVPE (~1.4 Go).

pip install lectura-vc-locuteurs