Modules outils

Briques atomiques réutilisables du pipeline Lectura. Chaque module est autonome et peut être utilisé indépendamment. Les briques sont combinées par les pipelines métiers pour former des applications complètes.

Traitement du texte

Tokeniseur

Normalisation et tokenisation du français, détection de 15+ types de formules. Extra [formules] pour l'enrichissement automatique.

pip install lectura-tokeniseur

Détails PyPI GitHub

Formules

Lecture des nombres, dates, heures, sigles, monnaies, fractions — avec phonétique IPA.

pip install lectura-formules

Détails PyPI GitHub

Phonémiseur

Modèle BiLSTM multi-tête (1.75M params) : G2P 98.5%, POS, morphologie, liaison. Extras [onnx], [lexique], [all].

pip install lectura-phonemiseur

Détails PyPI GitHub

Graphémiseur

Modèle BiLSTM V7 (3.2M params) : P2G ~95%, attention cross, lex_select. Extras [onnx], [lexique], [all].

pip install lectura-graphemiseur

Détails PyPI GitHub

Aligneur-Syllabeur

Pivot central : alignement graphème-phonème, groupes de lecture, syllabation avec attaque/noyau/coda. Extra [phonemiseur].

pip install lectura-aligneur

Détails PyPI GitHub

Lexique

Outil générique d'accès à un lexique français : conjugaison, rimes, synonymes, anagrammes.

pip install lectura-lexique

Détails PyPI GitHub

Synthèse, reconnaissance et conversion vocale

TTS Monospeaker

Matcha-Conformer + HiFi-GAN (17.9M params) : 7 styles, flow-matching, ~30x temps-réel.

pip install lectura-monospeaker

Détails PyPI GitHub

TTS Multi-Speaker

FastPitch-Lite v6 (24.3M params) : 6 voix, 7 styles, encodeur unifié, ~50x temps-réel.

pip install lectura-multispeaker

Détails PyPI GitHub

TTS Diphone

Concaténation WORLD (1290 diphones) : prosodie réglée, 3 modes de lecture, 44.1 kHz.

pip install lectura-diphone

Détails PyPI GitHub

Décodeur

Décodeur phonétique neural CNN-BiGRU-CTC (10.6M params, PER ~4.34%) + STT-Formules (600K params). Extra [onnx].

pip install lectura-decodeur

Détails PyPI GitHub

VC ZeroShot

OpenVoice v2 ONNX : conversion zero-shot, presets, blend pondéré, trick SR formants (~126 Mo).

pip install lectura-vc-zeroshot

Détails PyPI GitHub

VC Locuteurs

RVC ONNX : 6 voix françaises pré-entraînées (3F + 3M), HuBERT + RMVPE (~1.4 Go).

pip install lectura-vc-locuteurs

Détails PyPI GitHub