Modules outils
Briques atomiques réutilisables du pipeline Lectura. Chaque module est autonome et peut être utilisé indépendamment. Les briques sont combinées par les pipelines métiers pour former des applications complètes.
Traitement du texte
Tokeniseur
Normalisation et tokenisation du français, détection de 15+ types de formules. Extra [formules] pour l'enrichissement automatique.
pip install lectura-tokeniseur
Formules
Lecture des nombres, dates, heures, sigles, monnaies, fractions — avec phonétique IPA.
pip install lectura-formules
Phonémiseur
Modèle BiLSTM multi-tête (1.75M params) : G2P 98.5%, POS, morphologie, liaison. Extras [onnx], [lexique], [all].
pip install lectura-phonemiseur
Graphémiseur
Modèle BiLSTM V7 (3.2M params) : P2G ~95%, attention cross, lex_select. Extras [onnx], [lexique], [all].
pip install lectura-graphemiseur
Aligneur-Syllabeur
Pivot central : alignement graphème-phonème, groupes de lecture, syllabation avec attaque/noyau/coda. Extra [phonemiseur].
pip install lectura-aligneur
Synthèse, reconnaissance et conversion vocale
TTS Monospeaker
Matcha-Conformer + HiFi-GAN (17.9M params) : 7 styles, flow-matching, ~30x temps-réel.
pip install lectura-monospeaker
TTS Multi-Speaker
FastPitch-Lite v6 (24.3M params) : 6 voix, 7 styles, encodeur unifié, ~50x temps-réel.
pip install lectura-multispeaker
TTS Diphone
Concaténation WORLD (1290 diphones) : prosodie réglée, 3 modes de lecture, 44.1 kHz.
pip install lectura-diphone
Décodeur
Décodeur phonétique neural CNN-BiGRU-CTC (10.6M params, PER ~4.34%) + STT-Formules (600K params). Extra [onnx].
pip install lectura-decodeur
VC ZeroShot
OpenVoice v2 ONNX : conversion zero-shot, presets, blend pondéré, trick SR formants (~126 Mo).
pip install lectura-vc-zeroshot