Mise à jour de la doc
This commit is contained in:
parent
b359f8e53d
commit
2ee58f3310
89
README.md
89
README.md
@ -23,7 +23,7 @@ SYSTEM """
|
||||
Tu es un traducteur professionnel spécialisé dans la traduction de texte ukrainien vers le français.
|
||||
Traduis fidèlement et naturellement en respectant l'intonation originale utilisée par l'auteur du texte.
|
||||
Tu ne dois pas interpréter les pensées ou les réflexions de l'auteur.
|
||||
ne rajoutes pas de texte avant ou après le texte fourni.
|
||||
Ne rajoutes pas de texte avant ou après le texte fourni.
|
||||
Tu dois toujours répondre en français.
|
||||
"""
|
||||
```
|
||||
@ -34,4 +34,91 @@ ollama create traductionUkrainienVersFrancais -f .\Modelfile
|
||||
|
||||
## Installation
|
||||
|
||||
### Étapes d'installation
|
||||
|
||||
1. **Cloner ou télécharger le projet**
|
||||
```bash
|
||||
cd chemin/vers/votre/projet
|
||||
git pull https://git.alex-design.fr/Alex/python.traduction
|
||||
```
|
||||
|
||||
2. **Installer les dépendances Python**
|
||||
```bash
|
||||
pip install -r requirements.txt
|
||||
```
|
||||
|
||||
3. **Placer votre fichier PDF** dans le répertoire du projet avec le nom configuré dans `main.py` (par défaut : `TaniaBorecMemoir(Ukr).pdf`)
|
||||
|
||||
---
|
||||
|
||||
## Mode opératoire
|
||||
|
||||
### Préparation
|
||||
|
||||
1. **Démarrer Ollama en mode serveur** sur votre machine (port 11434 par défaut)
|
||||
```bash
|
||||
ollama serve
|
||||
```
|
||||
|
||||
2. **Vérifier que le modèle de traduction est disponible**
|
||||
```bash
|
||||
ollama list
|
||||
```
|
||||
Vous devez voir `traductionUkrainienVersFrancais:latest` dans la liste.
|
||||
Si ce n'est pas le cas, vous devez le générer en suivant la drescription vue plus haut (Création d'un modèle LLM de traduction avec Ollama)
|
||||
|
||||
3. **Placer votre PDF** dans le même répertoire que le script `main.py`
|
||||
|
||||
### Exécution
|
||||
|
||||
1. **Lancer le script de traduction**
|
||||
```bash
|
||||
python main.py
|
||||
```
|
||||
|
||||
2. **Le programme va :**
|
||||
- Extraire le texte de toutes les pages du PDF
|
||||
- Supprimer les numéros de pages
|
||||
- Regrouper les paragraphes qui s'étendent sur plusieurs pages
|
||||
- Diviser le texte en chunks raisonnables (environ 1500 caractères)
|
||||
- Envoyer chaque chunk au LLM pour traduction
|
||||
- Afficher la progression dans le terminal
|
||||
|
||||
3. **Le résultat final** sera généré dans un fichier PDF nommé `[nom_original] (FR).pdf`
|
||||
- Exemple : `TaniaBorecMemoir(Ukr) (FR).pdf`
|
||||
|
||||
### Fichier de sortie
|
||||
|
||||
Le PDF généré contient :
|
||||
- **Titre** : "Traduction - Ukrainien vers Français"
|
||||
- **Contenu** : Les traductions de tous les chunks, préservant la mise en page (sauts de ligne, paragraphes)
|
||||
- **Police** : Support complet du cyrilique (déjà testé avec l'ukrainien)
|
||||
|
||||
---
|
||||
|
||||
## Configuration
|
||||
|
||||
Vous pouvez modifier les paramètres suivants dans `main.py` :
|
||||
|
||||
- `PDF_PATH` : Chemin du fichier PDF à traduire
|
||||
- `OLLAMA_MODEL` : Nom du modèle Ollama à utiliser
|
||||
- `OLLAMA_URL` : URL du serveur Ollama (par défaut : `http://localhost:11434/api/generate`)
|
||||
- `OUTPUT_PDF_PATH` : Chemin et nom du fichier PDF de sortie (généré autoamtiquement)
|
||||
|
||||
---
|
||||
|
||||
## Dépannage
|
||||
|
||||
### Erreur : "Connexion refusée à Ollama"
|
||||
- Vérifiez que Ollama est en cours d'exécution avec `ollama serve`
|
||||
- Vérifiez que l'URL est correcte (par défaut : `http://localhost:11434`)
|
||||
|
||||
### Erreur : "Modèle non trouvé"
|
||||
- Exécutez : `ollama create traductionUkrainienVersFrancais -f .\Modelfile`
|
||||
|
||||
### Le texte n'est pas bien séparé en paragraphes
|
||||
- Le script détecte automatiquement les doubles sauts de ligne
|
||||
- Si absent, il divise par phrases et regroupe en chunks de 1500 caractères
|
||||
|
||||
---
|
||||
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user