|
|
|
@ -23,7 +23,7 @@ SYSTEM """ |
|
|
|
Tu es un traducteur professionnel spécialisé dans la traduction de texte ukrainien vers le français. |
|
|
|
Traduis fidèlement et naturellement en respectant l'intonation originale utilisée par l'auteur du texte. |
|
|
|
Tu ne dois pas interpréter les pensées ou les réflexions de l'auteur. |
|
|
|
ne rajoutes pas de texte avant ou après le texte fourni. |
|
|
|
Ne rajoutes pas de texte avant ou après le texte fourni. |
|
|
|
Tu dois toujours répondre en français. |
|
|
|
""" |
|
|
|
``` |
|
|
|
@ -34,4 +34,91 @@ ollama create traductionUkrainienVersFrancais -f .\Modelfile |
|
|
|
|
|
|
|
## Installation |
|
|
|
|
|
|
|
### Étapes d'installation |
|
|
|
|
|
|
|
1. **Cloner ou télécharger le projet** |
|
|
|
```bash |
|
|
|
cd chemin/vers/votre/projet |
|
|
|
git pull https://git.alex-design.fr/Alex/python.traduction |
|
|
|
``` |
|
|
|
|
|
|
|
2. **Installer les dépendances Python** |
|
|
|
```bash |
|
|
|
pip install -r requirements.txt |
|
|
|
``` |
|
|
|
|
|
|
|
3. **Placer votre fichier PDF** dans le répertoire du projet avec le nom configuré dans `main.py` (par défaut : `TaniaBorecMemoir(Ukr).pdf`) |
|
|
|
|
|
|
|
--- |
|
|
|
|
|
|
|
## Mode opératoire |
|
|
|
|
|
|
|
### Préparation |
|
|
|
|
|
|
|
1. **Démarrer Ollama en mode serveur** sur votre machine (port 11434 par défaut) |
|
|
|
```bash |
|
|
|
ollama serve |
|
|
|
``` |
|
|
|
|
|
|
|
2. **Vérifier que le modèle de traduction est disponible** |
|
|
|
```bash |
|
|
|
ollama list |
|
|
|
``` |
|
|
|
Vous devez voir `traductionUkrainienVersFrancais:latest` dans la liste. |
|
|
|
Si ce n'est pas le cas, vous devez le générer en suivant la drescription vue plus haut (Création d'un modèle LLM de traduction avec Ollama) |
|
|
|
|
|
|
|
3. **Placer votre PDF** dans le même répertoire que le script `main.py` |
|
|
|
|
|
|
|
### Exécution |
|
|
|
|
|
|
|
1. **Lancer le script de traduction** |
|
|
|
```bash |
|
|
|
python main.py |
|
|
|
``` |
|
|
|
|
|
|
|
2. **Le programme va :** |
|
|
|
- Extraire le texte de toutes les pages du PDF |
|
|
|
- Supprimer les numéros de pages |
|
|
|
- Regrouper les paragraphes qui s'étendent sur plusieurs pages |
|
|
|
- Diviser le texte en chunks raisonnables (environ 1500 caractères) |
|
|
|
- Envoyer chaque chunk au LLM pour traduction |
|
|
|
- Afficher la progression dans le terminal |
|
|
|
|
|
|
|
3. **Le résultat final** sera généré dans un fichier PDF nommé `[nom_original] (FR).pdf` |
|
|
|
- Exemple : `TaniaBorecMemoir(Ukr) (FR).pdf` |
|
|
|
|
|
|
|
### Fichier de sortie |
|
|
|
|
|
|
|
Le PDF généré contient : |
|
|
|
- **Titre** : "Traduction - Ukrainien vers Français" |
|
|
|
- **Contenu** : Les traductions de tous les chunks, préservant la mise en page (sauts de ligne, paragraphes) |
|
|
|
- **Police** : Support complet du cyrilique (déjà testé avec l'ukrainien) |
|
|
|
|
|
|
|
--- |
|
|
|
|
|
|
|
## Configuration |
|
|
|
|
|
|
|
Vous pouvez modifier les paramètres suivants dans `main.py` : |
|
|
|
|
|
|
|
- `PDF_PATH` : Chemin du fichier PDF à traduire |
|
|
|
- `OLLAMA_MODEL` : Nom du modèle Ollama à utiliser |
|
|
|
- `OLLAMA_URL` : URL du serveur Ollama (par défaut : `http://localhost:11434/api/generate`) |
|
|
|
- `OUTPUT_PDF_PATH` : Chemin et nom du fichier PDF de sortie (généré autoamtiquement) |
|
|
|
|
|
|
|
--- |
|
|
|
|
|
|
|
## Dépannage |
|
|
|
|
|
|
|
### Erreur : "Connexion refusée à Ollama" |
|
|
|
- Vérifiez que Ollama est en cours d'exécution avec `ollama serve` |
|
|
|
- Vérifiez que l'URL est correcte (par défaut : `http://localhost:11434`) |
|
|
|
|
|
|
|
### Erreur : "Modèle non trouvé" |
|
|
|
- Exécutez : `ollama create traductionUkrainienVersFrancais -f .\Modelfile` |
|
|
|
|
|
|
|
### Le texte n'est pas bien séparé en paragraphes |
|
|
|
- Le script détecte automatiquement les doubles sauts de ligne |
|
|
|
- Si absent, il divise par phrases et regroupe en chunks de 1500 caractères |
|
|
|
|
|
|
|
--- |
|
|
|
|