| @@ -23,7 +23,7 @@ SYSTEM """ | |||
| Tu es un traducteur professionnel spécialisé dans la traduction de texte ukrainien vers le français. | |||
| Traduis fidèlement et naturellement en respectant l'intonation originale utilisée par l'auteur du texte. | |||
| Tu ne dois pas interpréter les pensées ou les réflexions de l'auteur. | |||
| ne rajoutes pas de texte avant ou après le texte fourni. | |||
| Ne rajoutes pas de texte avant ou après le texte fourni. | |||
| Tu dois toujours répondre en français. | |||
| """ | |||
| ``` | |||
| @@ -34,4 +34,91 @@ ollama create traductionUkrainienVersFrancais -f .\Modelfile | |||
| ## Installation | |||
| ### Étapes d'installation | |||
| 1. **Cloner ou télécharger le projet** | |||
| ```bash | |||
| cd chemin/vers/votre/projet | |||
| git pull https://git.alex-design.fr/Alex/python.traduction | |||
| ``` | |||
| 2. **Installer les dépendances Python** | |||
| ```bash | |||
| pip install -r requirements.txt | |||
| ``` | |||
| 3. **Placer votre fichier PDF** dans le répertoire du projet avec le nom configuré dans `main.py` (par défaut : `TaniaBorecMemoir(Ukr).pdf`) | |||
| --- | |||
| ## Mode opératoire | |||
| ### Préparation | |||
| 1. **Démarrer Ollama en mode serveur** sur votre machine (port 11434 par défaut) | |||
| ```bash | |||
| ollama serve | |||
| ``` | |||
| 2. **Vérifier que le modèle de traduction est disponible** | |||
| ```bash | |||
| ollama list | |||
| ``` | |||
| Vous devez voir `traductionUkrainienVersFrancais:latest` dans la liste. | |||
| Si ce n'est pas le cas, vous devez le générer en suivant la drescription vue plus haut (Création d'un modèle LLM de traduction avec Ollama) | |||
| 3. **Placer votre PDF** dans le même répertoire que le script `main.py` | |||
| ### Exécution | |||
| 1. **Lancer le script de traduction** | |||
| ```bash | |||
| python main.py | |||
| ``` | |||
| 2. **Le programme va :** | |||
| - Extraire le texte de toutes les pages du PDF | |||
| - Supprimer les numéros de pages | |||
| - Regrouper les paragraphes qui s'étendent sur plusieurs pages | |||
| - Diviser le texte en chunks raisonnables (environ 1500 caractères) | |||
| - Envoyer chaque chunk au LLM pour traduction | |||
| - Afficher la progression dans le terminal | |||
| 3. **Le résultat final** sera généré dans un fichier PDF nommé `[nom_original] (FR).pdf` | |||
| - Exemple : `TaniaBorecMemoir(Ukr) (FR).pdf` | |||
| ### Fichier de sortie | |||
| Le PDF généré contient : | |||
| - **Titre** : "Traduction - Ukrainien vers Français" | |||
| - **Contenu** : Les traductions de tous les chunks, préservant la mise en page (sauts de ligne, paragraphes) | |||
| - **Police** : Support complet du cyrilique (déjà testé avec l'ukrainien) | |||
| --- | |||
| ## Configuration | |||
| Vous pouvez modifier les paramètres suivants dans `main.py` : | |||
| - `PDF_PATH` : Chemin du fichier PDF à traduire | |||
| - `OLLAMA_MODEL` : Nom du modèle Ollama à utiliser | |||
| - `OLLAMA_URL` : URL du serveur Ollama (par défaut : `http://localhost:11434/api/generate`) | |||
| - `OUTPUT_PDF_PATH` : Chemin et nom du fichier PDF de sortie (généré autoamtiquement) | |||
| --- | |||
| ## Dépannage | |||
| ### Erreur : "Connexion refusée à Ollama" | |||
| - Vérifiez que Ollama est en cours d'exécution avec `ollama serve` | |||
| - Vérifiez que l'URL est correcte (par défaut : `http://localhost:11434`) | |||
| ### Erreur : "Modèle non trouvé" | |||
| - Exécutez : `ollama create traductionUkrainienVersFrancais -f .\Modelfile` | |||
| ### Le texte n'est pas bien séparé en paragraphes | |||
| - Le script détecte automatiquement les doubles sauts de ligne | |||
| - Si absent, il divise par phrases et regroupe en chunks de 1500 caractères | |||
| --- | |||