From 8dfb2b81e074f47a96670f52da615aef257c9965 Mon Sep 17 00:00:00 2001 From: Alex Date: Mon, 12 Jan 2026 16:43:33 +0100 Subject: [PATCH] conversion du fichier tsv en json --- ...> Paires-de-phrases-en-ukrainien-francais-2026-01-06.tsv} | 0 Finetunning/{traductions.json => paires.json} | 5 ----- Finetunning/tsv2json.py | 2 +- 3 files changed, 1 insertion(+), 6 deletions(-) rename Finetunning/{Paires de phrases en ukrainien-français - 2026-01-06.tsv => Paires-de-phrases-en-ukrainien-francais-2026-01-06.tsv} (100%) rename Finetunning/{traductions.json => paires.json} (99%) diff --git a/Finetunning/Paires de phrases en ukrainien-français - 2026-01-06.tsv b/Finetunning/Paires-de-phrases-en-ukrainien-francais-2026-01-06.tsv similarity index 100% rename from Finetunning/Paires de phrases en ukrainien-français - 2026-01-06.tsv rename to Finetunning/Paires-de-phrases-en-ukrainien-francais-2026-01-06.tsv diff --git a/Finetunning/traductions.json b/Finetunning/paires.json similarity index 99% rename from Finetunning/traductions.json rename to Finetunning/paires.json index ba6850a..e43c198 100644 --- a/Finetunning/traductions.json +++ b/Finetunning/paires.json @@ -11,13 +11,11 @@ {"text": "Як на мене, то наразі помовчу.", "translation": "En ce qui me concerne, je n’ai pour le moment rien à dire."} {"text": "Мій дядько вчора помер від раку шлунку.", "translation": "Mon oncle est mort hier d’un cancer à l’estomac."} {"text": "Я не знаю, що ще можна зробити.", "translation": "Je ne sais plus quoi faire."} -{"text": "Я навчився жити без неї.", "translation": "J’ai appris à vivre sans elle."} {"text": "Я навчився жити без неї.", "translation": "J'ai appris à vivre sans elle."} {"text": "Справді?", "translation": "Vraiment ?"} {"text": "Справді?", "translation": "C'est vrai ?"} {"text": "Справді?", "translation": "Vrai ?"} {"text": "Мені завжди більше подобалися загадкові персонажі.", "translation": "J’ai toujours préféré les personnages mystérieux."} -{"text": "Мені завжди більше подобалися загадкові персонажі.", "translation": "J'ai toujours préféré les personnages mystérieux."} {"text": "Мені завжди більше подобалися загадкові персонажі.", "translation": "J'ai toujours plus apprécié les personnages mystérieux."} {"text": "Тобі краще поспати.", "translation": "Tu ferais mieux de dormir."} {"text": "Обдумай це.", "translation": "Penses-y."} @@ -69,7 +67,6 @@ {"text": "Ця традиція зародилася в Китаї.", "translation": "Cette tradition est née en Chine."} {"text": "У Японії є дипломатичні стосунки з Китаєм.", "translation": "Le Japon a des relations diplomatiques avec la Chine."} {"text": "Він повернувся з Китаю.", "translation": "Il est revenu de Chine."} -{"text": "Він повернувся з Китаю.", "translation": "Il est reparti de Chine."} {"text": "Він повернувся з Китаю.", "translation": "Il revint de Chine."} {"text": "Він повернувся з Китаю.", "translation": "Il est rentré de Chine."} {"text": "Він написав книжку про порцеляну.", "translation": "Il a écrit un livre sur la porcelaine."} @@ -125,7 +122,6 @@ {"text": "Я кохаю тебе.", "translation": "Je t'aime !"} {"text": "З днем народження!", "translation": "Bon anniversaire !"} {"text": "З днем народження!", "translation": "Joyeux anniversaire !"} -{"text": "З днем народження!", "translation": "Joyeux anniversaire."} {"text": "Кожному своє.", "translation": "À chacun son goût."} {"text": "Кожному своє.", "translation": "Chacun son truc."} {"text": "Скільки це коштує?", "translation": "Ça coûte combien ?"} @@ -171,7 +167,6 @@ {"text": "В інтернеті мало сайтів татарською мовою.", "translation": "Il y a peu de sites en langue Tatar sur Internet."} {"text": "Удачі на іспиті!", "translation": "Bonne chance pour ton examen !"} {"text": "Де ти живеш?", "translation": "Où habites-tu ?"} -{"text": "Де ти живеш?", "translation": "Où résides-tu ?"} {"text": "Де ти живеш?", "translation": "Tu habites où ?"} {"text": "Де ти живеш?", "translation": "Où demeures-tu ?"} {"text": "Де ти живеш?", "translation": "Où vis-tu ?"} diff --git a/Finetunning/tsv2json.py b/Finetunning/tsv2json.py index 56671b0..4aa3352 100644 --- a/Finetunning/tsv2json.py +++ b/Finetunning/tsv2json.py @@ -2,7 +2,7 @@ import json from collections import defaultdict # Chemin vers ton fichier d'entrée et de sortie -input_file = "Paires de phrases en ukrainien-français - 2026-01-06.tsv" # Remplace par ton chemin +input_file = "Paires-de-phrases-en-ukrainien-francais-2026-01-06.tsv" # Remplace par ton chemin output_file = "paires.json" # Fichier de sortie # Dictionnaire pour stocker les paires uniques (clé = phrase ukrainienne, valeur = liste de traductions)