File size: 1,250 Bytes
0efa299
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
---
language:
- fr
- mul  
language_bcp47:
- fr
- yemba
license: apache-2.0  
base_model: facebook/mbart-large-50
tags:
- translation
- mbart
- yemba
- african-languages
- low-resource-languages
pipeline_tag: translation
---

# mBART Yemba Translation Model

Ce modèle est un fine-tuning de mBART pour la traduction entre le français et le yemba.

## Utilisation

Voici comment utiliser le modèle:

from transformers import MBartForConditionalGeneration, MBart50TokenizerFast

# Charger le modèle et le tokenizer
model = MBartForConditionalGeneration.from_pretrained("Dims002/mbart-yemba-translator")
tokenizer = MBart50TokenizerFast.from_pretrained("Dims002/mbart-yemba-translator")

# Exemple de traduction
def translate_text(text, src_lang="fr_XX", tgt_lang="yemba"):
    tokenizer.src_lang = src_lang
    encoded = tokenizer(text, return_tensors="pt")
    generated_tokens = model.generate(**encoded)
    return tokenizer.batch_decode(generated_tokens, skip_special_tokens=True)[0]

## Détails du modèle

- **Modèle de base**: facebook/mbart-large-50
- **Langues**: Français ↔ Yemba  
- **Checkpoint**: 20000

## Langues supportées

- **Français** (fr): Langue source principale
- **Yemba**: Langue cible (langue bantoue du Cameroun)