Grooming Detection – Slovak GPT-J 162M (SK)
Tento repozitár obsahuje jemne doladený jazykový model Slovak GPT-J 162M určený na binárnu klasifikáciu slovenských textových konverzácií. Model je zameraný na detekciu groomingového a rizikového správania.
Model bol použitý ako jazykovo špecifická alternatíva ku multijazyčným modelom.
Základný model
Milos/slovak-gpt-j-162M
Jazyk
slovenčina
Typ úlohy
binárna klasifikácia textu
0 = bezpečný obsah
1 = rizikový / groomingový obsah
Výsledky na testovacej množine
Accuracy: 0.9867
F1-score: 0.9863
Precision: 1.00
Recall: 0.97297
Konfúzna matica
TN: 38
FP: 0
FN: 1
TP: 36
Model dosahuje veľmi vysokú presnosť a predstavuje silnú alternatívu k XLM-RoBERTa pre slovenský jazyk, najmä v prípadoch, kde je žiaduce využiť generatívnu architektúru.
Obsah repozitára
- model.safetensors
- config.json
- tokenizer.json
- tokenizer_config.json
- special_tokens_map.json
- epoch_results.csv
- training_log.txt
Použitie
Model je pripravený na použitie cez knižnicu transformers ako AutoModelForSequenceClassification.
Poznámka
Model je určený na výskumné a experimentálne použitie v oblasti bezpečnosti online komunikácie.
Autor: Patrik Gajdoš
Rok: 2025
- Downloads last month
- 4