YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

Grooming Detection – Slovak GPT-J 162M (SK)

Tento repozitár obsahuje jemne doladený jazykový model Slovak GPT-J 162M určený na binárnu klasifikáciu slovenských textových konverzácií. Model je zameraný na detekciu groomingového a rizikového správania.

Model bol použitý ako jazykovo špecifická alternatíva ku multijazyčným modelom.


Základný model
Milos/slovak-gpt-j-162M

Jazyk
slovenčina

Typ úlohy
binárna klasifikácia textu
0 = bezpečný obsah
1 = rizikový / groomingový obsah


Výsledky na testovacej množine

Accuracy: 0.9867
F1-score: 0.9863
Precision: 1.00
Recall: 0.97297

Konfúzna matica
TN: 38
FP: 0
FN: 1
TP: 36

Model dosahuje veľmi vysokú presnosť a predstavuje silnú alternatívu k XLM-RoBERTa pre slovenský jazyk, najmä v prípadoch, kde je žiaduce využiť generatívnu architektúru.


Obsah repozitára

  • model.safetensors
  • config.json
  • tokenizer.json
  • tokenizer_config.json
  • special_tokens_map.json
  • epoch_results.csv
  • training_log.txt

Použitie

Model je pripravený na použitie cez knižnicu transformers ako AutoModelForSequenceClassification.


Poznámka

Model je určený na výskumné a experimentálne použitie v oblasti bezpečnosti online komunikácie.

Autor: Patrik Gajdoš
Rok: 2025

Downloads last month
4
Safetensors
Model size
0.1B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Space using PatrikGajdos/Slovak_GPTJ162_SK 1