Model şehir isimlerinde aşırı yüksek toxicity skorları veriyor
Merhaba,
Modeli çok severek kullanıyoruz. Ancak şehir isimleri üzerinde test ederken birçok tamamen nötr kelime için beklenmedik şekilde çok yüksek toxicity skorları döndürdüğünü fark ettim. Aşağıda örnek olarak aldığım en yüksek 10 sonuç bulunuyor:
Mardin - 0.9948
Belçika - 0.9947
Diyarbakır - 0.9873
Gaziantep - 0.9750
Bartın - 0.9625
Giresun - 0.9553
Çorum - 0.9432
Elazığ - 0.9426
Çanakkale - 0.9102
Sakarya - 0.8902
Bu şehir isimlerinin toxicity açısından nötr olması gerektiğini düşünüyorum, fakat model bunları çok yüksek riskli olarak etiketliyor.
Bu davranışın sebebi eğitim verilerinden kaynaklanıyor olabilir mi? Herhangi bir güncelleme, ek bilgi veya tavsiye paylaşabilir misiniz?
Teşekkürler
merhaba, bu model tek kelimeden ziyade cümleler için eğitilmişti. ondan dolayı bazı kelimelerde yanlış skorlar almanız gayet normal büyük ihtimalle sadece şehir isimlerinde değil diğer hakaret olmayan kelimelerde de benzer sıkıntılar olacaktır.
kelimeler üzerinde toxicity detection yapmanız gerekiyorsa başka çözümlere yönelmenizi öneriyorum