Whisper Medium Music-Speech Classifier V2
Bu model, Whisper Medium'un fine-tune edilmiş versiyonudur ve ses kayıtlarını müzik ve konuşma olarak sınıflandırır.
Model Detayları
- Base Model: openai/whisper-medium
- Task: Audio Classification (Music vs Speech)
- Dataset: Aynursusuz/original_dataset
- Learning Rate: 5e-5
- Batch Size: 32
- Epochs: 5
- Class Weights: [3.0, 1.0] (Music sınıfına öncelik verildi)
- Overall Accuracy: 1.0
- Music Accuracy: 1.0
- Speech Accuracy: 1.0
Özel Özellikler
Bu model, arka planda hafif müzik içeren konuşmaları tespit etmek için özel olarak eğitilmiştir:
- Music sınıfına 3x daha fazla ağırlık verildi
- 5 epoch ile daha iyi generalization sağlandı
- Düşük learning rate (5e-5) ile stable training
Kullanım
from transformers import AutoFeatureExtractor, AutoModelForAudioClassification
import torch
feature_extractor = AutoFeatureExtractor.from_pretrained("Aynursusuz/whisper-medium-music-speech-classifier-v2")
model = AutoModelForAudioClassification.from_pretrained("Aynursusuz/whisper-medium-music-speech-classifier-v2")
# Ses dosyanızı yükleyin ve tahmin yapın
Eğitim Bilgileri
- Optimizer: AdamW
- Warmup Ratio: 0.1
- FP16 Training: Evet
- Gradient Accumulation Steps: 4
- Class Weights: [3.0 (music), 1.0 (speech)]
Label Mapping
- 0: music (sadece müzik + müzikli konuşma)
- 1: speech (sadece konuşma)
- Downloads last month
- 4
Dataset used to train Aynursusuz/whisper-medium-music-speech-classifier-v2
Evaluation results
- Overall Accuracy on original_datasetself-reported1.000
- Music Accuracy on original_datasetself-reported1.000
- Speech Accuracy on original_datasetself-reported1.000