Whisper Medium Music-Speech Classifier V2

Bu model, Whisper Medium'un fine-tune edilmiş versiyonudur ve ses kayıtlarını müzik ve konuşma olarak sınıflandırır.

Model Detayları

  • Base Model: openai/whisper-medium
  • Task: Audio Classification (Music vs Speech)
  • Dataset: Aynursusuz/original_dataset
  • Learning Rate: 5e-5
  • Batch Size: 32
  • Epochs: 5
  • Class Weights: [3.0, 1.0] (Music sınıfına öncelik verildi)
  • Overall Accuracy: 1.0
  • Music Accuracy: 1.0
  • Speech Accuracy: 1.0

Özel Özellikler

Bu model, arka planda hafif müzik içeren konuşmaları tespit etmek için özel olarak eğitilmiştir:

  • Music sınıfına 3x daha fazla ağırlık verildi
  • 5 epoch ile daha iyi generalization sağlandı
  • Düşük learning rate (5e-5) ile stable training

Kullanım

from transformers import AutoFeatureExtractor, AutoModelForAudioClassification
import torch

feature_extractor = AutoFeatureExtractor.from_pretrained("Aynursusuz/whisper-medium-music-speech-classifier-v2")
model = AutoModelForAudioClassification.from_pretrained("Aynursusuz/whisper-medium-music-speech-classifier-v2")

# Ses dosyanızı yükleyin ve tahmin yapın

Eğitim Bilgileri

  • Optimizer: AdamW
  • Warmup Ratio: 0.1
  • FP16 Training: Evet
  • Gradient Accumulation Steps: 4
  • Class Weights: [3.0 (music), 1.0 (speech)]

Label Mapping

  • 0: music (sadece müzik + müzikli konuşma)
  • 1: speech (sadece konuşma)
Downloads last month
4
Safetensors
Model size
0.3B params
Tensor type
F32
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Dataset used to train Aynursusuz/whisper-medium-music-speech-classifier-v2

Evaluation results