Aynursusuz
/

whisper-medium-music-speech-classifier-v2

Audio Classification

music-speech-classification

Model card Files Files and versions

Whisper Medium Music-Speech Classifier V2

Bu model, Whisper Medium'un fine-tune edilmiş versiyonudur ve ses kayıtlarını müzik ve konuşma olarak sınıflandırır.

Model Detayları

Base Model: openai/whisper-medium
Task: Audio Classification (Music vs Speech)
Dataset: Aynursusuz/original_dataset
Learning Rate: 5e-5
Batch Size: 32
Epochs: 5
Class Weights: [3.0, 1.0] (Music sınıfına öncelik verildi)
Overall Accuracy: 1.0
Music Accuracy: 1.0
Speech Accuracy: 1.0

Özel Özellikler

Bu model, arka planda hafif müzik içeren konuşmaları tespit etmek için özel olarak eğitilmiştir:

Music sınıfına 3x daha fazla ağırlık verildi
5 epoch ile daha iyi generalization sağlandı
Düşük learning rate (5e-5) ile stable training

Kullanım

from transformers import AutoFeatureExtractor, AutoModelForAudioClassification
import torch

feature_extractor = AutoFeatureExtractor.from_pretrained("Aynursusuz/whisper-medium-music-speech-classifier-v2")
model = AutoModelForAudioClassification.from_pretrained("Aynursusuz/whisper-medium-music-speech-classifier-v2")

# Ses dosyanızı yükleyin ve tahmin yapın

Eğitim Bilgileri

Optimizer: AdamW
Warmup Ratio: 0.1
FP16 Training: Evet
Gradient Accumulation Steps: 4
Class Weights: [3.0 (music), 1.0 (speech)]

Label Mapping

0: music (sadece müzik + müzikli konuşma)
1: speech (sadece konuşma)

Downloads last month: 4

Safetensors

Model size

0.3B params

Tensor type

F32

·

Dataset used to train Aynursusuz/whisper-medium-music-speech-classifier-v2

Evaluation results

Overall Accuracy on original_dataset
self-reported

1.000
Music Accuracy on original_dataset
self-reported

1.000
Speech Accuracy on original_dataset
self-reported

1.000