junnei
/

gemma-3-4b-it-speech

Automatic Speech Recognition

feature-extraction

Model card Files Files and versions

junnei commited on Mar 29

Commit

9c3cebd

·

verified ·

1 Parent(s): badc51c

Upload modeling_gemma3mm.py

Files changed (1) hide show

modeling_gemma3mm.py +4 -4

modeling_gemma3mm.py CHANGED Viewed

@@ -24,7 +24,7 @@ from transformers.utils import (
 from transformers.utils.deprecation import deprecate_kwarg
 from transformers import AutoModel, AutoModelForCausalLM
-from transformers.models.gemma3.modeling_gemma3 import Gemma3CausalLMOutputWithPast, Gemma3PreTrainedModel, Gemma3MultiModalProjector
 from transformers import AutoConfig, AutoModelForCausalLM
@@ -337,7 +337,7 @@ class Gemma3MMForConditionalGeneration(Gemma3MMPreTrainedModel, GenerationMixin)
     @deprecate_kwarg("num_logits_to_keep", version="4.50", new_name="logits_to_keep")
     @add_start_docstrings_to_model_forward(GEMMA3_INPUTS_DOCSTRING)
-    @replace_return_docstrings(output_type=Gemma3CausalLMOutputWithPast, config_class=_CONFIG_FOR_DOC)
     def forward(
         self,
         input_ids: torch.LongTensor = None,
@@ -359,7 +359,7 @@ class Gemma3MMForConditionalGeneration(Gemma3MMPreTrainedModel, GenerationMixin)
         return_dict: Optional[bool] = None,
         logits_to_keep: Union[int, torch.Tensor] = 0,
         **lm_kwargs,
-    ) -> Union[Tuple, Gemma3CausalLMOutputWithPast]:
         r"""
             labels (`torch.LongTensor` of shape `(batch_size, sequence_length)`, *optional*):
                 Labels for computing the masked language modeling loss. Indices should either be in `[0, ...,
@@ -551,7 +551,7 @@ class Gemma3MMForConditionalGeneration(Gemma3MMPreTrainedModel, GenerationMixin)
             output = (logits,) + outputs[1:]
             return (loss,) + output if loss is not None else output
-        return Gemma3CausalLMOutputWithPast(
             loss=loss,
             logits=logits,
             past_key_values=outputs.past_key_values,

 from transformers.utils.deprecation import deprecate_kwarg
 from transformers import AutoModel, AutoModelForCausalLM
+from transformers.models.gemma3.modeling_gemma3 import Gemma3PreTrainedModel, Gemma3MultiModalProjector
 from transformers import AutoConfig, AutoModelForCausalLM
     @deprecate_kwarg("num_logits_to_keep", version="4.50", new_name="logits_to_keep")
     @add_start_docstrings_to_model_forward(GEMMA3_INPUTS_DOCSTRING)
+    @replace_return_docstrings(output_type=Gemma3MMCausalLMOutputWithPast, config_class=_CONFIG_FOR_DOC)
     def forward(
         self,
         input_ids: torch.LongTensor = None,
         return_dict: Optional[bool] = None,
         logits_to_keep: Union[int, torch.Tensor] = 0,
         **lm_kwargs,
+    ) -> Union[Tuple, Gemma3MMCausalLMOutputWithPast]:
         r"""
             labels (`torch.LongTensor` of shape `(batch_size, sequence_length)`, *optional*):
                 Labels for computing the masked language modeling loss. Indices should either be in `[0, ...,
             output = (logits,) + outputs[1:]
             return (loss,) + output if loss is not None else output
+        return Gemma3MMCausalLMOutputWithPast(
             loss=loss,
             logits=logits,
             past_key_values=outputs.past_key_values,