Update model with LoRA adapter

Files changed (6) hide show

adapter_config.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"has_adapter": true, "adapter_path": "speech-lora", "adapter_name": "speech"}

config.json CHANGED Viewed

@@ -56,6 +56,13 @@
   "initializer_range": 0.02,
   "mm_tokens_per_image": 256,
   "model_type": "gemma3",
   "text_config": {
     "attention_bias": false,
     "attention_dropout": 0.0,
@@ -88,7 +95,6 @@
   },
   "torch_dtype": "bfloat16",
   "transformers_version": "4.50.0.dev0",
-  "use_cache": false,
   "vision_config": {
     "attention_dropout": 0.0,
     "hidden_act": "gelu_pytorch_tanh",

   "initializer_range": 0.02,
   "mm_tokens_per_image": 256,
   "model_type": "gemma3",
+  "speech_lora": {
+    "dp": 0.01,
+    "layer": "((layers.*self_attn\\.(q|k|v|o)_proj)|(layers.*mlp\\.(gate|up|down)_proj))",
+    "lora_alpha": 320,
+    "r": 320,
+    "use_rslora": true
+  },
   "text_config": {
     "attention_bias": false,
     "attention_dropout": 0.0,
   },
   "torch_dtype": "bfloat16",
   "transformers_version": "4.50.0.dev0",
   "vision_config": {
     "attention_dropout": 0.0,
     "hidden_act": "gelu_pytorch_tanh",

model-00001-of-00002.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:359fa424f2e7615f034d375534773a31c8d710f1b91a3672e7067c1d12dc46f6
 size 4991785040

 version https://git-lfs.github.com/spec/v1
+oid sha256:a1ce1cb9238b56dba8ac52c728d2e62854a3b0dc601e64bd5e5b047a69bd3630
 size 4991785040

{speech-adapter → speech-lora}/README.md RENAMED Viewed

File without changes

{speech-adapter → speech-lora/speech}/adapter_config.json RENAMED Viewed

@@ -12,25 +12,17 @@
   "layers_pattern": null,
   "layers_to_transform": null,
   "loftq_config": {},
-  "lora_alpha": 256,
   "lora_bias": false,
-  "lora_dropout": 0.1,
   "megatron_config": null,
   "megatron_core": "megatron.core",
   "modules_to_save": null,
   "peft_type": "LORA",
-  "r": 256,
   "rank_pattern": {},
   "revision": null,
-  "target_modules": [
-    "q_proj",
-    "down_proj",
-    "k_proj",
-    "gate_proj",
-    "o_proj",
-    "v_proj",
-    "up_proj"
-  ],
   "task_type": "CAUSAL_LM",
   "use_dora": false,
   "use_rslora": true

   "layers_pattern": null,
   "layers_to_transform": null,
   "loftq_config": {},
+  "lora_alpha": 320,
   "lora_bias": false,
+  "lora_dropout": 0.01,
   "megatron_config": null,
   "megatron_core": "megatron.core",
   "modules_to_save": null,
   "peft_type": "LORA",
+  "r": 320,
   "rank_pattern": {},
   "revision": null,
+  "target_modules": "((layers.*self_attn\\.(q|k|v|o)_proj)|(layers.*mlp\\.(gate|up|down)_proj))",
   "task_type": "CAUSAL_LM",
   "use_dora": false,
   "use_rslora": true

{speech-adapter → speech-lora/speech}/adapter_model.safetensors RENAMED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:5b9f85495344e7e201e6646cf2d7ff7fb6084dcf62856f9164f6420f997de058
-size 1907425096

 version https://git-lfs.github.com/spec/v1
+oid sha256:7aacfcd0281ad18acbaac412bb2a23469adeb909011b08b384d7374cd611d423
+size 2384262280