Spaces:

Turkiii0
/

UT-AI

Runtime error

App Files Files Community

Turkiii0 commited on Dec 12, 2025

Commit

cbc8f8c

verified ·

1 Parent(s): b2eca0b

Update app.py

Browse files

Files changed (1) hide show

app.py +41 -21

app.py CHANGED Viewed

@@ -7,22 +7,24 @@ import gradio as gr
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
 # =========================
 # 1) إعداد المسارات
 # =========================
-BASE_MODEL = "meta-llama/Llama-3.2-1B-Instruct"
-ADAPTER_REPO = "Turkiii0/UT-AI-model"   # عدّل هنا اسم ريبو اللورا
-EXCEL_FILE = "1000 Q.xlsx"              # عدّل هنا اسم ملف الإكسل
-SIM_THRESHOLD = 0.60                    # عتبة التشابه للـ RAG
-MAX_RAG_ANSWER_LEN = 220                # أقصى طول نسمح فيه لإجابة الإكسل
 HF_TOKEN = os.getenv("HF_TOKEN")
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 # =========================
 # 2) تحميل المودل + LoRA
@@ -57,7 +59,7 @@ model = PeftModel.from_pretrained(
 model.to(device)
 model.eval()
-print("✅ Model ready!")
 # =========================
@@ -68,8 +70,10 @@ df = pd.read_excel(EXCEL_FILE)
 print("🧾 Columns:", list(df.columns))
-q_candidates = [c for c in df.columns if "سؤال" in str(c).lower() or "question" in str(c).lower()]
-a_candidates = [c for c in df.columns if "جواب" in str(c).lower() or "answer" in str(c).lower()]
 if q_candidates and a_candidates:
     QCOL = q_candidates[0]
@@ -82,7 +86,7 @@ df = df[[QCOL, ACOL]]
 df.columns = ["question", "answer"]
 df["question"] = df["question"].astype(str).str.strip()
-df["answer"] = df["answer"].astype(str).str.strip()
 qa_data = df.to_dict(orient="records")
 print("📚 Loaded RAG entries:", len(qa_data))
@@ -122,7 +126,7 @@ def normalize_question(q: str) -> str:
     if "اسم" in lower_q or "name" in lower_q:
         return f"ما اسم مقرر {course}؟"
-    # ساعات
     if "ساع" in lower_q or "hour" in lower_q:
         return f"كم عدد ساعات مقرر {course}؟"
@@ -137,7 +141,7 @@ def normalize_question(q: str) -> str:
 AR_STOPWORDS = {
     "ما", "هو", "هي", "هل", "عن", "في", "من", "الى", "إلى",
     "مادة", "مقرر", "المقرر", "المادة", "ماهي", "ماهو",
-       "كم","متطلبات", "متطلب","متى"
 }
 def tokenize(text: str):
@@ -200,15 +204,27 @@ def best_match(user_q: str, records):
 # =========================
-# 6) توليد الجواب من المودل
 # =========================
 SYSTEM_PROMPT = (
     "أنت مساعد أكاديمي متخصص في جامعة تبوك. "
-    "أجب فقط بالمعلومة المطلوبة: (اسم مقرر، متطلب سابق، عدد ساعات). "
     "بدون شرح إضافي وبدون كلام زائد."
 )
 def generate_from_model(q: str) -> str:
     msgs = [
         {"role": "system", "content": SYSTEM_PROMPT},
@@ -232,10 +248,12 @@ def generate_from_model(q: str) -> str:
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
-            max_new_tokens=120,
-            do_sample=False,
-            temperature=0.0,
-            repetition_penalty=1.05,
             eos_token_id=tokenizer.eos_token_id,
             pad_token_id=tokenizer.pad_token_id
         )
@@ -243,7 +261,9 @@ def generate_from_model(q: str) -> str:
     prompt_len = inputs["input_ids"].shape[-1]
     out_ids = outputs[0][prompt_len:]
     ans = tokenizer.decode(out_ids, skip_special_tokens=True).strip()
-    return " ".join(ans.split())
 # =========================

 from transformers import AutoTokenizer, AutoModelForCausalLM
 from peft import PeftModel
 # =========================
 # 1) إعداد المسارات
 # =========================
+# لو حاب تنتقل لـ 3B:
+# BASE_MODEL = "meta-llama/Llama-3.2-3B-Instruct"
+# ADAPTER_REPO = "Turkiii0/UT-AI-3B-LoRA"
+# لو تبي تبقى على 1B خله زي ما هو:
+BASE_MODEL   = "meta-llama/Llama-3.2-3B-Instruct"
+ADAPTER_REPO = "Turkiii0/UT-AI-model"      # عدّل هنا اسم ريبو اللورا لو غيرته
+EXCEL_FILE   = "1000 Q.xlsx"              # اسم ملف الإكسل
+SIM_THRESHOLD      = 0.60    # عتبة التشابه لجواب الإكسل
+MAX_RAG_ANSWER_LEN = 220     # أقصى طول نسمح فيه لإجابة الإكسل
 HF_TOKEN = os.getenv("HF_TOKEN")
+device   = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 # =========================
 # 2) تحميل المودل + LoRA
 model.to(device)
 model.eval()
+print("✅ Model ready on:", device)
 # =========================
 print("🧾 Columns:", list(df.columns))
+q_candidates = [c for c in df.columns
+                if "سؤال" in str(c).lower() or "question" in str(c).lower()]
+a_candidates = [c for c in df.columns
+                if "جواب" in str(c).lower() or "answer" in str(c).lower()]
 if q_candidates and a_candidates:
     QCOL = q_candidates[0]
 df.columns = ["question", "answer"]
 df["question"] = df["question"].astype(str).str.strip()
+df["answer"]   = df["answer"].astype(str).str.strip()
 qa_data = df.to_dict(orient="records")
 print("📚 Loaded RAG entries:", len(qa_data))
     if "اسم" in lower_q or "name" in lower_q:
         return f"ما اسم مقرر {course}؟"
+    # عدد ساعات
     if "ساع" in lower_q or "hour" in lower_q:
         return f"كم عدد ساعات مقرر {course}؟"
 AR_STOPWORDS = {
     "ما", "هو", "هي", "هل", "عن", "في", "من", "الى", "إلى",
     "مادة", "مقرر", "المقرر", "المادة", "ماهي", "ماهو",
+    "كم", "متطلبات", "متطلب", "متى"
 }
 def tokenize(text: str):
 # =========================
+# 6) توليد الجواب من المودل + تنظيف التكرار
 # =========================
 SYSTEM_PROMPT = (
     "أنت مساعد أكاديمي متخصص في جامعة تبوك. "
+    "أجب فقط بالمعلومة المطلوبة (اسم مقرر، متطلب سابق، عدد ساعات، أو ضابط أكاديمي محدد) "
     "بدون شرح إضافي وبدون كلام زائد."
 )
+def clean_repetition(text: str) -> str:
+    """يحاول يشيل التكرار بعد الفواصل العربية."""
+    parts = [p.strip() for p in text.split("،") if p.strip()]
+    seen = set()
+    out = []
+    for p in parts:
+        if p not in seen:
+            out.append(p)
+            seen.add(p)
+    return "، ".join(out) if out else text
 def generate_from_model(q: str) -> str:
     msgs = [
         {"role": "system", "content": SYSTEM_PROMPT},
     with torch.no_grad():
         outputs = model.generate(
             **inputs,
+            max_new_tokens=80,
+            do_sample=True,
+            temperature=0.3,
+            top_p=0.9,
+            repetition_penalty=1.35,
+            no_repeat_ngram_size=4,
             eos_token_id=tokenizer.eos_token_id,
             pad_token_id=tokenizer.pad_token_id
         )
     prompt_len = inputs["input_ids"].shape[-1]
     out_ids = outputs[0][prompt_len:]
     ans = tokenizer.decode(out_ids, skip_special_tokens=True).strip()
+    ans = " ".join(ans.split())
+    ans = clean_repetition(ans)
+    return ans if ans else "لم أجد إجابة واضحة لهذا السؤال."
 # =========================