Spaces:

KYO30
/

MY-KANANA

Sleeping

App Files Files Community

KYO30 commited on 29 days ago

Commit

5886019

verified ·

1 Parent(s): e8e282a

Update app.py

Browse files

Files changed (1) hide show

app.py +8 -11

app.py CHANGED Viewed

@@ -2,32 +2,29 @@ import gradio as gr
 from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
 import torch
 from threading import Thread
-import os  # 1. Secret을 읽기 위해 os 모듈 임포트
 # --- 1. 모델 로드 (Space의 GPU 활용) ---
-MODEL_NAME = "kakaocorp/kanana-1.5-2.1b-instruct-2405"
-# 2. Space Setting에 등록한 Secret(HF_TOKEN)을 환경 변수에서 가져옵니다.
-HF_AUTH_TOKEN = os.environ.get("HF_TOKEN")
 print(f"모델을 로딩 중입니다: {MODEL_NAME} (Space GPU 사용)")
-# 3. 토큰을 사용하여 인증된 상태로 모델을 다운로드합니다.
 tokenizer = AutoTokenizer.from_pretrained(
-    MODEL_NAME,
-    token=HF_AUTH_TOKEN  # 인증 토큰 전달
 )
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
     torch_dtype=torch.float16,
-    device_map="auto",
-    token=HF_AUTH_TOKEN  # 인증 토큰 전달
 )
 print("모델 로딩 완료!")
 # --- 2. 챗봇 응답 함수 (Gradio가 이 함수를 호출) ---
 def predict(message, history):
     history_prompt = ""
     for user_msg, assistant_msg in history:
         history_prompt += f"<bos>user\n{user_msg}\n<eos>assistant\n{assistant_msg}\n"
@@ -59,7 +56,7 @@ def predict(message, history):
 # --- 3. Gradio 챗봇 UI 생성 ---
 chatbot_ui = gr.ChatInterface(
     fn=predict,
-    title="Kanana 1.5 챗봇 테스트 🤖",
     description=f"{MODEL_NAME} 모델을 테스트합니다.",
     theme="soft",
     examples=[["한국의 수도는 어디야?"], ["AI에 대해 3줄로 요약해줘."]]

 from transformers import AutoModelForCausalLM, AutoTokenizer, TextIteratorStreamer
 import torch
 from threading import Thread
+import os  # os 모듈은 혹시 모르니 남겨둡니다.
 # --- 1. 모델 로드 (Space의 GPU 활용) ---
+# 별도 인증(토큰)이 필요 없는 'kanana-nano' 공개 모델로 변경했습니다.
+MODEL_NAME = "kakaocorp/kanana-nano-2.1b-instruct"
 print(f"모델을 로딩 중입니다: {MODEL_NAME} (Space GPU 사용)")
+# 이 모델은 공개 모델이므로 토큰(token=...) 파라미터가 필요 없습니다.
 tokenizer = AutoTokenizer.from_pretrained(
+    MODEL_NAME
 )
 model = AutoModelForCausalLM.from_pretrained(
     MODEL_NAME,
     torch_dtype=torch.float16,
+    device_map="auto"
 )
 print("모델 로딩 완료!")
 # --- 2. 챗봇 응답 함수 (Gradio가 이 함수를 호출) ---
 def predict(message, history):
+    # Kanana의 프롬프트 형식
     history_prompt = ""
     for user_msg, assistant_msg in history:
         history_prompt += f"<bos>user\n{user_msg}\n<eos>assistant\n{assistant_msg}\n"
 # --- 3. Gradio 챗봇 UI 생성 ---
 chatbot_ui = gr.ChatInterface(
     fn=predict,
+    title="Kanana-Nano 챗봇 테스트 🤖",
     description=f"{MODEL_NAME} 모델을 테스트합니다.",
     theme="soft",
     examples=[["한국의 수도는 어디야?"], ["AI에 대해 3줄로 요약해줘."]]