Spaces:

DeepImagix
/

self-trained2

Running

DeepImagix commited on Jun 30, 2025

Commit

2155c44

verified ·

1 Parent(s): d40fe61

Update neuroprompt_deep.py

Files changed (1) hide show

neuroprompt_deep.py CHANGED Viewed

@@ -10,7 +10,7 @@ logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 class NeuroPromptDeep:
-    def __init__(self, model_name: str = "gpt2"):  # Changed to smaller GPT-2 model
         """
         Initialize the generative AI engine with a local language model.
         """
@@ -74,20 +74,20 @@ class NeuroPromptDeep:
                 cache_dir=self.cache_dir
             )
-            # CPU-optimized configuration
             self.model = AutoModelForCausalLM.from_pretrained(
                 self.model_name,
-                cache_dir=self.cache_dir,
-                device_map="auto",  # Will automatically use CPU
-                low_cpu_mem_usage=True  # Reduces memory footprint
             )
-            # CPU-based pipeline
             self.generator = pipeline(
                 "text-generation",
                 model=self.model,
-                tokenizer=self.tokenizer,
-                device=-1  # Force CPU usage
             )
             logger.info("Model loaded successfully for CPU!")
@@ -117,7 +117,7 @@ class NeuroPromptDeep:
             # Format the full prompt
             full_prompt = f"{system_prompt}\n<|user|>\n{prompt}</s>\n<|assistant|>\n"
-            # Generate response
             outputs = self.generator(
                 full_prompt,
                 max_new_tokens=settings["max_length"],

 logger = logging.getLogger(__name__)
 class NeuroPromptDeep:
+    def __init__(self, model_name: str = "gpt2"):
         """
         Initialize the generative AI engine with a local language model.
         """
                 cache_dir=self.cache_dir
             )
+            # SIMPLIFIED CPU-ONLY CONFIGURATION
             self.model = AutoModelForCausalLM.from_pretrained(
                 self.model_name,
+                cache_dir=self.cache_dir
             )
+            # Explicitly move model to CPU
+            self.model = self.model.to('cpu')
+            # CPU-based pipeline without device conflict
             self.generator = pipeline(
                 "text-generation",
                 model=self.model,
+                tokenizer=self.tokenizer
             )
             logger.info("Model loaded successfully for CPU!")
             # Format the full prompt
             full_prompt = f"{system_prompt}\n<|user|>\n{prompt}</s>\n<|assistant|>\n"
+            # Generate response with CPU-friendly settings
             outputs = self.generator(
                 full_prompt,
                 max_new_tokens=settings["max_length"],