lunahr
/

thea-3b-50r-u1

Text Generation

text-generation-inference

Model card Files Files and versions

lunahr commited on Jan 11

Commit

34371d8

·

verified ·

1 Parent(s): 7e30823

OpenLLM satisfaction information

Files changed (1) hide show

README.md +28 -18

README.md CHANGED Viewed

@@ -1,21 +1,21 @@
----
-language:
-- en
-license: llama3.2
-tags:
-- text-generation-inference
-- transformers
-- llama
-- trl
-- sft
-- reasoning
-- llama-3
-base_model: CreitinGameplays/Llama-3.2-3b-Instruct-uncensored-refinetune
-datasets:
-- KingNish/reasoning-base-20k
-pipeline_tag: text-generation
-library_name: transformers
----
 # Model Description
@@ -65,8 +65,18 @@ response_output = tokenizer.decode(response_ids[0, response_inputs.input_ids.sha
 print("ANSWER: " + response_output)
 ```
 - **Trained by:** [Piotr Zalewski](https://huggingface.co/lunahr)
 - **License:** llama3.2
 - **Finetuned from model:** [CreitinGameplays/Llama-3.2-3b-Instruct-uncensored-refinetune](https://huggingface.co/CreitinGameplays/Llama-3.2-3b-Instruct-uncensored-refinetune)
 - **Dataset used:** [KingNish/reasoning-base-20k](https://huggingface.co/datasets/KingNish/reasoning-base-20k)

+---
+language:
+- en
+license: llama3.2
+tags:
+- text-generation-inference
+- transformers
+- llama
+- trl
+- sft
+- reasoning
+- llama-3
+base_model: CreitinGameplays/Llama-3.2-3b-Instruct-uncensored-refinetune
+datasets:
+- KingNish/reasoning-base-20k
+pipeline_tag: text-generation
+library_name: transformers
+---
 # Model Description
 print("ANSWER: " + response_output)
 ```
+# Intended Use
+This model is intended as an OpenAI o1 replacement for weaker hardware, mimicking o1 in the response formatting.
+# Limitations
+- There may be a higher chance of getting hallucinations with this model due to its small size.
+- Some questions may be answered incorrectly.
+- This model is uncensored, exercise caution when generating sensitive content.
 - **Trained by:** [Piotr Zalewski](https://huggingface.co/lunahr)
 - **License:** llama3.2
+- **Architecture:**: llama3.2
 - **Finetuned from model:** [CreitinGameplays/Llama-3.2-3b-Instruct-uncensored-refinetune](https://huggingface.co/CreitinGameplays/Llama-3.2-3b-Instruct-uncensored-refinetune)
 - **Dataset used:** [KingNish/reasoning-base-20k](https://huggingface.co/datasets/KingNish/reasoning-base-20k)