--- license: other license_name: virtuo license_link: https://justina.cloud/licenses_models/virtuo/virtuo_1_0.txt language: - pt base_model: - VirtuoTuring/Chat_Noir pipeline_tag: text-generation library_name: transformers tags: - PT-PT - legal - civi-procedure - civil-code - abuso-de-direito - direito-da-família - liberdade-sexual - ações-populares - ações-coletivas - Código-processo-civil - Código-civil - safetensors datasets: - VirtuoTuring/justina_clarus --- # Justina Clarus 24B — safetensors Modelo conversacional PT-PT focado no **CPC** e **CC**, com reforço intensivo em: - abuso de direito, - direito da família, - liberdade sexual, - ações coletivas (tipo popular). Distribuição em **safetensors** para uso com `transformers`. ## Origem **Base:** Chat Noir — desenvolvido por Octávio Viana com Virtuo Turing – Artificial Intelligence, S.A. Arquitetura: Mistral-24B com LoRA proprietárias. Corpus PT-PT técnico, jurídico e literário. ## Cobertura jurídica - **CPC**: espécies de ações, processos, competência, recursos, caso julgado. - **CC**: obrigações, responsabilidade civil, direitos de personalidade. - Reforços: abuso de direito; família e menores; liberdade sexual; ações populares. - Contexto (seleção): CPP, CP, CRP, CEDH, RGPD (+ Lei 58/2019), Lei 112/2009, Lei 130/2015, LAV, Reg. (UE) 1215/2012, Reg. (UE) 2019/1111, Dir. 2004/25/CE, CVM 194/196. ## Dados e metodologia Treino em **JSONL** com pares Q/A autossuficientes. - `role`: "user" ou "assistant". - `content`: texto simples em PT-PT. Sem cabeçalhos. Sem vírgulas finais. - **Schema** { "messages": [ {"role":"user","content":"…"}, {"role":"assistant","content":"…"} ] } **Exemplos** {"messages":[{"role":"user","content":"Quais são as espécies fundamentais de ações no Direito Processual Civil segundo o artigo 10.º, n.º1 CPC?"},{"role":"assistant","content":"Segundo o artigo 10.º, n.º1 CPC, no esquema de Direito Processual Civil, há duas espécies fundamentais de ações."}]} {"messages":[{"role":"user","content":"O que caracteriza a ação declarativa no Direito Processual Civil?"},{"role":"assistant","content":"A ação declarativa pode ainda ser, conforme o artigo 10.º, n.º2 e 3 CPC, de simples apreciação, de condenação ou constitutiva, sendo que em cada subespécie se pedem diferentes providências ao tribunal."}]} **Treino jurídico adicional (síntese)** Peças processuais iniciais e acórdãos das Relações (Guimarães, Porto, Coimbra, Lisboa, Évora) e do STJ, convertidos em Q/A, checklists, testes binários, contraexemplos e “ruído controlado”. ## Design e limites - Respostas curtas e precisas; baixa latência local. - Janela de contexto ≈ 4k tokens. - Não otimizado para contexto longo (>8k). ## Utilização ### `transformers` (FP16/BF16, GPU) from transformers import AutoTokenizer, AutoModelForCausalLM import torch repo = "VirtuoTuring/justina_clarus-24b-safetensors" tok = AutoTokenizer.from_pretrained(repo, use_fast=True) dtype = torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 model = AutoModelForCausalLM.from_pretrained(repo, torch_dtype=dtype, device_map="auto") prompt = "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:" inputs = tok(prompt, return_tensors="pt").to(model.device) out = model.generate(**inputs, max_new_tokens=400, temperature=0.2, top_p=0.9) print(tok.decode(out[0], skip_special_tokens=True)) ### 4-bit (bitsandbytes) from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig import torch bnb = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_use_double_quant=True, bnb_4bit_compute_dtype=torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 ) tok = AutoTokenizer.from_pretrained(repo, use_fast=True) model = AutoModelForCausalLM.from_pretrained(repo, quantization_config=bnb, device_map="auto") ## Boas práticas - Cite artigos e números quando relevante. - Valide com fontes oficiais; revisão humana obrigatória em peças processuais. ## Avaliação Sem métricas públicas nesta versão. Uso alvo: Q/A jurídico, síntese curta, rascunhos. ## Limitações - Não substitui profissionais forenses ou tribunais. - Pode errar em regimes especiais ou alterações legislativas recentes. ## Licença **Virtuo 1.0**. Uso, modificação e redistribuição, incluindo comercial, desde que se preservem avisos originais e referência a **Virtuo Turing – Artificial Intelligence, S.A.**. ## Créditos Virtuo Turing – Artificial Intelligence, S.A. (Portugal) e Octávio Viana. Base © Mistral AI (Apache-2.0). Website: https://justina.cloud ## Citação sugerida VirtuoTuring/justina_clarus-24b-safetensors — modelo PT-PT jurídico (CPC/CC; abuso de direito; família; liberdade sexual; ações populares). Virtuo Turing – Artificial Intelligence, S.A. # Justina Clarus 24B — safetensors PT-PT conversational model focused on the **Portuguese CPC** and **Civil Code**, with intensive subsets on: - abuse of rights, - family law, - sexual freedom, - “popular action” collective actions. Distributed as **safetensors** for use with `transformers`. ## Origin **Base:** Chat Noir — developed by Octávio Viana with Virtuo Turing – Artificial Intelligence, S.A. Architecture: Mistral-24B with proprietary LoRA adapters. Corpus authored in European Portuguese across technical, legal, and literary domains. ## Legal coverage - **CPC**: types of actions, procedures, jurisdiction, appeals, res judicata. - **CC**: obligations, tort, personality rights. - Reinforcements: abuse of rights; family and minors; sexual freedom; popular actions. - Wider context (selection): CPP, CP, CRP, ECHR, GDPR (+ Law 58/2019), Law 112/2009, Law 130/2015, LAV, Reg. (EU) 1215/2012, Reg. (EU) 2019/1111, Directive 2004/25/EC, CVM 194/196. ## Data and method Training in **JSONL** using self-contained Q/A pairs. - `role`: "user" or "assistant". - `content`: plain PT-PT text. No headers. No trailing commas. - **Schema** { "messages": [ {"role":"user","content":"…"}, {"role":"assistant","content":"…"} ] } **Examples** {"messages":[{"role":"user","content":"Quais são as espécies fundamentais de ações no Direito Processual Civil segundo o artigo 10.º, n.º1 CPC?"},{"role":"assistant","content":"Segundo o artigo 10.º, n.º1 CPC, no esquema de Direito Processual Civil, há duas espécies fundamentais de ações."}]} {"messages":[{"role":"user","content":"O que caracteriza a ação declarativa no Direito Processual Civil?"},{"role":"assistant","content":"A ação declarativa pode ainda ser, conforme o artigo 10.º, n.º2 e 3 CPC, de simples apreciação, de condenação ou constitutiva, sendo que em cada subespécie se pedem diferentes providências ao tribunal."}]} **Additional legal training (summary)** Statements of claim and Portuguese appellate and Supreme Court judgments, transformed into Q/A, checklists, binary tests, counterexamples, and “controlled noise”. ## Design and limits - Short, precise answers; low latency on local hardware. - Context window ≈ 4k tokens. - Not tuned for very long context (>8k). ## Usage ### `transformers` (FP16/BF16, GPU) from transformers import AutoTokenizer, AutoModelForCausalLM import torch repo = "VirtuoTuring/justina_clarus-24b-safetensors" tok = AutoTokenizer.from_pretrained(repo, use_fast=True) dtype = torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 model = AutoModelForCausalLM.from_pretrained(repo, torch_dtype=dtype, device_map="auto") prompt = "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:" inputs = tok(prompt, return_tensors="pt").to(model.device) out = model.generate(**inputs, max_new_tokens=400, temperature=0.2, top_p=0.9) print(tok.decode(out[0], skip_special_tokens=True)) ### 4-bit (bitsandbytes) from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig import torch bnb = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_use_double_quant=True, bnb_4bit_compute_dtype=torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 ) tok = AutoTokenizer.from_pretrained(repo, use_fast=True) model = AutoModelForCausalLM.from_pretrained(repo, quantization_config=bnb, device_map="auto") ## Good practice - Cite article numbers when relevant. - Validate outputs against official sources; human review required for filings. ## Evaluation No public metrics in this card. Target use: legal Q/A, brief synthesis, drafting support. ## Limitations - Not a substitute for legal professionals or courts. - May miss special regimes or recent legislative changes. ## License **Virtuo 1.0**. Permissive use, modification, and redistribution, including commercial, provided original notices are preserved and **Virtuo Turing – Artificial Intelligence, S.A.** is referenced. ## Credits Virtuo Turing – Artificial Intelligence, S.A. (Portugal) and Octávio Viana. Base © Mistral AI (Apache-2.0). Website: https://justina.cloud ## Suggested citation VirtuoTuring/justina_clarus-24b-safetensors — PT-PT legal model (CPC/CC; abuse of rights; family; sexual freedom; popular actions). Virtuo Turing – Artificial Intelligence, S.A.