Justina Clarus 24B — safetensors

Modelo conversacional PT-PT focado no CPC e CC, com reforço intensivo em:

  • abuso de direito,
  • direito da família,
  • liberdade sexual,
  • ações coletivas (tipo popular).

Distribuição em safetensors para uso com transformers.

Origem

Base: Chat Noir — desenvolvido por Octávio Viana com Virtuo Turing – Artificial Intelligence, S.A.
Arquitetura: Mistral-24B com LoRA proprietárias. Corpus PT-PT técnico, jurídico e literário.

Cobertura jurídica

  • CPC: espécies de ações, processos, competência, recursos, caso julgado.
  • CC: obrigações, responsabilidade civil, direitos de personalidade.
  • Reforços: abuso de direito; família e menores; liberdade sexual; ações populares.
  • Contexto (seleção): CPP, CP, CRP, CEDH, RGPD (+ Lei 58/2019), Lei 112/2009, Lei 130/2015, LAV, Reg. (UE) 1215/2012, Reg. (UE) 2019/1111, Dir. 2004/25/CE, CVM 194/196.

Dados e metodologia

Treino em JSONL com pares Q/A autossuficientes.

  • role: "user" ou "assistant".
  • content: texto simples em PT-PT. Sem cabeçalhos. Sem vírgulas finais.
  • Schema
    { "messages": [ {"role":"user","content":"…"}, {"role":"assistant","content":"…"} ] }

Exemplos {"messages":[{"role":"user","content":"Quais são as espécies fundamentais de ações no Direito Processual Civil segundo o artigo 10.º, n.º1 CPC?"},{"role":"assistant","content":"Segundo o artigo 10.º, n.º1 CPC, no esquema de Direito Processual Civil, há duas espécies fundamentais de ações."}]} {"messages":[{"role":"user","content":"O que caracteriza a ação declarativa no Direito Processual Civil?"},{"role":"assistant","content":"A ação declarativa pode ainda ser, conforme o artigo 10.º, n.º2 e 3 CPC, de simples apreciação, de condenação ou constitutiva, sendo que em cada subespécie se pedem diferentes providências ao tribunal."}]}

Treino jurídico adicional (síntese)
Peças processuais iniciais e acórdãos das Relações (Guimarães, Porto, Coimbra, Lisboa, Évora) e do STJ, convertidos em Q/A, checklists, testes binários, contraexemplos e “ruído controlado”.

Design e limites

  • Respostas curtas e precisas; baixa latência local.
  • Janela de contexto ≈ 4k tokens.
  • Não otimizado para contexto longo (>8k).

Utilização

transformers (FP16/BF16, GPU)

from transformers import AutoTokenizer, AutoModelForCausalLM import torch

repo = "VirtuoTuring/justina_clarus-24b-safetensors" tok = AutoTokenizer.from_pretrained(repo, use_fast=True) dtype = torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 model = AutoModelForCausalLM.from_pretrained(repo, torch_dtype=dtype, device_map="auto")

prompt = "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:" inputs = tok(prompt, return_tensors="pt").to(model.device) out = model.generate(**inputs, max_new_tokens=400, temperature=0.2, top_p=0.9) print(tok.decode(out[0], skip_special_tokens=True))

4-bit (bitsandbytes)

from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig import torch

bnb = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_use_double_quant=True, bnb_4bit_compute_dtype=torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 ) tok = AutoTokenizer.from_pretrained(repo, use_fast=True) model = AutoModelForCausalLM.from_pretrained(repo, quantization_config=bnb, device_map="auto")

Boas práticas

  • Cite artigos e números quando relevante.
  • Valide com fontes oficiais; revisão humana obrigatória em peças processuais.

Avaliação

Sem métricas públicas nesta versão. Uso alvo: Q/A jurídico, síntese curta, rascunhos.

Limitações

  • Não substitui profissionais forenses ou tribunais.
  • Pode errar em regimes especiais ou alterações legislativas recentes.

Licença

Virtuo 1.0. Uso, modificação e redistribuição, incluindo comercial, desde que se preservem avisos originais e referência a Virtuo Turing – Artificial Intelligence, S.A..

Créditos

Virtuo Turing – Artificial Intelligence, S.A. (Portugal) e Octávio Viana.
Base © Mistral AI (Apache-2.0).
Website: https://justina.cloud

Citação sugerida

VirtuoTuring/justina_clarus-24b-safetensors — modelo PT-PT jurídico (CPC/CC; abuso de direito; família; liberdade sexual; ações populares). Virtuo Turing – Artificial Intelligence, S.A.

Justina Clarus 24B — safetensors

PT-PT conversational model focused on the Portuguese CPC and Civil Code, with intensive subsets on:

  • abuse of rights,
  • family law,
  • sexual freedom,
  • “popular action” collective actions.

Distributed as safetensors for use with transformers.

Origin

Base: Chat Noir — developed by Octávio Viana with Virtuo Turing – Artificial Intelligence, S.A.
Architecture: Mistral-24B with proprietary LoRA adapters. Corpus authored in European Portuguese across technical, legal, and literary domains.

Legal coverage

  • CPC: types of actions, procedures, jurisdiction, appeals, res judicata.
  • CC: obligations, tort, personality rights.
  • Reinforcements: abuse of rights; family and minors; sexual freedom; popular actions.
  • Wider context (selection): CPP, CP, CRP, ECHR, GDPR (+ Law 58/2019), Law 112/2009, Law 130/2015, LAV, Reg. (EU) 1215/2012, Reg. (EU) 2019/1111, Directive 2004/25/EC, CVM 194/196.

Data and method

Training in JSONL using self-contained Q/A pairs.

  • role: "user" or "assistant".
  • content: plain PT-PT text. No headers. No trailing commas.
  • Schema
    { "messages": [ {"role":"user","content":"…"}, {"role":"assistant","content":"…"} ] }

Examples {"messages":[{"role":"user","content":"Quais são as espécies fundamentais de ações no Direito Processual Civil segundo o artigo 10.º, n.º1 CPC?"},{"role":"assistant","content":"Segundo o artigo 10.º, n.º1 CPC, no esquema de Direito Processual Civil, há duas espécies fundamentais de ações."}]} {"messages":[{"role":"user","content":"O que caracteriza a ação declarativa no Direito Processual Civil?"},{"role":"assistant","content":"A ação declarativa pode ainda ser, conforme o artigo 10.º, n.º2 e 3 CPC, de simples apreciação, de condenação ou constitutiva, sendo que em cada subespécie se pedem diferentes providências ao tribunal."}]}

Additional legal training (summary)
Statements of claim and Portuguese appellate and Supreme Court judgments, transformed into Q/A, checklists, binary tests, counterexamples, and “controlled noise”.

Design and limits

  • Short, precise answers; low latency on local hardware.
  • Context window ≈ 4k tokens.
  • Not tuned for very long context (>8k).

Usage

transformers (FP16/BF16, GPU)

from transformers import AutoTokenizer, AutoModelForCausalLM import torch

repo = "VirtuoTuring/justina_clarus-24b-safetensors" tok = AutoTokenizer.from_pretrained(repo, use_fast=True) dtype = torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 model = AutoModelForCausalLM.from_pretrained(repo, torch_dtype=dtype, device_map="auto")

prompt = "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:" inputs = tok(prompt, return_tensors="pt").to(model.device) out = model.generate(**inputs, max_new_tokens=400, temperature=0.2, top_p=0.9) print(tok.decode(out[0], skip_special_tokens=True))

4-bit (bitsandbytes)

from transformers import AutoTokenizer, AutoModelForCausalLM, BitsAndBytesConfig import torch

bnb = BitsAndBytesConfig( load_in_4bit=True, bnb_4bit_quant_type="nf4", bnb_4bit_use_double_quant=True, bnb_4bit_compute_dtype=torch.bfloat16 if torch.cuda.is_bf16_supported() else torch.float16 ) tok = AutoTokenizer.from_pretrained(repo, use_fast=True) model = AutoModelForCausalLM.from_pretrained(repo, quantization_config=bnb, device_map="auto")

Good practice

  • Cite article numbers when relevant.
  • Validate outputs against official sources; human review required for filings.

Evaluation

No public metrics in this card. Target use: legal Q/A, brief synthesis, drafting support.

Limitations

  • Not a substitute for legal professionals or courts.
  • May miss special regimes or recent legislative changes.

License

Virtuo 1.0. Permissive use, modification, and redistribution, including commercial, provided original notices are preserved and Virtuo Turing – Artificial Intelligence, S.A. is referenced.

Credits

Virtuo Turing – Artificial Intelligence, S.A. (Portugal) and Octávio Viana.
Base © Mistral AI (Apache-2.0).
Website: https://justina.cloud

Suggested citation

VirtuoTuring/justina_clarus-24b-safetensors — PT-PT legal model (CPC/CC; abuse of rights; family; sexual freedom; popular actions). Virtuo Turing – Artificial Intelligence, S.A.

Downloads last month
2
Safetensors
Model size
24B params
Tensor type
F16
·
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for VirtuoTuring/justina_clarus-24b

Dataset used to train VirtuoTuring/justina_clarus-24b