Justina Clarus 24B — GGUF (v2) — PT

Versão 2. Reforçada com mais sessões de treino e mais pares Q/A em PT-PT, mantendo foco no CPC e no CC e temas conexos. Disponível em GGUF nas variantes F16 e q4_k_m.

O que mudou na v2

  • Mais pares e iterações de treino.
  • Maior consistência estilística em PT-PT técnico e jurídico.
  • Robustez acrescida a variações de pergunta no mesmo domínio.

Generalização e não-memorização

  • O modelo não memoriza verbatim todas as respostas. Retém padrões gerais e pode aproximar-se de formulações consistentes.
  • Aprendeu formato, tom e padrões de Q/A formais em PT-PT com jargões específicos (jurídico, técnico). Mantém estilo consistente mesmo em perguntas fora do dataset. Útil para: respostas consistentes sem cópia literal. Excelente para RAG.
  • Capta padrões semânticos e sintáticos do corpus jurídico PT-PT. Em perguntas idênticas ou muito próximas, tende a >80–90% de equivalência semântica mesmo sem verbatim. Útil para: variações dentro do mesmo tema jurídico.

Destinos preferenciais

  1. fine-tune para matérias legais específicas; 2) integração em RAG; 3) uso de contexto dado no prompt (leis e interpretações) para compor texto jurídico.

Cobertura jurídica

  • CPC: espécies de ações, processos, competência, recursos, caso julgado.
  • CC: obrigações, responsabilidade civil, direitos de personalidade.
  • Reforços: abuso de direito; família e menores; liberdade sexual; ações populares.
  • Contexto adicional (seletivo): CPP, CP, CRP, CEDH, RGPD (+ Lei 58/2019), Lei 112/2009, Lei 130/2015, LAV, Reg. (UE) 1215/2012, Reg. (UE) 2019/1111, Dir. 2004/25/CE, CVM 194/196.

Dados e esquema

Treino em JSONL com pares Q/A autossuficientes.

Schema {"messages":[{"role":"user","content":"…"},{"role":"assistant","content":"…"}]}

Exemplos {"messages":[{"role":"user","content":"Quais são as espécies fundamentais de ações no Direito Processual Civil segundo o artigo 10.º, n.º 1 CPC?"},{"role":"assistant","content":"Segundo o artigo 10.º, n.º 1 CPC, distinguem-se duas espécies fundamentais de ações no esquema do processo civil."}]} {"messages":[{"role":"user","content":"O que caracteriza a ação declarativa?"},{"role":"assistant","content":"A ação declarativa pode ser de simples apreciação, de condenação ou constitutiva (art. 10.º, n.os 2 e 3 CPC), pedindo-se em cada subespécie providências distintas."}]}

Variantes GGUF

  • F16: máxima fidelidade; maior exigência de RAM/VRAM.
  • q4_k_m: 4-bit K-quant; boa relação qualidade/desempenho e memória reduzida.

Ficheiros esperados

  • justina_clarus-24b-f16.gguf
  • justina_clarus-24b-q4_k_m.gguf

Utilização com llama.cpp (CLI)

CPU ./main -m ./justina_clarus-24b-q4_k_m.gguf -n 400 -t 8 -c 4096 -p "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:"

GPU parcial (ajuste -ngl ao hardware) ./main -m ./justina_clarus-24b-q4_k_m.gguf -n 400 -c 4096 -ngl 35 -p "Pergunta: ...\nResposta:"

Utilização com llama-cpp-python 0.3.9

Instalação requerida pip install llama-cpp-python==0.3.9 numpy==1.26.4

Código mínimo from llama_cpp import Llama llm = Llama(model_path="justina_clarus-24b-q4_k_m.gguf", n_ctx=4096, n_gpu_layers=-1) prompt = "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:" res = llm(prompt, max_tokens=400, temperature=0.2, top_p=0.9) print(res["choices"][0]["text"])

Boas práticas

  • Cite artigos e números quando aplicável.
  • Valide com fontes oficiais. Revisão humana obrigatória em peças processuais.
  • Produção: temperatura baixa e limites de tokens explícitos.
  • Para contexto extenso, use RAG; mantenha prompts concisos.

Limitações

  • Janela típica ≈ 4k tokens (ajuste com -c / n_ctx).
  • Não substitui profissionais forenses nem tribunais.
  • Pode falhar em regimes especiais ou alterações legislativas recentes.

Licença

Virtuo 1.0. Uso, modificação e redistribuição, incluindo comercial, com preservação dos avisos e referência a Virtuo Turing – Artificial Intelligence, S.A.

Créditos

Virtuo Turing – Artificial Intelligence, S.A. (Portugal) e Octávio Viana. Base © Mistral AI (Apache-2.0). Website: https://justina.cloud


Justina Clarus 24B — GGUF (v2) — EN

Version 2. Reinforced with more PT-PT Q/A pairs and training passes, still focused on CPC and CC. Delivered as GGUF in F16 and q4_k_m variants.

What’s new in v2

  • More pairs and training iterations.
  • Higher stylistic consistency for technical and legal PT-PT.
  • Increased robustness to question variation within the same domain.

Generalization and non-memorization

  • The model does not memorize all answers verbatim. It retains general patterns and may converge to consistent formulations.
  • It learned the format, tone, and patterns of formal PT-PT Q/A with domain jargon (legal, technical). It stays consistent in style even for questions outside the dataset. Useful for: tone-consistent answers without literal copying. Excellent for RAG.
  • It captures semantic and syntactic patterns of the PT-PT legal corpus. For identical or very close questions, it tends to >80–90% semantic equivalence even without verbatim. Useful for: varied queries within the same legal theme.

Primary uses

  1. fine-tuning for specific legal topics; 2) RAG integration; 3) injecting user-supplied context in the prompt (laws, interpretations) to compose legal text.

Legal coverage

  • CPC: types of actions, procedures, jurisdiction, appeals, res judicata.
  • CC: obligations, tort, personality rights.
  • Reinforcements: abuse of rights; family and minors; sexual freedom; popular actions.
  • Additional context (selective): CPP, CP, CRP, ECHR, GDPR (+ Law 58/2019), Law 112/2009, Law 130/2015, LAV, Reg. (EU) 1215/2012, Reg. (EU) 2019/1111, Dir. 2004/25/EC, CVM 194/196.

Data and schema

Training in JSONL with self-contained Q/A pairs.

Schema {"messages":[{"role":"user","content":"…"},{"role":"assistant","content":"…"}]}

Examples {"messages":[{"role":"user","content":"Quais são as espécies fundamentais de ações no Direito Processual Civil segundo o artigo 10.º, n.º 1 CPC?"},{"role":"assistant","content":"Segundo o artigo 10.º, n.º 1 CPC, distinguem-se duas espécies fundamentais de ações no esquema do processo civil."}]} {"messages":[{"role":"user","content":"O que caracteriza a ação declarativa?"},{"role":"assistant","content":"A ação declarativa pode ser de simples apreciação, de condenação ou constitutiva (art. 10.º, n.os 2 e 3 CPC), pedindo-se em cada subespécie providências distintas."}]}

GGUF variants

  • F16: maximum fidelity; higher RAM/VRAM needs.
  • q4_k_m: 4-bit K-quant; strong quality/speed/memory trade-off.

Expected files

  • justina_clarus-24b-f16.gguf
  • justina_clarus-24b-q4_k_m.gguf

llama.cpp usage (CLI)

CPU ./main -m ./justina_clarus-24b-q4_k_m.gguf -n 400 -t 8 -c 4096 -p "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:"

Partial GPU (adjust -ngl to hardware) ./main -m ./justina_clarus-24b-q4_k_m.gguf -n 400 -c 4096 -ngl 35 -p "Pergunta: ...\nResposta:"

llama-cpp-python 0.3.9

Install pip install llama-cpp-python==0.3.9 numpy==1.26.4

Minimal code from llama_cpp import Llama llm = Llama(model_path="justina_clarus-24b-q4_k_m.gguf", n_ctx=4096, n_gpu_layers=-1) prompt = "Pergunta: Indique as espécies de ações no art. 10.º, n.º 1 CPC.\nResposta:" res = llm(prompt, max_tokens=400, temperature=0.2, top_p=0.9) print(res["choices"][0]["text"])

Good practice

  • Cite article numbers when relevant.
  • Validate against official sources. Human review is mandatory for filings.
  • For production, prefer low temperature and explicit token limits.
  • Use RAG for long context; keep prompts concise.

Limitations

  • Typical context window ≈ 4k tokens (tune with -c / n_ctx).
  • Not a substitute for legal professionals or courts.
  • May miss special regimes or recent legislative changes.

License

Virtuo 1.0. Permissive use, modification, and redistribution, including commercial, with notices preserved and reference to Virtuo Turing – Artificial Intelligence, S.A.

Credits

Virtuo Turing – Artificial Intelligence, S.A. (Portugal) and Octávio Viana. Base © Mistral AI (Apache-2.0). Website: https://justina.cloud

Downloads last month

-

Downloads are not tracked for this model. How to track
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support

Model tree for VirtuoTuring/justina_clarus-24b-v2-gguf

Dataset used to train VirtuoTuring/justina_clarus-24b-v2-gguf