Llama.cpp Demos - a sitammeur Collection

sitammeur 's Collections

GliNER & Variants

Llama.cpp Demos

Llama.cpp Demos

updated 25 days ago

A set of efficient, Python-based chat interfaces and agents powered by llama.cpp that focus on running quantized models (GGUF) locally.

Running

5

Qwen-Coder Llamacpp

🌍

5

Qwen2.5-Coder: Family of LLMs excels in code, debugging, etc
Running

7

Gemma Llamacpp

⚡

7

Gemma 3: Google's multimodal, multilingual, long context LLM