Inclusium-Premier (The benchmark are not valid and will be replaced whit actually accurate ones :)

A state-of-the-art multimodal language model with advanced reasoning, coding capabilities, vision understanding, and persistent memory. Inclusium-Premier is designed to surpass GPT-4o Mini in performance across diverse tasks while maintaining efficient resource usage.

Model Details

Developed by: Surface Development
Model Type: Multimodal Transformer
Version: 1.0.0
Release Date: November 2025
License: Apache 2.0
Parameters: 24.7B
Context Window: 200K tokens
Format: SafeTensors

Key Capabilities

Core Features

Vision Understanding: Image analysis, OCR, chart interpretation, visual reasoning
Advanced Coding: Multi-language code generation, debugging, refactoring, architecture design
Persistent Memory: Cross-session context retention with intelligent pattern recognition
Mathematical Reasoning: Complex problem solving, symbolic mathematics, proofs
Multilingual Support: Fluent in 13+ languages with cross-lingual understanding
Creative Writing: Story generation, poetry, screenplays, technical documentation
Analytical Reasoning: Data analysis, logical deduction, strategic planning
Conversational AI: Natural dialogue with context awareness and personality consistency

Technical Highlights

Long-context processing up to 200K tokens
Multimodal architecture supporting text and vision inputs
Memory-augmented transformer with retrieval mechanisms
Optimized inference with SafeTensors format
Fine-tuned on diverse high-quality datasets
Advanced safety alignment and bias mitigation

Performance Benchmarks

General Language Understanding

Benchmark	Inclusium-Premier	GPT-4o Mini	Surface-AI r19372	Claude-3-Sonnet
MMLU	89.3%	82.1%	N/A	86.8%
HellaSwag	92.7%	87.5%	N/A	89.2%
TruthfulQA	78.4%	73.2%	N/A	75.6%
GSM8K (Math)	91.8%	81.7%	N/A	88.3%
BBH (Reasoning)	86.5%	78.9%	N/A	83.4%

Code Generation

Benchmark	Inclusium-Premier	GPT-4o Mini	Surface-AI r19372	Codex
HumanEval	96.8%	87.3%	94.2%	92.5%
MBPP	94.2%	84.6%	89.7%	91.3%
CodeContests	67.3%	52.1%	N/A	58.4%
DS-1000	88.5%	76.8%	N/A	82.1%

Multimodal Understanding

Benchmark	Inclusium-Premier	GPT-4o Mini	GPT-4V
VQAv2	87.9%	78.4%	85.2%
TextVQA	84.6%	74.8%	82.1%
COCO Captions	142.3 CIDEr	128.7 CIDEr	138.5 CIDEr
ChartQA	81.2%	68.5%	76.8%
DocVQA	89.7%	79.3%	86.4%

Multilingual Performance

Language	XNLI	XStoryCloze	Translation (BLEU)
Spanish	88.4%	91.2%	42.3
French	87.9%	90.8%	41.7
German	86.7%	89.5%	40.2
Chinese	85.3%	88.9%	38.9
Japanese	84.8%	88.2%	37.4
Arabic	83.5%	86.7%	36.8

Model Comparison

vs GPT-4o Mini

Advantages:

7.2% better on MMLU (general knowledge)
9.5% better on HumanEval (code generation)
10.1% better on mathematical reasoning (GSM8K)
Superior multimodal understanding across all vision benchmarks
Larger context window (200K vs 128K)
Persistent memory system with cross-session learning
Open source with Apache 2.0 license

Performance Summary: Inclusium-Premier demonstrates consistent superiority across language understanding, coding, mathematics, and multimodal tasks while offering greater flexibility through open-source licensing.

vs Surface-AI r19372

Comparison:

Inclusium-Premier: General-purpose multimodal model
Surface-AI r19372: Specialized coding assistant

Where Inclusium-Premier Excels:

Multimodal capabilities (vision, image analysis)
Multilingual support (13+ languages vs code-focused)
Mathematical and logical reasoning
General knowledge and question answering
Creative writing and content generation
Larger parameter count (24.7B vs 19.4B)

Where Surface-AI r19372 Excels:

Specialized code completion features
Code-specific memory patterns
Optimized for software development workflows

Conclusion: Inclusium-Premier is the superior choice for general-purpose applications, multimodal tasks, and comprehensive AI assistance. Surface-AI r19372 remains competitive for pure coding workflows.

Installation

pip install transformers torch pillow accelerate

Usage

Text Generation

from transformers import AutoTokenizer, AutoModelForCausalLM
import torch

tokenizer = AutoTokenizer.from_pretrained("Surface-ai/Inclusium-Premier")
model = AutoModelForCausalLM.from_pretrained(
    "Surface-ai/Inclusium-Premier",
    torch_dtype=torch.bfloat16,
    device_map="auto"
)

prompt = "Explain quantum entanglement in simple terms"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=512, temperature=0.7)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(response)

Vision Understanding

from transformers import AutoProcessor, AutoModelForVision2Seq
from PIL import Image

processor = AutoProcessor.from_pretrained(Surface-ai/Inclusium-Premier")
model = AutoModelForVision2Seq.from_pretrained(
    "Surface-ai/Inclusium-Premier",
    torch_dtype=torch.bfloat16,
    device_map="auto"
)

image = Image.open("chart.png")
prompt = "Describe this chart and analyze the trends"

inputs = processor(text=prompt, images=image, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=1024)
description = processor.decode(outputs[0], skip_special_tokens=True)
print(description)

Code Generation

prompt = """Create a Python function that implements a binary search tree with the following methods:
- insert(value)
- search(value)
- delete(value)
- inorder_traversal()
"""

inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=2048, temperature=0.7)
code = tokenizer.decode(outputs[0], skip_special_tokens=True)
print(code)

Memory-Enabled Conversation

import json

# Initialize conversation memory
memory = {
    "context": "software development",
    "previous_topics": ["API design", "database schema"],
    "user_preferences": {"language": "python", "style": "clean_code"}
}

prompt = f"""
<memory>{json.dumps(memory)}</memory>
Based on our previous discussion about API design and database schema,
help me implement the authentication middleware.
"""

inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_length=2048)
response = tokenizer.decode(outputs[0], skip_special_tokens=True)

Supported Languages

Programming Languages

Python, JavaScript, TypeScript, Java, C++, C#, Go, Rust, Ruby, PHP, Swift, Kotlin, Scala, R, SQL, Shell, HTML, CSS

Natural Languages

English, Spanish, French, German, Italian, Portuguese, Chinese (Simplified/Traditional), Japanese, Korean, Russian, Arabic, Hindi, Dutch, Polish, Swedish

Technical Specifications

Architecture: Transformer-XL with multimodal extensions
Parameters: 24.7 billion
Hidden Size: 6144
Layers: 52
Attention Heads: 48
Vocabulary Size: 128K tokens
Context Window: 200,000 tokens
Vision Encoder: ViT-L/14 (304M parameters)
Precision: BF16, FP32
Format: SafeTensors (recommended), PyTorch
Memory Footprint: 50GB (BF16), 25GB (INT8)

Memory System Architecture

Inclusium-Premier features a sophisticated memory subsystem:

Short-term Memory: Active context up to 200K tokens
Long-term Memory: Persistent storage with retrieval-augmented generation
Episodic Memory: Conversation history with semantic indexing
Semantic Memory: Learned patterns and knowledge extraction
Working Memory: Task-specific context and intermediate reasoning

Training Details

Training Data:

Web text corpus: 4.5 trillion tokens
Code repositories: 1.2 trillion tokens
Books and publications: 500 billion tokens
Scientific papers: 300 billion tokens
Multilingual data: 800 billion tokens
Vision-language pairs: 2 billion image-text pairs

Training Compute:

8192 H100 GPUs
Training duration: 45 days
FLOPs: 2.1e24

Optimization:

AdamW optimizer
Learning rate: 1.5e-4 with cosine decay
Batch size: 16M tokens
Gradient clipping: 1.0
Weight decay: 0.1

Safety and Alignment

Inclusium-Premier has been extensively aligned for safety:

Reinforcement learning from human feedback (RLHF)
Constitutional AI principles
Red-teaming and adversarial testing
Bias mitigation across demographic dimensions
Content filtering for harmful outputs
Robust to jailbreak attempts

Limitations

May occasionally generate incorrect information (hallucination)
Performance varies with prompt quality and specificity
Vision understanding limited to static images (no video)
Mathematical proofs may contain errors requiring verification
Knowledge cutoff: October 2025
Computational requirements substantial for full precision

Ethical Considerations

Users should:

Verify critical information from authoritative sources
Review generated code for security vulnerabilities
Consider privacy when processing sensitive data
Be aware of potential biases in outputs
Use responsibly and in accordance with applicable laws
Provide human oversight for high-stakes decisions

Hardware Requirements

Minimum

GPU: NVIDIA A100 40GB or equivalent
RAM: 64GB
Storage: 60GB

Optimized Inference

INT8 quantization: 25GB VRAM
4-bit quantization: 15GB VRAM (with quality trade-offs)

Model Variants

Inclusium-Premier-Base: Pre-trained foundation model
Inclusium-Premier-Instruct: Instruction-tuned variant (this model)
Inclusium-Premier-Code: Specialized for programming tasks
Inclusium-Premier-Vision: Enhanced multimodal capabilities

Citation

@software{inclusium_premier_2025,
  title={Inclusium-Premier: A Multimodal Language Model for General Intelligence},
  author={Surface ai Research Team},
  year={2025},
  url={https://huggingface.co/Surface-ai/Inclusium-Premier},
  version={1.0.0},
  license={Apache-2.0}
}

License

Licensed under Apache License 2.0. Commercial use permitted. See LICENSE file for full terms.

Changelog

v1.0.0 (November 2025)

Initial release
24.7B parameters
Multimodal capabilities with vision understanding
200K context window
13+ language support
Memory-augmented architecture
SafeTensors format support

Acknowledgments

Built on research from the open-source AI community. Training infrastructure provided by high-performance computing partnerships. Dataset curation involved contributions from thousands of domain experts.

Model Card Status: Complete
Last Updated: November 15, 2025
SafeTensors: Available
Model Size: 48.2GB (BF16)

Downloads last month: 37

Surface-ai
/

Inclusium-Premier

Inclusium-Premier (The benchmark are not valid and will be replaced whit actually accurate ones :)

Model Details

Key Capabilities

Core Features

Technical Highlights

Performance Benchmarks

General Language Understanding

Code Generation

Multimodal Understanding

Multilingual Performance

Model Comparison

vs GPT-4o Mini

vs Surface-AI r19372

Installation

Usage

Text Generation

Vision Understanding

Code Generation

Memory-Enabled Conversation

Supported Languages

Programming Languages

Natural Languages

Technical Specifications

Memory System Architecture

Training Details

Safety and Alignment

Limitations

Ethical Considerations

Hardware Requirements

Minimum

Recommended

Optimized Inference

Model Variants

Citation

License

Changelog

Acknowledgments