Models
Datasets
Spaces
Docs
Enterprise
Pricing
Log In
Sign Up

Ultravox.ai

Team

company

https://ultravox.ai

ultravox_dot_ai

AI & ML interests

None defined yet.

fixie-ai 's collections 5

fixie-ai/ultravox-v0_7-glm-4_6

Audio-Text-to-Text • 0.7B • Updated Dec 8, 2025 • 1.39k • 12

Multimodal model for better turn-taking

fixie-ai/ultraVAD

Feature Extraction • 0.7B • Updated 23 days ago • 763 • 31
fixie-ai/turntaking-pretraining-it-multilingual-3c

8B • Updated Jun 17, 2025 • 1.21k

Ultravox v0.4.1

Ultravox is a multimodal Speech LLM built around different pretrained LLMs (frozen) and the whisper-large-v3-turbo (frozen) backbone.

fixie-ai/ultravox-v0_4_1-llama-3_3-70b

Audio-Text-to-Text • 58.7M • Updated May 6, 2025 • 7 • 11
fixie-ai/ultravox-v0_4_1-llama-3_1-8b

Audio-Text-to-Text • 50.3M • Updated May 6, 2025 • 450 • 99
fixie-ai/ultravox-v0_4_1-mistral-nemo

Audio-Text-to-Text • 52.4M • Updated May 6, 2025 • 73 • 26

fixie-ai/ultravox-v0_6-llama-3_3-70b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 1.07k • 9
fixie-ai/ultravox-v0_6-gemma-3-27b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 1.66k • 8
fixie-ai/ultravox-v0_6-qwen-3-32b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 2.71k • 11
fixie-ai/ultravox-v0_6-llama-3_1-8b

Audio-Text-to-Text • 0.7B • Updated Jul 5, 2025 • 6.1k • 6

Ultravox is a multimodal Speech LLM built around different pretrained LLMs (frozen) and the whisper-large-v3-turbo (fine-tuned) backbone.

fixie-ai/ultravox-v0_5-llama-3_3-70b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 23 • 32
fixie-ai/ultravox-v0_5-llama-3_1-8b

Audio-Text-to-Text • 0.7B • Updated May 6, 2025 • 1.64k • 34
fixie-ai/ultravox-v0_5-llama-3_2-1b

Audio-Text-to-Text • 0.7B • Updated Nov 27, 2025 • 334k • 68
fixie-ai/ultravox-v0_5-glm-4_5-355b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 1.41k • 2

fixie-ai/ultravox-v0_7-glm-4_6

Audio-Text-to-Text • 0.7B • Updated Dec 8, 2025 • 1.39k • 12

fixie-ai/ultravox-v0_6-llama-3_3-70b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 1.07k • 9
fixie-ai/ultravox-v0_6-gemma-3-27b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 1.66k • 8
fixie-ai/ultravox-v0_6-qwen-3-32b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 2.71k • 11
fixie-ai/ultravox-v0_6-llama-3_1-8b

Audio-Text-to-Text • 0.7B • Updated Jul 5, 2025 • 6.1k • 6

Multimodal model for better turn-taking

fixie-ai/ultraVAD

Feature Extraction • 0.7B • Updated 23 days ago • 763 • 31
fixie-ai/turntaking-pretraining-it-multilingual-3c

8B • Updated Jun 17, 2025 • 1.21k

Ultravox is a multimodal Speech LLM built around different pretrained LLMs (frozen) and the whisper-large-v3-turbo (fine-tuned) backbone.

fixie-ai/ultravox-v0_5-llama-3_3-70b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 23 • 32
fixie-ai/ultravox-v0_5-llama-3_1-8b

Audio-Text-to-Text • 0.7B • Updated May 6, 2025 • 1.64k • 34
fixie-ai/ultravox-v0_5-llama-3_2-1b

Audio-Text-to-Text • 0.7B • Updated Nov 27, 2025 • 334k • 68
fixie-ai/ultravox-v0_5-glm-4_5-355b

Audio-Text-to-Text • 0.7B • Updated Sep 12, 2025 • 1.41k • 2

Ultravox v0.4.1

Ultravox is a multimodal Speech LLM built around different pretrained LLMs (frozen) and the whisper-large-v3-turbo (frozen) backbone.

fixie-ai/ultravox-v0_4_1-llama-3_3-70b

Audio-Text-to-Text • 58.7M • Updated May 6, 2025 • 7 • 11
fixie-ai/ultravox-v0_4_1-llama-3_1-8b

Audio-Text-to-Text • 50.3M • Updated May 6, 2025 • 450 • 99
fixie-ai/ultravox-v0_4_1-mistral-nemo

Audio-Text-to-Text • 52.4M • Updated May 6, 2025 • 73 • 26

Company

TOS Privacy About Careers

Website

Models Datasets Spaces Pricing Docs