Inference Providers
Active filters: ModelOpt
nvidia/diffusiongemma-26B-A4B-it-NVFP4
Text Generation
• 14B • Updated • 49.1k
• 52
nvidia/Qwen3.6-35B-A3B-NVFP4
Text Generation
• 19B • Updated • 953k
• 224
nvidia/DeepSeek-V4-Flash-NVFP4
Text Generation
• 167B • Updated • 105k
• 26
nvidia/Qwen3.5-122B-A10B-NVFP4
Text Generation
• 65B • Updated • 8.51k
• 17
nvidia/Gemma-4-31B-IT-NVFP4
Text Generation
• 21B • Updated • 1.43M
• 509
nvidia/MiniMax-M2.7-NVFP4
Text Generation
• 116B • Updated • 271k
• 57
Text Generation
• 2B • Updated • 406
• 8
Text Generation
• 382B • Updated • 32k
• 36
Text Generation
• Updated • 851k
• 37
nvidia/DeepSeek-V4-Pro-NVFP4
Text Generation
• 910B • Updated • 52k
• 61
NVFP4/Qwen3-Coder-30B-A3B-Instruct-FP4
Text Generation
• 16B • Updated • 5.17k
• 33
nvidia/Gemma-4-26B-A4B-NVFP4
Text Generation
• 14B • Updated • 992k
• 75
nvidia/Wan2.2-T2V-A14B-Diffusers-NVFP4
Text-to-Video
• Updated • 11
nvidia/Qwen3-30B-A3B-NVFP4
Text Generation
• 16B • Updated • 40.5k
• 34
nvidia/Phi-4-multimodal-instruct-NVFP4
4B • Updated • 7.03k
• 12
nvidia/Qwen3-Next-80B-A3B-Instruct-NVFP4
Text Generation
• Updated • 21.8k
• 42
Text Generation
• Updated • 796k
• 86
Image-Text-to-Text
• 3B • Updated • 1.67k
• 4
Image-Text-to-Text
• 2B • Updated • 956
• 3
nvidia/Kimi-K2.5-Thinking-Eagle3
Text Generation
• 2B • Updated • 9.02k
• 16
nvidia/DeepSeek-V3-0324-NVFP4
Text Generation
• 397B • Updated • 40.5k
• 17
nvidia/DeepSeek-R1-0528-NVFP4
Text Generation
• 397B • Updated • 2.11k
• 44
NVFP4/DeepSeek-Prover-V2-7B-FP4
4B • Updated • 6
• 1
NVFP4/DeepSeek-R1-0528-Qwen3-8B-FP4
5B • Updated • 13
• 1
Text Generation
• 19B • Updated • 395
• 4
NVFP4/Polaris-4B-Preview-FP4
2B • Updated • 105
• 1
NVFP4/Polaris-7B-Preview-FP4
5B • Updated • 4
• 1
nvidia/Qwen3-235B-A22B-FP8
Text Generation
• 235B • Updated • 165
• 5
nvidia/Qwen3-235B-A22B-NVFP4
Text Generation
• 133B • Updated • 41.2k
• 18
tachyphylaxis/DeepSeek-R1-0528-FP4
Text Generation
• 397B • Updated • 3