Inference Optimization

community

AI & ML interests

None defined yet.

Recent Activity

krishnateja95 updated a collection about 12 hours ago

Qwen3-Next-80B-A3B Quantized Models

krishnateja95 updated a collection about 12 hours ago

Qwen3-Next-80B-A3B Quantized Models

krishnateja95 updated a collection about 12 hours ago

Qwen3-Next-80B-A3B Quantized Models

View all activity

krishnateja95

updated a collection about 12 hours ago

Qwen3-Next-80B-A3B Quantized Models

FP8-dynamic, FP8-block, NVFP4, INT4, INT8 versions of Qwen3-Next-80B-A3B-Instruct and Qwen3-Next-80B-A3B-Thinking Models • 10 items • Updated about 12 hours ago

krishnateja95

published 5 models about 12 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-NVFP4

Updated about 12 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-FP8-dynamic

Updated about 12 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-FP8-block

Updated about 12 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-quantized.w4a16

Updated about 12 hours ago

inference-optimization/Qwen3-Next-80B-A3B-Thinking-quantized.w8a8

Updated about 12 hours ago

krishnateja95

updated a model 1 day ago

inference-optimization/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8-dynamic

32B • Updated 1 day ago • 8

krishnateja95

updated a collection 2 days ago

NVIDIA-Nemotron-3-Nano-30B-A3B Quantized Models

FP8-dynamic, FP8-block, NVFP4, INT4, versions of nvidia/NVIDIA-Nemotron-3-Nano-30B-A3B • 4 items • Updated 2 days ago

krishnateja95

published 4 models 2 days ago

inference-optimization/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8-block

Updated 2 days ago

inference-optimization/NVIDIA-Nemotron-3-Nano-30B-A3B-FP8-dynamic

32B • Updated 1 day ago • 8

inference-optimization/NVIDIA-Nemotron-3-Nano-30B-A3B-NVFP4

Updated 2 days ago

inference-optimization/NVIDIA-Nemotron-3-Nano-30B-A3B-quantized.w4a16

Updated 2 days ago

ChibuUkachi

updated a model 6 days ago

inference-optimization/Qwen3-30B-A3B-Thinking-2507.w4a16

Text Generation • 5B • Updated 6 days ago • 34