Edit Models filters

Inference Providers

Nebius AI Studio

HF Inference API

Misc

Inference Endpoints

Misc with no match

AutoTrain Compatible

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

74

Full-text search

Active filters: Quantized

VPTQ-community/deepseek-r1_v_8_k_65536_mixed_mp4

Updated Mar 12 • 30 • 2

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v12-k65536-4096-woft

Updated Jan 13 • 150 • 4

ABX-AI/WizardLM-2-7B-GGUF-IQ-Imatrix

Updated Apr 15, 2024 • 480 • 21

erdiari/turkish-quantized

Updated Jun 5, 2024 • 17 • 2

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v16-k65536-32768-woft

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v8-k65536-65536-woft

Updated Mar 20 • 8

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v8-k65536-4096-woft

Updated Mar 20 • 5

VPTQ-community/Meta-Llama-3.1-8B-Instruct-v8-k65536-256-woft

Updated Mar 20 • 48

VPTQ-community/Qwen2.5-72B-Instruct-v16-k65536-65536-woft

Updated Feb 25 • 4 • 4

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v16-k65536-65536-woft

Updated Feb 25 • 2

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k65536-256-woft

Updated Feb 25 • 4 • 1

VPTQ-community/Qwen2.5-7B-Instruct-v8-k65536-256-woft

Updated Mar 20 • 4

VPTQ-community/Qwen2.5-72B-Instruct-v16-k65536-32768-woft

Updated Feb 25 • 20 • 3

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k32768-0-woft

Updated Feb 25 • 5 • 1

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k65536-65536-woft

Updated Feb 25 • 3 • 2

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k16384-0-woft

Updated Feb 25 • 2 • 2

VPTQ-community/Meta-Llama-3.1-70B-Instruct-v8-k65536-0-woft

Updated Feb 25 • 36 • 2

SandLogicTechnologies/Llama-3.2-3B-Instruct-GGUF

Text Generation • Updated Sep 26, 2024 • 8

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-4-woft-duplicated

Updated Feb 25 • 1 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-1024-woft

Updated Feb 25 • 8 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v8-k4096-0-woft

Updated Feb 25 • 3 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-64-woft

Updated Feb 25 • 2 • 3

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k32768-32768-woft

Updated Feb 26 • 3 • 1

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-128-woft

Updated Feb 25 • 1 • 1

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-4-woft

Updated Feb 25 • 2

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-0-woft

Updated Feb 25 • 14 • 2

VPTQ-community/Qwen2.5-72B-Instruct-v8-k512-512-woft

Updated Feb 25 • 2 • 1

VPTQ-community/Qwen2.5-72B-Instruct-v8-k1024-512-woft

Updated Feb 25 • 7 • 2

VPTQ-community/Meta-Llama-3.1-405B-Instruct-v16-k65536-256-woft

Updated Feb 25 • 7 • 1

VPTQ-community/Qwen2.5-72B-Instruct-v8-k65536-256-woft

Updated Feb 25 • 2 • 4