Edit Models filters

Inference Providers

Nebius AI Studio

HF Inference API

Misc

AutoTrain Compatible

Inference Endpoints

text-generation-inference

Misc with no match

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

15

Full-text search

Active filters: prm, trl

axolotl-ai-co/Qwen2.5-Math-PRM-7B

Token Classification • Updated Feb 18 • 7 • 1

plaguss/Qwen2.5-Math-7B-PRM-0.1

Token Classification • Updated Dec 13, 2024

plaguss/Qwen2.5-Math-7B-Instruct-PRM-0.1

Token Classification • Updated Dec 13, 2024 • 1

plaguss/Qwen2.5-Math-1.5B-Instruct-PRM-0.1

Token Classification • Updated Jan 8 • 3

HuggingFaceH4/Qwen2.5-Math-1.5B-Instruct-PRM-0.2

Token Classification • Updated Jan 9 • 25

HuggingFaceH4/Qwen2.5-Math-7B-Instruct-PRM-0.2

Token Classification • Updated Jan 9 • 13

MikeMpapa/trase-prm

Token Classification • Updated Jan 15

MikeMpapa/TraseSystem-orm-codeblob-verifier

Token Classification • Updated Jan 17 • 1

smohammadi/Qwen2.5-3B-MathShepherd

Token Classification • Updated Jan 22

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-V3

Token Classification • Updated Feb 22 • 3

alothomas/Qwen2.5-3B-PRM-RAD-balanced-V3

Token Classification • Updated Feb 22 • 1

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-V4

Token Classification • Updated Feb 23 • 3

alothomas/Qwen2.5-0.5B-PRM-RAD-balanced-150k

Token Classification • Updated Mar 3 • 8

alothomas/Qwen2.5-3B-PRM-RAD-balanced-150k

Token Classification • Updated Mar 4 • 3

hzy/Qwen2.5-Math-7B-Instruct-PRM-Modified-math_shepherd

Token Classification • Updated Mar 10 • 2