1 25 147

peng

superpeng

AI & ML interests

None yet

Recent Activity

liked a dataset 26 days ago

xl-zhao/PromptCoT-QwQ-Dataset

liked a dataset about 2 months ago

Flmc/DISC-Med-SFT

liked a dataset about 2 months ago

simplescaling/s1K-1.1

View all activity

Organizations

None yet

superpeng's activity

liked a dataset 26 days ago

xl-zhao/PromptCoT-QwQ-Dataset

Viewer • Updated 28 days ago • 42.9k • 177 • 4

liked 4 datasets about 2 months ago

upvoted a paper 2 months ago

SWE-RL: Advancing LLM Reasoning via Reinforcement Learning on Open Software Evolution

Paper • 2502.18449 • Published Feb 25 • 74

liked a dataset 2 months ago

open-thoughts/OpenThoughts-114k

Viewer • Updated Apr 6 • 228k • 25.4k • 701

upvoted a collection 2 months ago

Phi-4

Collection

Phi-4 family of small language, multi-modal and reasoning models. • 13 items • Updated 6 days ago • 141

liked a model 2 months ago

microsoft/Phi-4-mini-instruct

Text Generation • Updated 7 days ago • 444k • 464

liked 2 datasets 2 months ago

FreedomIntelligence/Medical-R1-Distill-Data

Viewer • Updated Feb 22 • 22k • 653 • 38

jdh-algo/Citrus_S3

Preview • Updated Feb 27 • 106 • 10

liked a model 2 months ago

baichuan-inc/Baichuan-M1-14B-Instruct

Updated Feb 20 • 7.91k • 58

liked 2 datasets 2 months ago

FreedomIntelligence/medical-o1-verifiable-problem

Viewer • Updated Dec 30, 2024 • 40.6k • 626 • 91

Congliu/Chinese-DeepSeek-R1-Distill-data-110k-SFT

Viewer • Updated Feb 19 • 110k • 1.68k • 175

liked a dataset 3 months ago

SPIRAL-MED/o1-journey-Ophiuchus

Viewer • Updated Jan 15 • 5.31k • 45 • 12

upvoted a collection 3 months ago

DeepSeek-R1-ReDistill

Collection

Re-distilled DeepSeek R1 models • 4 items • Updated Jan 30 • 14

liked 2 datasets 3 months ago

mlfoundations-dev/filtered_numina_R1

Viewer • Updated Jan 23 • 34.3k • 136 • 6

ServiceNow-AI/R1-Distill-SFT

Viewer • Updated Feb 8 • 1.85M • 1.89k • 295

liked 2 datasets 4 months ago

BAAI/Infinity-Instruct

Viewer • Updated Feb 25 • 20.4M • 4.09k • 618

zd21/ReST-MCTS-Llama3-8b-Instruct-Policy-1st

Viewer • Updated May 30, 2024 • 33.7k • 28 • 7