10 57 55

Pengxiang Li

pengxiang

pixeli99

AI & ML interests

Video generation, Image editing, AD

Recent Activity

upvoted a paper 5 days ago

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

upvoted a paper 10 days ago

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

updated a model 12 days ago

pengxiang/Qwen2.5-1.5B-Open-R1-Distill-loop

View all activity

Organizations

None yet

pengxiang's activity

upvoted a paper 5 days ago

Reinforcement Learning for Reasoning in Large Language Models with One Training Example

Paper • 2504.20571 • Published 8 days ago • 88

upvoted a paper 10 days ago

Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model?

Paper • 2504.13837 • Published 19 days ago • 119

updated 2 models 12 days ago

pengxiang/Qwen2.5-1.5B-Open-R1-Distill-loop

Updated 12 days ago • 4

pengxiang/Qwen2.5-1.5B-Open-R1-Distill

Text Generation • Updated 12 days ago • 8

liked a dataset 12 days ago

Anthropic/values-in-the-wild

Viewer • Updated 9 days ago • 6.91k • 1.34k • 127

published a model 13 days ago

pengxiang/Qwen2.5-1.5B-Open-R1-Distill-loop

Updated 12 days ago • 4

updated a model 13 days ago

pengxiang/Qwen2.5-1.5B-Open-R1-Distill

Text Generation • Updated 12 days ago • 8

published a model 13 days ago

pengxiang/Qwen2.5-1.5B-Open-R1-Distill

Text Generation • Updated 12 days ago • 8

published a model 14 days ago

pengxiang/Qwen2.5-1.5B-Open-R1-GRPO

Updated 14 days ago

updated a dataset 14 days ago

pengxiang/coins_new

Viewer • Updated 14 days ago • 4.91k • 385

authored a paper 15 days ago

InfiGUI-R1: Advancing Multimodal GUI Agents from Reactive Actors to Deliberative Reasoners

Paper • 2504.14239 • Published 18 days ago • 13

updated a dataset 15 days ago

pengxiang/COIN

Viewer • Updated 15 days ago • 528 • 13

upvoted a paper 15 days ago

InfiGUI-R1: Advancing Multimodal GUI Agents from Reactive Actors to Deliberative Reasoners

Paper • 2504.14239 • Published 18 days ago • 13

commented a paper 15 days ago

InfiGUI-R1: Advancing Multimodal GUI Agents from Reactive Actors to Deliberative Reasoners

Paper • 2504.14239 • Published 18 days ago • 13 •

published a dataset 15 days ago

pengxiang/COIN

Viewer • Updated 15 days ago • 528 • 13

published a dataset 17 days ago

pengxiang/coins_new

Viewer • Updated 14 days ago • 4.91k • 385

updated 2 datasets 22 days ago

pengxiang/tvqa

Preview • Updated 22 days ago • 83

pengxiang/tvqa

Preview • Updated 22 days ago • 83