VisOnlyQA - a ryokamoi Collection

ryokamoi 's Collections

VisOnlyQA

updated Mar 29

Dataset for evaluating the visual perception capabilities of LVLMs.

VisOnlyQA: Large Vision Language Models Still Struggle with Visual Perception of Geometric Information

Paper • 2412.00947 • Published Dec 1, 2024 • 8
ryokamoi/VisOnlyQA_Eval_Real_v1.1

Viewer • Updated Mar 29 • 900 • 223
ryokamoi/VisOnlyQA_Eval_Synthetic

Viewer • Updated Mar 29 • 700 • 72 • 2
ryokamoi/VisOnlyQA_Train

Viewer • Updated Mar 29 • 70k • 282 • 2
ryokamoi/VisOnlyQA_metadata

Viewer • Updated Mar 29 • 3 • 35
ryokamoi/VisOnlyQA_Eval_Real

Viewer • Updated Mar 29 • 500 • 76 • 2