Spaces:
Running
Running
michal
commited on
Commit
·
e86179d
1
Parent(s):
e88ceea
Add deepseek
Browse files- leaderboards/all_types_years.json +177 -0
- leaderboards/llmzszl.json +24 -0
leaderboards/all_types_years.json
CHANGED
@@ -4659,5 +4659,182 @@
|
|
4659 |
"(2019, 'Egzaminy Ósmoklasisty')": 0.5,
|
4660 |
"(2022, 'Egzaminy Ósmoklasisty')": 0.09090909090909091,
|
4661 |
"(2020, 'Egzaminy Ósmoklasisty')": 0.08333333333333333
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
4662 |
}
|
4663 |
}
|
|
|
4659 |
"(2019, 'Egzaminy Ósmoklasisty')": 0.5,
|
4660 |
"(2022, 'Egzaminy Ósmoklasisty')": 0.09090909090909091,
|
4661 |
"(2020, 'Egzaminy Ósmoklasisty')": 0.08333333333333333
|
4662 |
+
},
|
4663 |
+
"CYFRAGOVPL__PLLuM-12B-nc-base": {
|
4664 |
+
"(2010, 'Egzaminy Gimnazjalne')": 0.5555555555555556,
|
4665 |
+
"(2012, 'Egzaminy Gimnazjalne')": 0.0,
|
4666 |
+
"(2007, 'Egzaminy Gimnazjalne')": 0.4444444444444444,
|
4667 |
+
"(2005, 'Egzaminy Gimnazjalne')": 0.4666666666666667,
|
4668 |
+
"(2003, 'Egzaminy Gimnazjalne')": 0.42857142857142855,
|
4669 |
+
"(2008, 'Egzaminy Gimnazjalne')": 0.75,
|
4670 |
+
"(2018, 'Egzaminy Gimnazjalne')": 0.42857142857142855,
|
4671 |
+
"(2017, 'Egzaminy Gimnazjalne')": 0.2,
|
4672 |
+
"(2015, 'Egzaminy Gimnazjalne')": 0.1111111111111111,
|
4673 |
+
"(2019, 'Egzaminy Gimnazjalne')": 0.4444444444444444,
|
4674 |
+
"(2006, 'Egzaminy Gimnazjalne')": 0.6666666666666666,
|
4675 |
+
"(2014, 'Egzaminy Gimnazjalne')": 0.375,
|
4676 |
+
"(2011, 'Egzaminy Gimnazjalne')": 0.5,
|
4677 |
+
"(2009, 'Egzaminy Gimnazjalne')": 0.5714285714285714,
|
4678 |
+
"(2004, 'Egzaminy Gimnazjalne')": 0.5333333333333333,
|
4679 |
+
"(2013, 'Egzaminy Gimnazjalne')": 0.5,
|
4680 |
+
"(2016, 'Egzaminy Gimnazjalne')": 0.3,
|
4681 |
+
"(2002, 'Egzaminy Gimnazjalne')": 0.1875,
|
4682 |
+
"(2019, 'Egzaminy Zawodowe')": 0.5385520894643908,
|
4683 |
+
"(2021, 'Egzaminy Zawodowe')": 0.5102356122054847,
|
4684 |
+
"(2023, 'Egzaminy Zawodowe')": 0.47320061255742724,
|
4685 |
+
"(2022, 'Egzaminy Zawodowe')": 0.4959207459207459,
|
4686 |
+
"(2024, 'Egzaminy Zawodowe')": 0.5476190476190477,
|
4687 |
+
"(2020, 'Egzaminy Zawodowe')": 0.5115681233933161,
|
4688 |
+
"(2017, 'Egzaminy Zawodowe')": 0.5,
|
4689 |
+
"(2018, 'Egzaminy Zawodowe')": 0.5218331171638565,
|
4690 |
+
"(2013, 'Egzaminy Zawodowe')": 0.4745417515274949,
|
4691 |
+
"(2014, 'Egzaminy Zawodowe')": 0.49097162510748066,
|
4692 |
+
"(2016, 'Egzaminy Zawodowe')": 0.47027972027972026,
|
4693 |
+
"(2015, 'Egzaminy Zawodowe')": 0.48344370860927155,
|
4694 |
+
"(2020, 'Egzaminy Maturalne')": 0.14285714285714285,
|
4695 |
+
"(2010, 'Egzaminy Maturalne')": 0.4444444444444444,
|
4696 |
+
"(2012, 'Egzaminy Maturalne')": 0.375,
|
4697 |
+
"(2007, 'Egzaminy Maturalne')": 0.4444444444444444,
|
4698 |
+
"(2005, 'Egzaminy Maturalne')": 0.375,
|
4699 |
+
"(2003, 'Egzaminy Maturalne')": 0.42857142857142855,
|
4700 |
+
"(2008, 'Egzaminy Maturalne')": 0.7142857142857143,
|
4701 |
+
"(2018, 'Egzaminy Maturalne')": 0.3235294117647059,
|
4702 |
+
"(2017, 'Egzaminy Maturalne')": 0.2857142857142857,
|
4703 |
+
"(2015, 'Egzaminy Maturalne')": 0.2903225806451613,
|
4704 |
+
"(2019, 'Egzaminy Maturalne')": 0.2962962962962963,
|
4705 |
+
"(2006, 'Egzaminy Maturalne')": 0.6666666666666666,
|
4706 |
+
"(2014, 'Egzaminy Maturalne')": 0.2,
|
4707 |
+
"(2011, 'Egzaminy Maturalne')": 0.5,
|
4708 |
+
"(2009, 'Egzaminy Maturalne')": 0.8,
|
4709 |
+
"(2004, 'Egzaminy Maturalne')": 0.4,
|
4710 |
+
"(2013, 'Egzaminy Maturalne')": 0.2,
|
4711 |
+
"(2016, 'Egzaminy Maturalne')": 0.3548387096774194,
|
4712 |
+
"(2002, 'Egzaminy Maturalne')": 0.1,
|
4713 |
+
"(2023, 'Egzaminy Maturalne')": 0.3111111111111111,
|
4714 |
+
"(2021, 'Egzaminy Maturalne')": 0.32,
|
4715 |
+
"(2022, 'Egzaminy Maturalne')": 0.25806451612903225,
|
4716 |
+
"(2023, 'Egzaminy Ósmoklasisty')": 0.5714285714285714,
|
4717 |
+
"(2021, 'Egzaminy Ósmoklasisty')": 0.4,
|
4718 |
+
"(2019, 'Egzaminy Ósmoklasisty')": 0.3,
|
4719 |
+
"(2022, 'Egzaminy Ósmoklasisty')": 0.2727272727272727,
|
4720 |
+
"(2020, 'Egzaminy Ósmoklasisty')": 0.25
|
4721 |
+
},
|
4722 |
+
"deepseek-ai__DeepSeek-R1-Distill-Qwen-14B": {
|
4723 |
+
"(2010, 'Egzaminy Gimnazjalne')": 0.4444444444444444,
|
4724 |
+
"(2012, 'Egzaminy Gimnazjalne')": 0.5,
|
4725 |
+
"(2007, 'Egzaminy Gimnazjalne')": 0.5555555555555556,
|
4726 |
+
"(2005, 'Egzaminy Gimnazjalne')": 0.4666666666666667,
|
4727 |
+
"(2003, 'Egzaminy Gimnazjalne')": 0.42857142857142855,
|
4728 |
+
"(2008, 'Egzaminy Gimnazjalne')": 0.625,
|
4729 |
+
"(2018, 'Egzaminy Gimnazjalne')": 0.2857142857142857,
|
4730 |
+
"(2017, 'Egzaminy Gimnazjalne')": 0.5,
|
4731 |
+
"(2015, 'Egzaminy Gimnazjalne')": 0.5555555555555556,
|
4732 |
+
"(2019, 'Egzaminy Gimnazjalne')": 0.2222222222222222,
|
4733 |
+
"(2006, 'Egzaminy Gimnazjalne')": 0.6666666666666666,
|
4734 |
+
"(2014, 'Egzaminy Gimnazjalne')": 0.375,
|
4735 |
+
"(2011, 'Egzaminy Gimnazjalne')": 0.625,
|
4736 |
+
"(2009, 'Egzaminy Gimnazjalne')": 0.7142857142857143,
|
4737 |
+
"(2004, 'Egzaminy Gimnazjalne')": 0.6666666666666666,
|
4738 |
+
"(2013, 'Egzaminy Gimnazjalne')": 0.25,
|
4739 |
+
"(2016, 'Egzaminy Gimnazjalne')": 0.4,
|
4740 |
+
"(2002, 'Egzaminy Gimnazjalne')": 0.3125,
|
4741 |
+
"(2019, 'Egzaminy Zawodowe')": 0.4855797527957622,
|
4742 |
+
"(2021, 'Egzaminy Zawodowe')": 0.46427191966010045,
|
4743 |
+
"(2023, 'Egzaminy Zawodowe')": 0.4655436447166922,
|
4744 |
+
"(2022, 'Egzaminy Zawodowe')": 0.4592074592074592,
|
4745 |
+
"(2024, 'Egzaminy Zawodowe')": 0.45714285714285713,
|
4746 |
+
"(2020, 'Egzaminy Zawodowe')": 0.4726863753213368,
|
4747 |
+
"(2017, 'Egzaminy Zawodowe')": 0.4557046979865772,
|
4748 |
+
"(2018, 'Egzaminy Zawodowe')": 0.48076091655858194,
|
4749 |
+
"(2013, 'Egzaminy Zawodowe')": 0.42769857433808556,
|
4750 |
+
"(2014, 'Egzaminy Zawodowe')": 0.43852106620808257,
|
4751 |
+
"(2016, 'Egzaminy Zawodowe')": 0.4353146853146853,
|
4752 |
+
"(2015, 'Egzaminy Zawodowe')": 0.45695364238410596,
|
4753 |
+
"(2020, 'Egzaminy Maturalne')": 0.4642857142857143,
|
4754 |
+
"(2010, 'Egzaminy Maturalne')": 0.5555555555555556,
|
4755 |
+
"(2012, 'Egzaminy Maturalne')": 0.125,
|
4756 |
+
"(2007, 'Egzaminy Maturalne')": 0.5555555555555556,
|
4757 |
+
"(2005, 'Egzaminy Maturalne')": 0.75,
|
4758 |
+
"(2003, 'Egzaminy Maturalne')": 0.42857142857142855,
|
4759 |
+
"(2008, 'Egzaminy Maturalne')": 0.5714285714285714,
|
4760 |
+
"(2018, 'Egzaminy Maturalne')": 0.5,
|
4761 |
+
"(2017, 'Egzaminy Maturalne')": 0.6071428571428571,
|
4762 |
+
"(2015, 'Egzaminy Maturalne')": 0.3870967741935484,
|
4763 |
+
"(2019, 'Egzaminy Maturalne')": 0.4074074074074074,
|
4764 |
+
"(2006, 'Egzaminy Maturalne')": 0.8333333333333334,
|
4765 |
+
"(2014, 'Egzaminy Maturalne')": 0.7,
|
4766 |
+
"(2011, 'Egzaminy Maturalne')": 0.5,
|
4767 |
+
"(2009, 'Egzaminy Maturalne')": 0.8,
|
4768 |
+
"(2004, 'Egzaminy Maturalne')": 0.6,
|
4769 |
+
"(2013, 'Egzaminy Maturalne')": 0.6,
|
4770 |
+
"(2016, 'Egzaminy Maturalne')": 0.4838709677419355,
|
4771 |
+
"(2002, 'Egzaminy Maturalne')": 0.3,
|
4772 |
+
"(2023, 'Egzaminy Maturalne')": 0.7111111111111111,
|
4773 |
+
"(2021, 'Egzaminy Maturalne')": 0.32,
|
4774 |
+
"(2022, 'Egzaminy Maturalne')": 0.5161290322580645,
|
4775 |
+
"(2023, 'Egzaminy Ósmoklasisty')": 0.5714285714285714,
|
4776 |
+
"(2021, 'Egzaminy Ósmoklasisty')": 0.3,
|
4777 |
+
"(2019, 'Egzaminy Ósmoklasisty')": 0.2,
|
4778 |
+
"(2022, 'Egzaminy Ósmoklasisty')": 0.5454545454545454,
|
4779 |
+
"(2020, 'Egzaminy Ósmoklasisty')": 0.5
|
4780 |
+
},
|
4781 |
+
"deepseek-ai__DeepSeek-R1-Distill-Qwen-32B": {
|
4782 |
+
"(2010, 'Egzaminy Gimnazjalne')": 0.7777777777777778,
|
4783 |
+
"(2012, 'Egzaminy Gimnazjalne')": 0.6666666666666666,
|
4784 |
+
"(2007, 'Egzaminy Gimnazjalne')": 0.8888888888888888,
|
4785 |
+
"(2005, 'Egzaminy Gimnazjalne')": 0.5333333333333333,
|
4786 |
+
"(2003, 'Egzaminy Gimnazjalne')": 0.8571428571428571,
|
4787 |
+
"(2008, 'Egzaminy Gimnazjalne')": 0.625,
|
4788 |
+
"(2018, 'Egzaminy Gimnazjalne')": 0.2857142857142857,
|
4789 |
+
"(2017, 'Egzaminy Gimnazjalne')": 0.3,
|
4790 |
+
"(2015, 'Egzaminy Gimnazjalne')": 0.6666666666666666,
|
4791 |
+
"(2019, 'Egzaminy Gimnazjalne')": 0.7777777777777778,
|
4792 |
+
"(2006, 'Egzaminy Gimnazjalne')": 0.8333333333333334,
|
4793 |
+
"(2014, 'Egzaminy Gimnazjalne')": 0.625,
|
4794 |
+
"(2011, 'Egzaminy Gimnazjalne')": 0.6875,
|
4795 |
+
"(2009, 'Egzaminy Gimnazjalne')": 0.8571428571428571,
|
4796 |
+
"(2004, 'Egzaminy Gimnazjalne')": 0.8,
|
4797 |
+
"(2013, 'Egzaminy Gimnazjalne')": 0.75,
|
4798 |
+
"(2016, 'Egzaminy Gimnazjalne')": 0.5,
|
4799 |
+
"(2002, 'Egzaminy Gimnazjalne')": 0.5625,
|
4800 |
+
"(2019, 'Egzaminy Zawodowe')": 0.5800470865214832,
|
4801 |
+
"(2021, 'Egzaminy Zawodowe')": 0.5573580533024334,
|
4802 |
+
"(2023, 'Egzaminy Zawodowe')": 0.5267993874425727,
|
4803 |
+
"(2022, 'Egzaminy Zawodowe')": 0.5396270396270396,
|
4804 |
+
"(2024, 'Egzaminy Zawodowe')": 0.530952380952381,
|
4805 |
+
"(2020, 'Egzaminy Zawodowe')": 0.5562339331619537,
|
4806 |
+
"(2017, 'Egzaminy Zawodowe')": 0.5449664429530201,
|
4807 |
+
"(2018, 'Egzaminy Zawodowe')": 0.5689580631214872,
|
4808 |
+
"(2013, 'Egzaminy Zawodowe')": 0.5295315682281059,
|
4809 |
+
"(2014, 'Egzaminy Zawodowe')": 0.5468615649183147,
|
4810 |
+
"(2016, 'Egzaminy Zawodowe')": 0.527972027972028,
|
4811 |
+
"(2015, 'Egzaminy Zawodowe')": 0.5331125827814569,
|
4812 |
+
"(2020, 'Egzaminy Maturalne')": 0.6785714285714286,
|
4813 |
+
"(2010, 'Egzaminy Maturalne')": 0.6666666666666666,
|
4814 |
+
"(2012, 'Egzaminy Maturalne')": 0.5,
|
4815 |
+
"(2007, 'Egzaminy Maturalne')": 0.5555555555555556,
|
4816 |
+
"(2005, 'Egzaminy Maturalne')": 0.625,
|
4817 |
+
"(2003, 'Egzaminy Maturalne')": 0.0,
|
4818 |
+
"(2008, 'Egzaminy Maturalne')": 0.8571428571428571,
|
4819 |
+
"(2018, 'Egzaminy Maturalne')": 0.6764705882352942,
|
4820 |
+
"(2017, 'Egzaminy Maturalne')": 0.6785714285714286,
|
4821 |
+
"(2015, 'Egzaminy Maturalne')": 0.5483870967741935,
|
4822 |
+
"(2019, 'Egzaminy Maturalne')": 0.5555555555555556,
|
4823 |
+
"(2006, 'Egzaminy Maturalne')": 0.8333333333333334,
|
4824 |
+
"(2014, 'Egzaminy Maturalne')": 0.9,
|
4825 |
+
"(2011, 'Egzaminy Maturalne')": 0.875,
|
4826 |
+
"(2009, 'Egzaminy Maturalne')": 0.6,
|
4827 |
+
"(2004, 'Egzaminy Maturalne')": 0.6,
|
4828 |
+
"(2013, 'Egzaminy Maturalne')": 0.4,
|
4829 |
+
"(2016, 'Egzaminy Maturalne')": 0.6451612903225806,
|
4830 |
+
"(2002, 'Egzaminy Maturalne')": 0.5,
|
4831 |
+
"(2023, 'Egzaminy Maturalne')": 0.7333333333333333,
|
4832 |
+
"(2021, 'Egzaminy Maturalne')": 0.6,
|
4833 |
+
"(2022, 'Egzaminy Maturalne')": 0.5161290322580645,
|
4834 |
+
"(2023, 'Egzaminy Ósmoklasisty')": 0.7142857142857143,
|
4835 |
+
"(2021, 'Egzaminy Ósmoklasisty')": 0.5,
|
4836 |
+
"(2019, 'Egzaminy Ósmoklasisty')": 0.6,
|
4837 |
+
"(2022, 'Egzaminy Ósmoklasisty')": 0.45454545454545453,
|
4838 |
+
"(2020, 'Egzaminy Ósmoklasisty')": 0.4166666666666667
|
4839 |
}
|
4840 |
}
|
leaderboards/llmzszl.json
CHANGED
@@ -638,5 +638,29 @@
|
|
638 |
"Parameters (B)": 14.7,
|
639 |
"Date": "12-12",
|
640 |
"Score": 51.76
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
641 |
}
|
642 |
]
|
|
|
638 |
"Parameters (B)": 14.7,
|
639 |
"Date": "12-12",
|
640 |
"Score": 51.76
|
641 |
+
},
|
642 |
+
{
|
643 |
+
"Lang": "E",
|
644 |
+
"Family": "DeepSeek",
|
645 |
+
"Name": "deepseek-ai/DeepSeek-R1-Distill-Qwen-14B",
|
646 |
+
"Parameters (B)": 14,
|
647 |
+
"Date": "20-01",
|
648 |
+
"Score": 46.78
|
649 |
+
},
|
650 |
+
{
|
651 |
+
"Lang": "E",
|
652 |
+
"Family": "DeepSeek",
|
653 |
+
"Name": "deepseek-ai/DeepSeek-R1-Distill-Qwen-32B",
|
654 |
+
"Parameters (B)": 32,
|
655 |
+
"Date": "20-01",
|
656 |
+
"Score": 55.80
|
657 |
+
},
|
658 |
+
{
|
659 |
+
"Lang": "P",
|
660 |
+
"Family": "PLLuM",
|
661 |
+
"Name": "CYFRAGOVPL/PLLuM-12B-nc-base",
|
662 |
+
"Parameters (B)": 12,
|
663 |
+
"Date": "24-02",
|
664 |
+
"Score": 50.55
|
665 |
}
|
666 |
]
|