Spaces:

MVLLL
/

Multi-view-leaderboard

Running

App Files Files Community

Multi-view-leaderboard / dividing_into_different_subsets_mbpp /calculate_cata_result.py

lmy0802

Upload 111 files

4daa863 verified 6 months ago

raw

history blame

2.58 kB

	import json
	import os
	import csv
	# 定义文件所在的目录
	input_dir = 'E:/python-testn/pythonProject3/hh_2/evaluate_result_mbpp'

	# 获取目录中的所有文件
	files = os.listdir(input_dir)

	with open("cata_result.csv","w", newline='') as csvfile:
	writer = csv.writer(csvfile)
	writer.writerow(["Model", "Array", "String","Math","Other"])

	for file_name in files:
	# 构建完整的文件路径
	input_file_path = os.path.join(input_dir, file_name)
	first_underscore_index = file_name.find('_')

	# 找到最后一个 - 的位置
	last_dash_index = file_name.rfind('-')
	model_name = file_name[first_underscore_index + 1:last_dash_index]
	print(model_name)
	with open(input_file_path,"r",encoding="utf-8") as file:
	data1=json.load(file)

	with open("mbpp_with_cata.json", "r", encoding="utf-8") as file:
	data2=json.load(file)
	sum0=0
	count0=0
	sum1=0
	count1=0
	sum2=0
	count2=0
	sum3 = 0
	count3 = 0



	for item1 in data1:
	task_id = item1["task_id"] # 假设 task_id 是 item1 中的一个属性
	value = item1["pass@1"] # 假设 value 是 item1 中的一个属性

	# 在 data2 中找到与 task_id 相同的对象
	item2 = next((item for item in data2 if item["task_id"] == task_id), None)

	if item2 is not None:
	#按照token个数划分后的评估结果
	if item2["cata"] == "Array":
	index=item2["task_id"]

	sum0=sum0+value
	count0=count0+1
	if item2["cata"] == "String":
	index=item2["task_id"]

	sum1=sum1+value
	count1=count1+1
	if item2["cata"] == "Math":
	index=item2["task_id"]

	sum2=sum2+value
	count2=count2+1
	if item2["cata"] == "Other":
	index=item2["task_id"]

	sum3=sum3+value
	count3=count3+1



	mean0 = round(sum0 / count0 * 100, 2)

	mean1 = round(sum1 / count1 * 100, 2)
	mean2 = round(sum2 / count2 * 100, 2)
	if count3==0:
	mean3=0
	else:
	mean3 = round(sum3 / count3 * 100, 2)

	print("count_result!!")
	print(count0, count1, count2, count3)
	print(mean0, mean1, mean2, mean3)
	with open("cata_result.csv", mode='a', newline='', encoding='utf-8') as file:
	writer = csv.writer(file)
	writer.writerow([model_name, mean0, mean1, mean2, mean3])