karths commited on Apr 12, 2024

Commit

5a80841

verified ·

1 Parent(s): cd884b1

Upload folder using huggingface_hub

Browse files

Files changed (28) hide show

.gitattributes +3 -0
checkpoint-14510/config.json +28 -0
checkpoint-14510/model.safetensors +3 -0
checkpoint-14510/optimizer.pt +3 -0
checkpoint-14510/rng_state.pth +3 -0
checkpoint-14510/scheduler.pt +3 -0
checkpoint-14510/trainer_state.json +193 -0
checkpoint-14510/training_args.bin +3 -0
classification_report.json +1 -0
config.json +28 -0
confusion_matrix.png +0 -0
detailed_confusion_matrix.png +0 -0
fold_results.json +67 -0
metrics.json +1 -0
metrics_all_fold.json +44 -0
metrics_ci_bounds.json +26 -0
metrics_mean.json +8 -0
metrics_std.json +8 -0
metrics_visualisation.png +0 -0
model.safetensors +3 -0
precision_recall_curve.png +0 -0
reduced_main_data.csv +3 -0
roc_curve.png +0 -0
test_data_for_future_evaluation.csv +3 -0
test_top_repo_data.csv +3 -0
top_repo_data.csv +0 -0
tracker_carbon_statistics.json +33 -0
training_args.bin +3 -0

.gitattributes CHANGED Viewed

@@ -33,3 +33,6 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+reduced_main_data.csv filter=lfs diff=lfs merge=lfs -text
+test_data_for_future_evaluation.csv filter=lfs diff=lfs merge=lfs -text
+test_top_repo_data.csv filter=lfs diff=lfs merge=lfs -text

checkpoint-14510/config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "_name_or_path": "distilroberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 6,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

checkpoint-14510/model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c39f80c5310c061d91cd3bf5425806c17e87832f5fdcb0357d553a769a0af833
+size 328492280

checkpoint-14510/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:aefdbbd70a666860b595b930995faf5d82a443ece0b4c7231145b5b80698caf2
+size 657047610

checkpoint-14510/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a65eecd607b0949fcab4b9c3ab2135139c51dfde94cbbe772b62eab1b6b3cbb6
+size 14244

checkpoint-14510/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ffe02de545b9f0e89c766a4ef1d77d40ed3c19574fc0ac23dfe4f6bceb31318
+size 1064

checkpoint-14510/trainer_state.json ADDED Viewed

	@@ -0,0 +1,193 @@

+{
+  "best_metric": null,
+  "best_model_checkpoint": null,
+  "epoch": 4.999138673557278,
+  "eval_steps": 500,
+  "global_step": 14510,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.17,
+      "learning_rate": 4.9800000000000004e-05,
+      "loss": 0.0562,
+      "step": 500
+    },
+    {
+      "epoch": 0.34,
+      "learning_rate": 4.984428128696318e-05,
+      "loss": 0.0703,
+      "step": 1000
+    },
+    {
+      "epoch": 0.52,
+      "learning_rate": 4.9376579221363204e-05,
+      "loss": 0.0744,
+      "step": 1500
+    },
+    {
+      "epoch": 0.69,
+      "learning_rate": 4.8602764529345966e-05,
+      "loss": 0.0807,
+      "step": 2000
+    },
+    {
+      "epoch": 0.86,
+      "learning_rate": 4.7534982401683416e-05,
+      "loss": 0.082,
+      "step": 2500
+    },
+    {
+      "epoch": 1.03,
+      "learning_rate": 4.618236648123212e-05,
+      "loss": 0.072,
+      "step": 3000
+    },
+    {
+      "epoch": 1.21,
+      "learning_rate": 4.4563749749985335e-05,
+      "loss": 0.0638,
+      "step": 3500
+    },
+    {
+      "epoch": 1.38,
+      "learning_rate": 4.269945823540843e-05,
+      "loss": 0.0627,
+      "step": 4000
+    },
+    {
+      "epoch": 1.55,
+      "learning_rate": 4.061290306367919e-05,
+      "loss": 0.0638,
+      "step": 4500
+    },
+    {
+      "epoch": 1.72,
+      "learning_rate": 3.8330286470885907e-05,
+      "loss": 0.0652,
+      "step": 5000
+    },
+    {
+      "epoch": 1.89,
+      "learning_rate": 3.58802727644352e-05,
+      "loss": 0.0622,
+      "step": 5500
+    },
+    {
+      "epoch": 2.07,
+      "learning_rate": 3.3298916668553426e-05,
+      "loss": 0.0555,
+      "step": 6000
+    },
+    {
+      "epoch": 2.24,
+      "learning_rate": 3.0608298703277996e-05,
+      "loss": 0.0467,
+      "step": 6500
+    },
+    {
+      "epoch": 2.41,
+      "learning_rate": 2.7847253668223704e-05,
+      "loss": 0.0428,
+      "step": 7000
+    },
+    {
+      "epoch": 2.58,
+      "learning_rate": 2.5050453809223793e-05,
+      "loss": 0.0473,
+      "step": 7500
+    },
+    {
+      "epoch": 2.76,
+      "learning_rate": 2.2253020368788445e-05,
+      "loss": 0.0452,
+      "step": 8000
+    },
+    {
+      "epoch": 2.93,
+      "learning_rate": 1.9495550817504742e-05,
+      "loss": 0.0412,
+      "step": 8500
+    },
+    {
+      "epoch": 3.1,
+      "learning_rate": 1.6801632122617095e-05,
+      "loss": 0.0385,
+      "step": 9000
+    },
+    {
+      "epoch": 3.27,
+      "learning_rate": 1.4210665687785734e-05,
+      "loss": 0.0311,
+      "step": 9500
+    },
+    {
+      "epoch": 3.45,
+      "learning_rate": 1.1755187970777065e-05,
+      "loss": 0.0317,
+      "step": 10000
+    },
+    {
+      "epoch": 3.62,
+      "learning_rate": 9.470426834280832e-06,
+      "loss": 0.0309,
+      "step": 10500
+    },
+    {
+      "epoch": 3.79,
+      "learning_rate": 7.3759257710121985e-06,
+      "loss": 0.0296,
+      "step": 11000
+    },
+    {
+      "epoch": 3.96,
+      "learning_rate": 5.5027417186915175e-06,
+      "loss": 0.0261,
+      "step": 11500
+    },
+    {
+      "epoch": 4.13,
+      "learning_rate": 3.877395681105919e-06,
+      "loss": 0.0268,
+      "step": 12000
+    },
+    {
+      "epoch": 4.31,
+      "learning_rate": 2.513790616397402e-06,
+      "loss": 0.0261,
+      "step": 12500
+    },
+    {
+      "epoch": 4.48,
+      "learning_rate": 1.4325595693915228e-06,
+      "loss": 0.022,
+      "step": 13000
+    },
+    {
+      "epoch": 4.65,
+      "learning_rate": 6.472802645326154e-07,
+      "loss": 0.0205,
+      "step": 13500
+    },
+    {
+      "epoch": 4.82,
+      "learning_rate": 1.6846304762653532e-07,
+      "loss": 0.025,
+      "step": 14000
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 2.0364694921504168e-10,
+      "loss": 0.0274,
+      "step": 14500
+    }
+  ],
+  "logging_steps": 500,
+  "max_steps": 14510,
+  "num_train_epochs": 5,
+  "save_steps": 500,
+  "total_flos": 1.2300127834804224e+17,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-14510/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10862f3595d985d0462a37a2e0cdeb04d538eed4d7e5517914f8cae7f49e06c1
+size 4664

classification_report.json ADDED Viewed

	@@ -0,0 +1 @@

+ {"0": {"precision": 0.996199829205807, "recall": 0.9945012787723785, "f1-score": 0.9953498293515357, "support": 23460}, "1": {"precision": 0.9943944726893496, "recall": 0.9961258869107212, "f1-score": 0.9952594267820642, "support": 22973}, "accuracy": 0.9953050632093554, "macro avg": {"precision": 0.9952971509475783, "recall": 0.9953135828415498, "f1-score": 0.9953046280668, "support": 46433}, "weighted avg": {"precision": 0.9953066184450855, "recall": 0.9953050632093554, "f1-score": 0.9953051021482866, "support": 46433}}

config.json ADDED Viewed

	@@ -0,0 +1,28 @@

+{
+  "_name_or_path": "distilroberta-base",
+  "architectures": [
+    "RobertaForSequenceClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 6,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "problem_type": "single_label_classification",
+  "torch_dtype": "float32",
+  "transformers_version": "4.35.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 50265
+}

confusion_matrix.png ADDED Viewed

detailed_confusion_matrix.png ADDED Viewed

fold_results.json ADDED Viewed

	@@ -0,0 +1,67 @@

+{
+    "0": {
+        "eval_loss": 0.44263672828674316,
+        "eval_precision": 0.8340094802920955,
+        "eval_recall": 0.8501284116136334,
+        "eval_acc": 0.8421415342206142,
+        "eval_mcc": 0.6844367950446504,
+        "eval_f1": 0.8419918085794352,
+        "eval_auc": 0.9213721670099608,
+        "eval_runtime": 92.4426,
+        "eval_samples_per_second": 502.301,
+        "eval_steps_per_second": 7.854,
+        "epoch": 5.0
+    },
+    "1": {
+        "eval_loss": 0.2547060549259186,
+        "eval_precision": 0.9154959924157545,
+        "eval_recall": 0.9247812649632177,
+        "eval_acc": 0.9205539044665547,
+        "eval_mcc": 0.8411493779565805,
+        "eval_f1": 0.9201152038805518,
+        "eval_auc": 0.9740600180062491,
+        "eval_runtime": 95.9903,
+        "eval_samples_per_second": 483.737,
+        "eval_steps_per_second": 7.563,
+        "epoch": 5.0
+    },
+    "2": {
+        "eval_loss": 0.09699167311191559,
+        "eval_precision": 0.9701421183015342,
+        "eval_recall": 0.9716623862795456,
+        "eval_acc": 0.9711849076108025,
+        "eval_mcc": 0.9423655216605232,
+        "eval_f1": 0.9709016571701969,
+        "eval_auc": 0.9955248279117542,
+        "eval_runtime": 100.5243,
+        "eval_samples_per_second": 461.918,
+        "eval_steps_per_second": 7.222,
+        "epoch": 5.0
+    },
+    "3": {
+        "eval_loss": 0.06927449256181717,
+        "eval_precision": 0.9810338092964715,
+        "eval_recall": 0.9839804979975623,
+        "eval_acc": 0.9826631921262895,
+        "eval_mcc": 0.9653278877230188,
+        "eval_f1": 0.9825049442548845,
+        "eval_auc": 0.9984043728811378,
+        "eval_runtime": 104.6971,
+        "eval_samples_per_second": 443.498,
+        "eval_steps_per_second": 6.934,
+        "epoch": 5.0
+    },
+    "4": {
+        "eval_loss": 0.0173803698271513,
+        "eval_precision": 0.9943944726893496,
+        "eval_recall": 0.9961258869107212,
+        "eval_acc": 0.9953050632093554,
+        "eval_mcc": 0.990610733652845,
+        "eval_f1": 0.9952594267820642,
+        "eval_auc": 0.9997952580012661,
+        "eval_runtime": 109.8075,
+        "eval_samples_per_second": 422.858,
+        "eval_steps_per_second": 6.612,
+        "epoch": 5.0
+    }
+}

metrics.json ADDED Viewed

	@@ -0,0 +1 @@


1	+ {"precision": 0.9943944726893496, "recall": 0.9961258869107212, "acc": 0.9953050632093554, "mcc": 0.990610733652845, "f1": 0.9952594267820642, "auc": 0.9997952580012661}

metrics_all_fold.json ADDED Viewed

	@@ -0,0 +1,44 @@

+{
+    "precision": [
+        0.8340094802920955,
+        0.9154959924157545,
+        0.9701421183015342,
+        0.9810338092964715,
+        0.9943944726893496
+    ],
+    "recall": [
+        0.8501284116136334,
+        0.9247812649632177,
+        0.9716623862795456,
+        0.9839804979975623,
+        0.9961258869107212
+    ],
+    "f1": [
+        0.8419918085794352,
+        0.9201152038805518,
+        0.9709016571701969,
+        0.9825049442548845,
+        0.9952594267820642
+    ],
+    "auc": [
+        0.9213721670099608,
+        0.9740600180062491,
+        0.9955248279117542,
+        0.9984043728811378,
+        0.9997952580012661
+    ],
+    "acc": [
+        0.8421415342206142,
+        0.9205539044665547,
+        0.9711849076108025,
+        0.9826631921262895,
+        0.9953050632093554
+    ],
+    "mcc": [
+        0.6844367950446504,
+        0.8411493779565805,
+        0.9423655216605232,
+        0.9653278877230188,
+        0.990610733652845
+    ]
+}

metrics_ci_bounds.json ADDED Viewed

	@@ -0,0 +1,26 @@

+{
+    "precision": {
+        "ci_lower": 0.8571673182942502,
+        "ci_upper": 1.020863030903832
+    },
+    "recall": {
+        "ci_lower": 0.8712169014684487,
+        "ci_upper": 1.0194544776374235
+    },
+    "f1": {
+        "ci_lower": 0.8641345592365749,
+        "ci_upper": 1.0201746570302783
+    },
+    "auc": {
+        "ci_lower": 0.9365537784102713,
+        "ci_upper": 1.019108879113876
+    },
+    "acc": {
+        "ci_lower": 0.8643875654334379,
+        "ci_upper": 1.0203518752200087
+    },
+    "mcc": {
+        "ci_lower": 0.7288945414765948,
+        "ci_upper": 1.0406615849384526
+    }
+}

metrics_mean.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "precision": 0.939015174599041,
+    "recall": 0.945335689552936,
+    "f1": 0.9421546081334267,
+    "auc": 0.9778313287620737,
+    "acc": 0.9423697203267233,
+    "mcc": 0.8847780632075237
+}

metrics_std.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "precision": 0.06591787828526462,
+    "recall": 0.059693111978530534,
+    "f1": 0.06283507374758243,
+    "auc": 0.03324373615689578,
+    "acc": 0.06280455502140439,
+    "mcc": 0.12554404569709307
+}

metrics_visualisation.png ADDED Viewed

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:c39f80c5310c061d91cd3bf5425806c17e87832f5fdcb0357d553a769a0af833
+size 328492280

precision_recall_curve.png ADDED Viewed

reduced_main_data.csv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:910d85e8850d8980f972b95109c844c4cad9aa3389bf641936457592791ab109
+size 900611880

roc_curve.png ADDED Viewed

test_data_for_future_evaluation.csv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e2b61151db2e0bf2bea413a86cd8dd0921ac782646df8a06e6a75ed35dce3431
+size 162242936

test_top_repo_data.csv ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:1d489c29450e32a500a6c603e4dbfb2ef194230a1d208ce860f77862ba085daa
+size 21783779

top_repo_data.csv ADDED Viewed

The diff for this file is too large to render. See raw diff

tracker_carbon_statistics.json ADDED Viewed

	@@ -0,0 +1,33 @@

+{
+    "cloud_provider": "",
+    "cloud_region": "",
+    "codecarbon_version": "2.3.4",
+    "country_iso_code": "NOR",
+    "country_name": "Norway",
+    "cpu_count": 192,
+    "cpu_energy": 0.43311747236564513,
+    "cpu_model": "AMD EPYC 7642 48-Core Processor",
+    "cpu_power": 14.631385841914685,
+    "duration": 26556.46255660057,
+    "emissions": 0.32166077015165945,
+    "emissions_rate": 1.211233497180185e-05,
+    "energy_consumed": 11.675527047247167,
+    "gpu_count": 4,
+    "gpu_energy": 8.45875250866326,
+    "gpu_model": "4 x NVIDIA GeForce RTX 3090",
+    "gpu_power": 1189.2267111570472,
+    "latitude": 59.9016,
+    "longitude": 10.7343,
+    "on_cloud": "N",
+    "os": "Linux-4.18.0-513.18.1.el8_9.x86_64-x86_64-with-glibc2.28",
+    "project_name": "codecarbon",
+    "pue": 1.0,
+    "python_version": "3.10.8",
+    "ram_energy": 2.78365706621826,
+    "ram_power": 377.6938090324402,
+    "ram_total_size": 1007.1834907531738,
+    "region": "oslo county",
+    "run_id": "0715d65b-1d27-40f8-a35f-9f61b5fb3879",
+    "timestamp": "2024-04-02T21:44:28",
+    "tracking_mode": "machine"
+}

training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:10862f3595d985d0462a37a2e0cdeb04d538eed4d7e5517914f8cae7f49e06c1
+size 4664