Spaces:

pujanpaudel
/

mcq-generation

Sleeping

App Files Files

pujanpaudel commited on Oct 3, 2024

Commit

5026e83

verified ·

1 Parent(s): e0f8c1f

main app uloaded

Browse files

Files changed (1) hide show

inference.py +213 -0

inference.py ADDED Viewed

	@@ -0,0 +1,213 @@

+from transformers import T5Tokenizer,T5ForConditionalGeneration
+import torch
+import lightning as L
+import numpy as np
+import random
+import gradio as gr
+MODEL_NAME:str = "google/flan-t5-small"
+def load_tokenizer(tokenizer_path:str):
+    tokenizer = T5Tokenizer.from_pretrained(tokenizer_path,local_files_only=True)
+    return tokenizer
+def qa_preprocess_data(context:str, tokenizer:T5Tokenizer):
+    input_prefix:str = "Generate relevant question and answer for this paragraph:\n "
+    inputs = input_prefix + context
+    model_inputs:torch.Tensor = tokenizer(inputs,return_tensors="pt")
+    return model_inputs
+def distractor_preprocess_data(context:str,question:str,
+                               answer:str,tokenizer:T5Tokenizer):
+    input_prefix:str = "Generate 3 plausible but incorrect answer options (distractors) for the given question and correct answer, based on the provided context:"
+    inputs = f"{input_prefix}\nCONTEXT:\n{context}\nQUESTION:  {question}\nANSWER:  {answer}"
+    model_inputs:torch.Tensor = tokenizer(inputs,return_tensors="pt")
+    return model_inputs
+class DistractorTrained(L.LightningModule):
+  def __init__(self):
+    super().__init__()
+    self.model = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)
+  def forward(self,input_ids,attention_mask):
+    return self.model.generate(input_ids=input_ids, attention_mask=attention_mask,
+                               num_beams=4,max_new_tokens=80,
+                               do_sample=True,temperature=1.2)
+class QATrained(L.LightningModule):
+    def __init__(self):
+        super().__init__()
+        self.model  = T5ForConditionalGeneration.from_pretrained(MODEL_NAME)
+    def forward(self,input_ids:torch.Tensor,attention_mask:torch.Tensor,
+                num_beams:int=4,max_new_tokens:int=65,
+                temperature:float=1.2):
+        return self.model.generate(
+            input_ids=input_ids,attention_mask=attention_mask,
+            num_beams=num_beams,max_new_tokens=65,
+            do_sample=True,temperature=temperature
+        )
+def load_qa_model(model_path:str):
+    model = QATrained.load_from_checkpoint(model_path)
+    return model
+def load_distractor_model(model_path:str):
+    model = DistractorTrained.load_from_checkpoint(model_path)
+    return model
+def predict_qa(model:QATrained,tokenizer:T5Tokenizer,model_inputs:torch.Tensor,
+            device:str="cpu"):
+    model.to(device)
+    model.eval()
+    with torch.inference_mode():
+        generated_ids = model(input_ids=model_inputs["input_ids"].to(device),
+                              attention_mask = model_inputs["attention_mask"].to(device))
+    generated_ids = generated_ids.cpu()
+    decoded_predictions = [tokenizer.decode(ids,skip_special_tokens=True) for ids in generated_ids]
+    return decoded_predictions
+def predict_distractor(model:DistractorTrained,tokenizer:T5Tokenizer,
+                       model_inputs:torch.Tensor,device:str="cpu"):
+    model.to(device)
+    model.eval()
+    with torch.inference_mode():
+        generated_ids = model(input_ids=model_inputs["input_ids"].to(device),
+                              attention_mask = model_inputs["attention_mask"].to(device))
+    generated_ids = generated_ids.cpu()
+    decoded_predictions = [tokenizer.decode(ids,skip_special_tokens=True) for ids in generated_ids]
+    return decoded_predictions
+def main(user_input):
+    device = "cuda" if torch.cuda.is_available() else "cpu"
+    tokenizer_path:str = "./t5_tokenizer"
+    qa_model_path:str = "./qa_trained_model/qa-t5-small.ckpt"
+    distractor_model_path:str = "./distractor_trained_model/distractor_t5-small.ckpt"
+    tokenizer = load_tokenizer(tokenizer_path)
+    qa_model = load_qa_model(qa_model_path)
+    distractor_model = load_distractor_model(distractor_model_path)
+    qa_model_inputs = qa_preprocess_data(user_input,tokenizer)
+    qa_decoded_predictions = predict_qa(qa_model,tokenizer,qa_model_inputs,device=device)
+    qa_decoded_predictions = qa_decoded_predictions[0]
+    indices = []
+    start = 0
+    while True:
+        index = qa_decoded_predictions.find("[ANSWER] ",start)
+        if index==-1:
+            break
+        indices.append(index)
+        start = index + 1
+    question = qa_decoded_predictions[11:indices[0]].rstrip()
+    if len(indices)==1:
+        answer = qa_decoded_predictions[indices[0]+9:].rstrip()
+    if len(indices)>1:
+        answer = qa_decoded_predictions[indices[0]+9:indices[1]-1].rstrip()
+    filtered_ans = answer.replace("?",".")
+    distractor_model_inputs = distractor_preprocess_data(user_input,question,filtered_ans,tokenizer)
+    distractor_decoded_predictions = predict_distractor(distractor_model,tokenizer,distractor_model_inputs,device=device)
+    distractor_decoded_predictions = distractor_decoded_predictions[0]
+    option_strings = ["[OPTION 1]","[OPTION 2]","[OPTION 3]"]
+    option_indices:list[int] = []
+    for option in option_strings:
+        ind:int = distractor_decoded_predictions.find(option)
+        option_indices.append(ind)
+    for option in option_strings:
+        option1:str = distractor_decoded_predictions[11:option_indices[1]].replace(option,"").strip()
+        option2:str = distractor_decoded_predictions[option_indices[1]+10:option_indices[-1]].replace(option,"").strip()
+        option3:str = distractor_decoded_predictions[option_indices[1]+10:].replace(option,"").strip()
+    option4:str = answer
+    return {"question": question,
+        "option1": option1,
+        "option2": option2,
+        "option3": option3,
+        "option4": option4}
+def shuffle_options(question_data):
+    options = [
+        question_data["option1"],
+        question_data["option2"],
+        question_data["option3"],
+        question_data["option4"]
+    ]
+    correct_answer = question_data["option4"]
+    random.shuffle(options)
+    return options, correct_answer
+def process_input(context):
+    question_data = main(context)
+    options, correct_answer = shuffle_options(question_data)
+    return question_data["question"], options, correct_answer
+def check_answer(choice, correct_answer):
+    if choice == correct_answer:
+        return f'<p style="color: #28a745;">Correct!</p>'
+    else:
+        return f'<p style="color: #dc3545;">Incorrect ! Try again.</p>'
+with gr.Blocks() as demo:
+    gr.Markdown("# MCQ Generator")
+    with gr.Row():
+        context_input = gr.Textbox(label="Context Paragraph", lines=5)
+        generate_button = gr.Button("Generate Question")
+    question_output = gr.Textbox(label="Question")
+    options_radio = gr.Radio(label="Options", choices=[])
+    submit_button = gr.Button("Submit Answer")
+    result_output = gr.HTML()
+    correct_answer = gr.State()
+    def update_interface(question, options, correct):
+        return {
+            question_output: question,
+            options_radio: gr.Radio(choices=options, label="Options"),
+            correct_answer: correct
+        }
+    generate_button.click(
+        process_input,
+        inputs=[context_input],
+        outputs=[question_output, options_radio, correct_answer]
+    ).then(
+        update_interface,
+        inputs=[question_output, options_radio, correct_answer],
+        outputs=[question_output, options_radio, correct_answer]
+    )
+    submit_button.click(
+        check_answer,
+        inputs=[options_radio, correct_answer],
+        outputs=[result_output]
+    )
+if __name__=="__main__":
+    demo.launch(debug=True)