Spaces:

kanneboinakumar
/

PDF-based-MCQ-Generator

Sleeping

kanneboinakumar commited on 28 days ago

Commit

c7d42ba

verified ·

1 Parent(s): 73a7277

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -12,7 +12,7 @@ st.title("📄 PDF-based MCQ Generator")
 st.sidebar.title("Upload & Settings")
 # Upload PDF
-pdf_file = st.sidebar.file_uploader("Upload a PDF file", type=["pdf"])
 # Number of questions
 number_of_questions = st.sidebar.slider("Number of questions", min_value=1, max_value=20, value=5)
@@ -60,14 +60,20 @@ prompt = PromptTemplate(
 mcq_chain = LLMChain(llm=llm, prompt=prompt)
-# PDF text extractor
-def extract_text_from_pdf(pdf):
-    doc = fitz.open(stream=pdf.read(), filetype="pdf")
-    full_text = ""
-    for page in doc:
-        full_text += page.get_text()
-    doc.close()
-    return full_text
 # Generate MCQs
 if st.sidebar.button("Generate MCQs"):

 st.sidebar.title("Upload & Settings")
 # Upload PDF
+pdf_file = st.sidebar.file_uploader("Upload a PDF file", type=["pdf","docx"])
 # Number of questions
 number_of_questions = st.sidebar.slider("Number of questions", min_value=1, max_value=20, value=5)
 mcq_chain = LLMChain(llm=llm, prompt=prompt)
+# PDF or word text extractor
+def extract_text(file):
+    if file.name.endswith(".pdf"):
+        doc = fitz.open(stream=file.read(), filetype="pdf")
+        full_text = ""
+        for page in doc:
+            full_text += page.get_text()
+        doc.close()
+        return full_text
+    elif file.name.endswith(".docx"):
+        doc = docx.Document(file)
+        return "\n".join([para.text for para in doc.paragraphs])
+    else:
+        return ""
 # Generate MCQs
 if st.sidebar.button("Generate MCQs"):