Spaces:

sunbal7
/

AISmartBookAnalysisSystem

Running

sunbal7 commited on Feb 23

Commit

7bea7bd

verified ·

1 Parent(s): c3cc01e

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -14,12 +14,30 @@ def load_models():
     # Text embedding model
     embed_model = SentenceTransformer('sentence-transformers/all-mpnet-base-v2')
-    # IBM Granite models
-    summary_tokenizer = AutoTokenizer.from_pretrained("ibm/granite-13b-instruct-v2")
-    summary_model = AutoModelForCausalLM.from_pretrained("ibm/granite-13b-instruct-v2")
-    qa_tokenizer = AutoTokenizer.from_pretrained("ibm/granite-13b-instruct-v2")
-    qa_model = AutoModelForCausalLM.from_pretrained("ibm/granite-13b-instruct-v2")
     return embed_model, summary_model, summary_tokenizer, qa_model, qa_tokenizer
@@ -30,16 +48,13 @@ def process_file(uploaded_file):
     if file_type == 'pdf':
         pdf_reader = PdfReader(uploaded_file)
         for page in pdf_reader.pages:
-            text += page.extract_text()
     elif file_type == 'txt':
         text = uploaded_file.read().decode('utf-8')
     elif file_type == 'docx':
         doc = Document(uploaded_file)
         for para in doc.paragraphs:
             text += para.text + "\n"
     return clean_text(text)
 def clean_text(text):
@@ -111,4 +126,4 @@ def main():
             st.info(f"Answer: {answer}")
 if __name__ == "__main__":
-    main()

     # Text embedding model
     embed_model = SentenceTransformer('sentence-transformers/all-mpnet-base-v2')
+    TOKEN = "TOKEN"
+    # IBM Granite models with proper token and trust_remote_code settings
+    summary_tokenizer = AutoTokenizer.from_pretrained(
+        "ibm/granite-13b-instruct-v2",
+        token=TOKEN,
+        trust_remote_code=True
+    )
+    summary_model = AutoModelForCausalLM.from_pretrained(
+        "ibm/granite-13b-instruct-v2",
+        token=TOKEN,
+        trust_remote_code=True
+    )
+    qa_tokenizer = AutoTokenizer.from_pretrained(
+        "ibm/granite-13b-instruct-v2",
+        token=TOKEN,
+        trust_remote_code=True
+    )
+    qa_model = AutoModelForCausalLM.from_pretrained(
+        "ibm/granite-13b-instruct-v2",
+        token=TOKEN,
+        trust_remote_code=True
+    )
     return embed_model, summary_model, summary_tokenizer, qa_model, qa_tokenizer
     if file_type == 'pdf':
         pdf_reader = PdfReader(uploaded_file)
         for page in pdf_reader.pages:
+            text += page.extract_text() or ""
     elif file_type == 'txt':
         text = uploaded_file.read().decode('utf-8')
     elif file_type == 'docx':
         doc = Document(uploaded_file)
         for para in doc.paragraphs:
             text += para.text + "\n"
     return clean_text(text)
 def clean_text(text):
             st.info(f"Answer: {answer}")
 if __name__ == "__main__":
+    main()