pdf-rag-chatbot

Running

farmax commited on Oct 12, 2024

Commit

5724f7c

verified ·

1 Parent(s): f15d519

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -60,24 +60,29 @@ def initialize_database(document, chunk_size, chunk_overlap, progress=gr.Progres
     logger.info("Database initialized successfully.")
     return vectorstore, None, "Initialized"  # Aggiunto None come secondo output
-def initialize_LLM(llm_option, llm_temperature, max_tokens, top_k, vector_db, progress=gr.Progress(), language="italian"):
     logger.info("Initializing LLM chain...")
     # Define the default LLMS based on the language
     if language == "italiano":
         default_llm = "google/gemma-7b-it"
     else:
         default_llm = "mistralai/Mistral-7B-Instruct-v0.2"
-    # Create an instance of the LLM
     try:
-        llm = LLM.from_pretrained(default_llm)
     except Exception as e:
         logger.error(f"Error initializing LLM: {e}")
         return None, "Failed to initialize LLM"
     qa_chain = ConversationalRetrievalChain.from_llm(
-        llm=llm,
         retriever=vector_db.as_retriever(),
         chain_type="stuff",
         temperature=llm_temperature,

     logger.info("Database initialized successfully.")
     return vectorstore, None, "Initialized"  # Aggiunto None come secondo output
+def initialize_LLM(llm_option, llm_temperature, max_tokens, top_k, vector_db, progress=gr.Progress(), language="italiano"):
     logger.info("Initializing LLM chain...")
     # Define the default LLMS based on the language
     if language == "italiano":
         default_llm = "google/gemma-7b-it"
     else:
         default_llm = "mistralai/Mistral-7B-Instruct-v0.2"
+    # Try to load the tokenizer and model
     try:
+        tokenizer = AutoTokenizer.from_pretrained(default_llm)
+        model = AutoModelForCausalLM.from_pretrained(default_llm)
     except Exception as e:
         logger.error(f"Error initializing LLM: {e}")
         return None, "Failed to initialize LLM"
+    # Resize token embeddings if needed
+    if len(tokenizer) > model.config.max_position_embeddings:
+        model.resize_token_embeddings(len(tokenizer))
     qa_chain = ConversationalRetrievalChain.from_llm(
+        llm=model,
         retriever=vector_db.as_retriever(),
         chain_type="stuff",
         temperature=llm_temperature,