Spaces:

VishnuRamDebyez
/

RAG_FASTAPI

Sleeping

App Files Files Community

VishnuRamDebyez commited on Mar 10

Commit

0b10d8a

verified ·

1 Parent(s): 6400d6d

Update app.py

Browse files

Files changed (1) hide show

app.py +69 -74

app.py CHANGED Viewed

@@ -14,16 +14,14 @@ from qdrant_client import QdrantClient
 from qdrant_client.http.models import Distance, VectorParams
 from qdrant_client.models import PointIdsList
-from langgraph.graph import MessagesState, StateGraph
-from langchain_core.messages import SystemMessage, HumanMessage
-from langgraph.prebuilt import ToolNode
-from langgraph.graph import END
-from langgraph.prebuilt import tools_condition
 from langgraph.checkpoint.memory import MemorySaver
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
 load_dotenv()
 GOOGLE_API_KEY = os.getenv('GOOGLE_API_KEY')
 GROQ_API_KEY = os.getenv('GROQ_API_KEY')
@@ -37,7 +35,7 @@ class QASystem:
     def __init__(self):
         self.vector_store = None
         self.graph = None
-        self.memory = None
         self.embeddings = None
         self.client = None
         self.pdf_dir = "pdfss"
@@ -45,10 +43,10 @@ class QASystem:
     def load_pdf_documents(self):
         documents = []
         pdf_dir = Path(self.pdf_dir)
         if not pdf_dir.exists():
             raise FileNotFoundError(f"PDF directory not found: {self.pdf_dir}")
         for pdf_path in pdf_dir.glob("*.pdf"):
             try:
                 loader = PyPDFLoader(str(pdf_path))
@@ -57,18 +55,16 @@ class QASystem:
             except Exception as e:
                 logger.error(f"Error loading PDF {pdf_path}: {str(e)}")
-        text_splitter = RecursiveCharacterTextSplitter(
-            chunk_size=1000,
-            chunk_overlap=100
-        )
         split_docs = text_splitter.split_documents(documents)
         logger.info(f"Split documents into {len(split_docs)} chunks")
         return split_docs
     def initialize_system(self):
         try:
             self.client = QdrantClient(":memory:")
             try:
                 self.client.get_collection("pdf_data")
             except Exception:
@@ -77,92 +73,88 @@ class QASystem:
                     vectors_config=VectorParams(size=768, distance=Distance.COSINE),
                 )
                 logger.info("Created new collection: pdf_data")
             self.embeddings = GoogleGenerativeAIEmbeddings(
-                model="models/embedding-001",
-                google_api_key=GOOGLE_API_KEY
             )
             self.vector_store = QdrantVectorStore(
                 client=self.client,
                 collection_name="pdf_data",
                 embeddings=self.embeddings,
             )
             documents = self.load_pdf_documents()
             if documents:
-                try:
-                    points = self.client.scroll(collection_name="pdf_data", limit=100)[0]
-                    if points:
-                        self.client.delete(
-                            collection_name="pdf_data",
-                            points_selector=PointIdsList(
-                                points=[p.id for p in points]
-                            )
-                        )
-                except Exception as e:
-                    logger.error(f"Error clearing vectors: {str(e)}")
                 self.vector_store.add_documents(documents)
                 logger.info(f"Added {len(documents)} documents to vector store")
             llm = ChatGroq(
-                model="llama3-8b-8192",
                 api_key=GROQ_API_KEY,
                 temperature=0.7
             )
-            graph_builder = StateGraph(MessagesState)
-            def query_or_respond(state: MessagesState):
-                retrieved_docs = [m for m in state["messages"] if m.type == "tool"]
-                if retrieved_docs:
-                    context = ' '.join(m.content for m in retrieved_docs)
-                else:
-                    context = "mountain bicycle documentation knowledge"
-                system_prompt = (
-                    "You are an AI assistant embedded within the Interactive Electronic Technical Manual (IETM) for Mountain Cycles.. "
-                    "Always provide accurate responses with references to provided data. "
-                    "If the user query is not technical-specific, still respond from a IETM perspective."
-                    f"\n\nContext:\n{context}"
-                )
-                messages = [SystemMessage(content=system_prompt)] + state["messages"]
-                logger.info(f"Sending to LLM: {[m.content for m in messages]}")  # Debugging log
-                response = llm.invoke(messages)
-                return {"messages": [response]}
-            def generate(state: MessagesState):
-                retrieved_docs = [m for m in reversed(state["messages"]) if m.type == "tool"][::-1]
                 context = ' '.join(m.content for m in retrieved_docs) if retrieved_docs else "mountain bicycle documentation knowledge"
                 system_prompt = (
                     "You are an AI assistant embedded within the Interactive Electronic Technical Manual (IETM) for Mountain Cycles. "
-                    "Your responses MUST be accurate, concise (5 sentences max)."
-                    f"\n\nContext:\n{context}"
                 )
-                messages = [SystemMessage(content=system_prompt)] + state["messages"]
-                logger.info(f"Sending to LLM: {[m.content for m in messages]}")  # Debugging log
-                response = llm.invoke(messages)
                 return {"messages": [response]}
-            graph_builder.add_node("query_or_respond", query_or_respond)
-            graph_builder.add_node("generate", generate)
-            graph_builder.set_entry_point("query_or_respond")
-            graph_builder.add_edge("query_or_respond", "generate")
             graph_builder.add_edge("generate", END)
-            self.memory = MemorySaver()
             self.graph = graph_builder.compile(checkpointer=self.memory)
             return True
@@ -170,13 +162,14 @@ class QASystem:
             logger.error(f"System initialization error: {str(e)}")
             return False
-    def process_query(self, query: str) -> List[Dict[str, str]]:
         try:
             responses = []
             for step in self.graph.stream(
                 {"messages": [HumanMessage(content=query)]},
                 stream_mode="values",
-                config={"configurable": {"thread_id": "abc123"}}
             ):
                 if step["messages"]:
                     responses.append({
@@ -188,13 +181,15 @@ class QASystem:
             logger.error(f"Query processing error: {str(e)}")
             return [{'content': f"Query processing error: {str(e)}", 'type': 'error'}]
 qa_system = QASystem()
 if qa_system.initialize_system():
     logger.info("QA System Initialized Successfully")
 else:
     raise RuntimeError("Failed to initialize QA System")
 @app.post("/query")
-async def query_api(query: str):
-    responses = qa_system.process_query(query)
     return {"responses": responses}

 from qdrant_client.http.models import Distance, VectorParams
 from qdrant_client.models import PointIdsList
+from langgraph.graph import MessagesState, StateGraph, END
 from langgraph.checkpoint.memory import MemorySaver
+from langchain_core.messages import SystemMessage, HumanMessage
 logging.basicConfig(level=logging.INFO)
 logger = logging.getLogger(__name__)
+# Load environment variables
 load_dotenv()
 GOOGLE_API_KEY = os.getenv('GOOGLE_API_KEY')
 GROQ_API_KEY = os.getenv('GROQ_API_KEY')
     def __init__(self):
         self.vector_store = None
         self.graph = None
+        self.memory = MemorySaver()  # LangGraph memory saver for conversation history
         self.embeddings = None
         self.client = None
         self.pdf_dir = "pdfss"
     def load_pdf_documents(self):
         documents = []
         pdf_dir = Path(self.pdf_dir)
         if not pdf_dir.exists():
             raise FileNotFoundError(f"PDF directory not found: {self.pdf_dir}")
         for pdf_path in pdf_dir.glob("*.pdf"):
             try:
                 loader = PyPDFLoader(str(pdf_path))
             except Exception as e:
                 logger.error(f"Error loading PDF {pdf_path}: {str(e)}")
+        text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
         split_docs = text_splitter.split_documents(documents)
         logger.info(f"Split documents into {len(split_docs)} chunks")
         return split_docs
     def initialize_system(self):
         try:
+            # Qdrant setup
             self.client = QdrantClient(":memory:")
             try:
                 self.client.get_collection("pdf_data")
             except Exception:
                     vectors_config=VectorParams(size=768, distance=Distance.COSINE),
                 )
                 logger.info("Created new collection: pdf_data")
+            # Embeddings and vector store
             self.embeddings = GoogleGenerativeAIEmbeddings(
+                model="models/embedding-001", google_api_key=GOOGLE_API_KEY
             )
             self.vector_store = QdrantVectorStore(
                 client=self.client,
                 collection_name="pdf_data",
                 embeddings=self.embeddings,
             )
+            # Load and add documents
             documents = self.load_pdf_documents()
             if documents:
+                points = self.client.scroll(collection_name="pdf_data", limit=100)[0]
+                if points:
+                    self.client.delete(
+                        collection_name="pdf_data",
+                        points_selector=PointIdsList(points=[p.id for p in points])
+                    )
                 self.vector_store.add_documents(documents)
                 logger.info(f"Added {len(documents)} documents to vector store")
+            # LLM setup
             llm = ChatGroq(
+                model="llama3-8b-8192",
                 api_key=GROQ_API_KEY,
                 temperature=0.7
             )
+            # Graph building
+            graph_builder = StateGraph(MessagesState)
+            # === TOOL NODE for context fetching from Qdrant ===
+            def retrieve_documents(state: MessagesState):
+                query = [m.content for m in state["messages"] if m.type == "human"][-1]
+                results = self.vector_store.similarity_search(query, k=4)
+                context = "\n\n".join([doc.page_content for doc in results])
+                return {"messages": [SystemMessage(content=context, name="retrieval")]}  # as tool message
+            # === GENERATOR NODE that uses full memory (chat history) ===
+            def generate_response(state: MessagesState):
+                # Get full history from memory
+                thread_id = state["configurable"].get("thread_id", "default")
+                history = self.memory.get_memory(thread_id).get("messages", [])
+                logger.info(f"[Thread {thread_id}] History: {[m.content for m in history]}")
+                # Add current turn messages
+                all_messages = history + state["messages"]
+                # Extract context from retrieved docs (tool messages)
+                retrieved_docs = [m for m in all_messages if m.type == "tool"]
                 context = ' '.join(m.content for m in retrieved_docs) if retrieved_docs else "mountain bicycle documentation knowledge"
+                # Compose system prompt
                 system_prompt = (
                     "You are an AI assistant embedded within the Interactive Electronic Technical Manual (IETM) for Mountain Cycles. "
+                    "Your responses MUST be accurate, concise (5 sentences max). "
+                    "If you don't know the answer, say 'I don't know based on available data.'\n\n"
+                    f"Context:\n{context}"
                 )
+                final_messages = [SystemMessage(content=system_prompt)] + all_messages
+                response = llm.invoke(final_messages)
+                # Save updated chat to memory
+                self.memory.save_checkpoint(thread_id, {"messages": all_messages + [response]})
                 return {"messages": [response]}
+            # Add graph nodes
+            graph_builder.add_node("retrieval", retrieve_documents)
+            graph_builder.add_node("generate", generate_response)
+            # Graph edges
+            graph_builder.set_entry_point("retrieval")
+            graph_builder.add_edge("retrieval", "generate")
             graph_builder.add_edge("generate", END)
+            # Compile graph with memory
             self.graph = graph_builder.compile(checkpointer=self.memory)
             return True
             logger.error(f"System initialization error: {str(e)}")
             return False
+    # === Query Processor with Memory ===
+    def process_query(self, query: str, user_id: str) -> List[Dict[str, str]]:
         try:
             responses = []
             for step in self.graph.stream(
                 {"messages": [HumanMessage(content=query)]},
                 stream_mode="values",
+                config={"configurable": {"thread_id": user_id}}  # thread ID for user memory
             ):
                 if step["messages"]:
                     responses.append({
             logger.error(f"Query processing error: {str(e)}")
             return [{'content': f"Query processing error: {str(e)}", 'type': 'error'}]
+# === Initialize QA System ===
 qa_system = QASystem()
 if qa_system.initialize_system():
     logger.info("QA System Initialized Successfully")
 else:
     raise RuntimeError("Failed to initialize QA System")
+# === FastAPI Route ===
 @app.post("/query")
+async def query_api(query: str, user_id: str):  # Pass user_id for session-specific memory
+    responses = qa_system.process_query(query, user_id)
     return {"responses": responses}