Spaces:

VishnuRamDebyez
/

RAG_FASTAPI

Sleeping

App Files Files Community

RAG_FASTAPI / app.py

VishnuRamDebyez

Update app.py

0b10d8a verified 2 months ago

raw

history blame

7.9 kB

	from fastapi import FastAPI, HTTPException
	import os
	from typing import List, Dict
	from dotenv import load_dotenv
	import logging
	from pathlib import Path

	from langchain_community.document_loaders import PyPDFLoader
	from langchain_text_splitters import RecursiveCharacterTextSplitter
	from langchain_community.vectorstores import Qdrant as QdrantVectorStore
	from langchain_google_genai import GoogleGenerativeAIEmbeddings
	from langchain_groq import ChatGroq
	from qdrant_client import QdrantClient
	from qdrant_client.http.models import Distance, VectorParams
	from qdrant_client.models import PointIdsList

	from langgraph.graph import MessagesState, StateGraph, END
	from langgraph.checkpoint.memory import MemorySaver
	from langchain_core.messages import SystemMessage, HumanMessage

	logging.basicConfig(level=logging.INFO)
	logger = logging.getLogger(__name__)

	# Load environment variables
	load_dotenv()
	GOOGLE_API_KEY = os.getenv('GOOGLE_API_KEY')
	GROQ_API_KEY = os.getenv('GROQ_API_KEY')

	if not GOOGLE_API_KEY or not GROQ_API_KEY:
	raise ValueError("API keys not set in environment variables")

	app = FastAPI()

	class QASystem:
	def __init__(self):
	self.vector_store = None
	self.graph = None
	self.memory = MemorySaver() # LangGraph memory saver for conversation history
	self.embeddings = None
	self.client = None
	self.pdf_dir = "pdfss"

	def load_pdf_documents(self):
	documents = []
	pdf_dir = Path(self.pdf_dir)

	if not pdf_dir.exists():
	raise FileNotFoundError(f"PDF directory not found: {self.pdf_dir}")

	for pdf_path in pdf_dir.glob("*.pdf"):
	try:
	loader = PyPDFLoader(str(pdf_path))
	documents.extend(loader.load())
	logger.info(f"Loaded PDF: {pdf_path}")
	except Exception as e:
	logger.error(f"Error loading PDF {pdf_path}: {str(e)}")

	text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
	split_docs = text_splitter.split_documents(documents)
	logger.info(f"Split documents into {len(split_docs)} chunks")
	return split_docs

	def initialize_system(self):
	try:
	# Qdrant setup
	self.client = QdrantClient(":memory:")

	try:
	self.client.get_collection("pdf_data")
	except Exception:
	self.client.create_collection(
	collection_name="pdf_data",
	vectors_config=VectorParams(size=768, distance=Distance.COSINE),
	)
	logger.info("Created new collection: pdf_data")

	# Embeddings and vector store
	self.embeddings = GoogleGenerativeAIEmbeddings(
	model="models/embedding-001", google_api_key=GOOGLE_API_KEY
	)

	self.vector_store = QdrantVectorStore(
	client=self.client,
	collection_name="pdf_data",
	embeddings=self.embeddings,
	)

	# Load and add documents
	documents = self.load_pdf_documents()
	if documents:
	points = self.client.scroll(collection_name="pdf_data", limit=100)[0]
	if points:
	self.client.delete(
	collection_name="pdf_data",
	points_selector=PointIdsList(points=[p.id for p in points])
	)
	self.vector_store.add_documents(documents)
	logger.info(f"Added {len(documents)} documents to vector store")

	# LLM setup
	llm = ChatGroq(
	model="llama3-8b-8192",
	api_key=GROQ_API_KEY,
	temperature=0.7
	)

	# Graph building
	graph_builder = StateGraph(MessagesState)

	# === TOOL NODE for context fetching from Qdrant ===
	def retrieve_documents(state: MessagesState):
	query = [m.content for m in state["messages"] if m.type == "human"][-1]
	results = self.vector_store.similarity_search(query, k=4)
	context = "\n\n".join([doc.page_content for doc in results])
	return {"messages": [SystemMessage(content=context, name="retrieval")]} # as tool message

	# === GENERATOR NODE that uses full memory (chat history) ===
	def generate_response(state: MessagesState):
	# Get full history from memory
	thread_id = state["configurable"].get("thread_id", "default")
	history = self.memory.get_memory(thread_id).get("messages", [])

	logger.info(f"[Thread {thread_id}] History: {[m.content for m in history]}")

	# Add current turn messages
	all_messages = history + state["messages"]

	# Extract context from retrieved docs (tool messages)
	retrieved_docs = [m for m in all_messages if m.type == "tool"]
	context = ' '.join(m.content for m in retrieved_docs) if retrieved_docs else "mountain bicycle documentation knowledge"

	# Compose system prompt
	system_prompt = (
	"You are an AI assistant embedded within the Interactive Electronic Technical Manual (IETM) for Mountain Cycles. "
	"Your responses MUST be accurate, concise (5 sentences max). "
	"If you don't know the answer, say 'I don't know based on available data.'\n\n"
	f"Context:\n{context}"
	)

	final_messages = [SystemMessage(content=system_prompt)] + all_messages
	response = llm.invoke(final_messages)

	# Save updated chat to memory
	self.memory.save_checkpoint(thread_id, {"messages": all_messages + [response]})

	return {"messages": [response]}

	# Add graph nodes
	graph_builder.add_node("retrieval", retrieve_documents)
	graph_builder.add_node("generate", generate_response)

	# Graph edges
	graph_builder.set_entry_point("retrieval")
	graph_builder.add_edge("retrieval", "generate")
	graph_builder.add_edge("generate", END)

	# Compile graph with memory
	self.graph = graph_builder.compile(checkpointer=self.memory)
	return True

	except Exception as e:
	logger.error(f"System initialization error: {str(e)}")
	return False

	# === Query Processor with Memory ===
	def process_query(self, query: str, user_id: str) -> List[Dict[str, str]]:
	try:
	responses = []
	for step in self.graph.stream(
	{"messages": [HumanMessage(content=query)]},
	stream_mode="values",
	config={"configurable": {"thread_id": user_id}} # thread ID for user memory
	):
	if step["messages"]:
	responses.append({
	'content': step["messages"][-1].content,
	'type': step["messages"][-1].type
	})
	return responses
	except Exception as e:
	logger.error(f"Query processing error: {str(e)}")
	return [{'content': f"Query processing error: {str(e)}", 'type': 'error'}]

	# === Initialize QA System ===
	qa_system = QASystem()
	if qa_system.initialize_system():
	logger.info("QA System Initialized Successfully")
	else:
	raise RuntimeError("Failed to initialize QA System")

	# === FastAPI Route ===
	@app.post("/query")
	async def query_api(query: str, user_id: str): # Pass user_id for session-specific memory
	responses = qa_system.process_query(query, user_id)
	return {"responses": responses}