Spaces:

Deepakraj2006
/

RAG

Runtime error

App Files Files Community

RAG / worker.py

Deepakraj2006

Rename worker_huggingFace.py to worker.py

2709373 verified 2 months ago

raw

history blame

2.2 kB

	import os
	import torch
	from langchain import PromptTemplate
	from langchain.chains import RetrievalQA
	from langchain.embeddings import HuggingFaceInstructEmbeddings
	from langchain.document_loaders import PyPDFLoader
	from langchain.text_splitter import RecursiveCharacterTextSplitter
	from langchain.vectorstores import Chroma
	from langchain.llms import HuggingFaceHub

	# Check for GPU availability
	DEVICE = "cuda:0" if torch.cuda.is_available() else "cpu"

	# Global variables
	conversation_retrieval_chain = None
	chat_history = []
	llm_hub = None
	embeddings = None

	def init_llm():
	global llm_hub, embeddings

	# Ensure API key is set in Hugging Face Spaces
	hf_token = os.getenv("HUGGINGFACEHUB_API_TOKEN")
	if not hf_token:
	raise ValueError("HUGGINGFACEHUB_API_TOKEN is not set in environment variables.")

	model_id = "tiiuae/falcon-7b-instruct"
	llm_hub = HuggingFaceHub(repo_id=model_id, model_kwargs={"temperature": 0.1, "max_new_tokens": 600, "max_length": 600})

	embeddings = HuggingFaceInstructEmbeddings(
	model_name="sentence-transformers/all-MiniLM-L6-v2", model_kwargs={"device": DEVICE}
	)

	def process_document(document_path):
	global conversation_retrieval_chain

	loader = PyPDFLoader(document_path)
	documents = loader.load()

	text_splitter = RecursiveCharacterTextSplitter(chunk_size=1024, chunk_overlap=64)
	texts = text_splitter.split_documents(documents)

	db = Chroma.from_documents(texts, embedding=embeddings)

	conversation_retrieval_chain = RetrievalQA.from_chain_type(
	llm=llm_hub,
	chain_type="stuff",
	retriever=db.as_retriever(search_type="mmr", search_kwargs={'k': 6, 'lambda_mult': 0.25}),
	return_source_documents=False,
	input_key="question"
	)

	def process_prompt(prompt):
	global conversation_retrieval_chain, chat_history

	if not conversation_retrieval_chain:
	return "No document has been processed yet. Please upload a PDF first."

	output = conversation_retrieval_chain({"question": prompt, "chat_history": chat_history})
	answer = output["result"]

	chat_history.append((prompt, answer))

	return answer

	init_llm()