Spaces:

Rajesh3338
/

Check

Runtime error

App Files Files Community

Rajesh3338 commited on Feb 7

Commit

8658913

verified ·

1 Parent(s): 8eada5b

Update app.py

Browse files

Files changed (1) hide show

app.py +25 -49

app.py CHANGED Viewed

@@ -1,6 +1,5 @@
-import os
-import torch
 import gradio as gr
 from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_community.document_loaders import TextLoader
 from langchain_community.vectorstores import FAISS
@@ -9,55 +8,40 @@ from langchain.chains import RetrievalQA
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 from langchain_huggingface import HuggingFacePipeline
-# Detect device (GPU or CPU)
 device = "cuda" if torch.cuda.is_available() else "cpu"
-torch_dtype = torch.float16 if device == "cuda" else torch.float32
-# ✅ Step 1: Check if dataset exists
-DATASET_FILE = "dataset.txt"
-if not os.path.exists(DATASET_FILE):
-    raise FileNotFoundError(f"❌ Error: '{DATASET_FILE}' not found. Please create and add some text.")
-# ✅ Step 2: Load and split dataset
-print("📄 Loading dataset...")
-doc_loader = TextLoader(DATASET_FILE)
 docs = doc_loader.load()
-print("🔀 Splitting documents...")
 text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
 split_docs = text_splitter.split_documents(docs)
-# ✅ Step 3: Initialize FAISS Vector Store
-print("🧠 Creating embeddings...")
-embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
-print("📌 Creating FAISS Vector DB...")
 vectordb = FAISS.from_documents(split_docs, embeddings)
-retriever = vectordb.as_retriever(search_kwargs={"k": 5})
-# ✅ Step 4: Load Hugging Face Model
-MODEL_NAME = "01-ai/Yi-Coder-9B-Chat"  # More memory-efficient than Yi-Coder-9B
-print(f"🚀 Loading Model: {MODEL_NAME} on {device}...")
-tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME)
 model = AutoModelForCausalLM.from_pretrained(
-    MODEL_NAME,
-    device_map="auto",
-    torch_dtype=torch_dtype,
 )
-# ✅ Step 5: Create QA Pipeline
-print("🔧 Setting up pipeline...")
 qa_pipeline = pipeline(
     "text-generation",
     model=model,
     tokenizer=tokenizer,
     max_new_tokens=750,
-    pad_token_id=tokenizer.eos_token_id,
 )
 llm = HuggingFacePipeline(pipeline=qa_pipeline)
 qa_chain = RetrievalQA.from_chain_type(
     retriever=retriever,
     chain_type="stuff",
@@ -65,45 +49,37 @@ qa_chain = RetrievalQA.from_chain_type(
     return_source_documents=False
 )
-# ✅ Step 6: Define Helper Functions
 def preprocess_query(query):
-    """Prepares query text based on type of request"""
-    if "script" in query.lower() or "code" in query.lower():
         return f"Write a CPSL script: {query}"
     return query
 def clean_response(response):
-    """Cleans and extracts the response from model output"""
     result = response.get("result", "")
     if "Answer:" in result:
         return result.split("Answer:")[1].strip()
     return result.strip()
 def chatbot_response(user_input):
-    """Processes user input and returns AI response"""
     processed_query = preprocess_query(user_input)
     raw_response = qa_chain.invoke({"query": processed_query})
     return clean_response(raw_response)
-# ✅ Step 7: Build Gradio UI
 with gr.Blocks() as chat_interface:
-    gr.Markdown("# 🤖 CPSL Chatbot")
-    chat_history = gr.Chatbot(label="Chat History", height=300)
     user_input = gr.Textbox(label="Your Message:")
     send_button = gr.Button("Send")
-    clear_button = gr.Button("Clear")
     def interact(user_message, history):
-        """Handles user interaction and updates chat history"""
         bot_reply = chatbot_response(user_message)
-        history.append(("🧑‍💻 You:", user_message))
-        history.append(("🤖 Bot:", bot_reply))
-        return history, ""
-    send_button.click(interact, inputs=[user_input, chat_history], outputs=[chat_history, user_input])
-    clear_button.click(lambda: [], outputs=[chat_history])
-# ✅ Step 8: Run Gradio App
 if __name__ == "__main__":
-    print("🚀 Launching CPSL Chatbot...")
-    chat_interface.launch(share=True)  # share=True allows public link

 import gradio as gr
+import torch
 from langchain_huggingface import HuggingFaceEmbeddings
 from langchain_community.document_loaders import TextLoader
 from langchain_community.vectorstores import FAISS
 from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
 from langchain_huggingface import HuggingFacePipeline
 device = "cuda" if torch.cuda.is_available() else "cpu"
+# Load and process the document
+doc_loader = TextLoader("dataset.txt")
 docs = doc_loader.load()
 text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=100)
 split_docs = text_splitter.split_documents(docs)
+# Create embeddings and vector store
+embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2")
 vectordb = FAISS.from_documents(split_docs, embeddings)
+# Load model and tokenizer
+model_name = "01-ai/Yi-Coder-9B-Chat"
+tokenizer = AutoTokenizer.from_pretrained(model_name)
 model = AutoModelForCausalLM.from_pretrained(
+    model_name,
+    device_map="auto",
+    torch_dtype=torch.float16 if device == "cuda" else torch.float32
 )
+# Set up the QA pipeline
 qa_pipeline = pipeline(
     "text-generation",
     model=model,
     tokenizer=tokenizer,
     max_new_tokens=750,
+    pad_token_id=tokenizer.eos_token_id
 )
 llm = HuggingFacePipeline(pipeline=qa_pipeline)
+# Set up the retriever and QA chain
+retriever = vectordb.as_retriever(search_kwargs={"k": 5})
 qa_chain = RetrievalQA.from_chain_type(
     retriever=retriever,
     chain_type="stuff",
     return_source_documents=False
 )
 def preprocess_query(query):
+    if "script" in query or "code" in query.lower():
         return f"Write a CPSL script: {query}"
     return query
 def clean_response(response):
     result = response.get("result", "")
     if "Answer:" in result:
         return result.split("Answer:")[1].strip()
     return result.strip()
 def chatbot_response(user_input):
     processed_query = preprocess_query(user_input)
     raw_response = qa_chain.invoke({"query": processed_query})
     return clean_response(raw_response)
+# Gradio interface
 with gr.Blocks() as chat_interface:
+    gr.Markdown("# CPSL Chatbot")
+    chat_history = gr.Chatbot(type='messages')
     user_input = gr.Textbox(label="Your Message:")
     send_button = gr.Button("Send")
     def interact(user_message, history):
         bot_reply = chatbot_response(user_message)
+        history.append({"role": "user", "content": user_message})
+        history.append({"role": "assistant", "content": bot_reply})
+        return history, history
+    send_button.click(interact, inputs=[user_input, chat_history], outputs=[chat_history, chat_history])
+# Launch the interface
 if __name__ == "__main__":
+    chat_interface.launch()