Spaces:

amasood
/

RAG1.1

Sleeping

App Files Files Community

amasood commited on 27 days ago

Commit

b7416a2

verified ·

1 Parent(s): d2ffcaf

Update app.py

Browse files

Files changed (1) hide show

app.py +34 -23

app.py CHANGED Viewed

@@ -3,19 +3,25 @@ import pandas as pd
 import os
 import faiss
 import pickle
 from sentence_transformers import SentenceTransformer
 from groq import Groq
-from datasets import load_dataset
 # Load environment variables
-from dotenv import load_dotenv
 load_dotenv()
 # Setup Groq client
 client = Groq(api_key=os.getenv("GROQ_API_KEY"))
-MODEL_NAME = "llama-3-70b-8192"  # Or use "llama-3-8b-8192", "llama-3-3b-8192"
-# Load dataset
 @st.cache_data
 def load_data():
     dataset = load_dataset("llmware/rag_instruct_benchmark_tester", split="train")
@@ -34,16 +40,16 @@ def load_embeddings(df):
     return index, embeddings, embed_model
-# Retrieve top k similar context passages
 def retrieve_context(query, embed_model, index, df, k=3):
     query_embedding = embed_model.encode([query])
     D, I = index.search(query_embedding, k)
     context_passages = df.iloc[I[0]]['context'].tolist()
     return context_passages
-# Ask Groq LLM
 def ask_groq(query, context):
-    prompt = f"""You are a helpful assistant. Use the provided context to answer the question.
 Context:
 {context}
@@ -52,38 +58,43 @@ Question:
 {query}
 Answer:"""
     response = client.chat.completions.create(
         messages=[{"role": "user", "content": prompt}],
         model=MODEL_NAME
     )
     return response.choices[0].message.content
-# Streamlit UI
-st.title("📚 RAG App with Groq API")
-st.markdown("Use this Retrieval-Augmented Generation app to ask enterprise, legal, and financial questions.")
 df = load_data()
 index, embeddings, embed_model = load_embeddings(df)
 sample_queries = df['query'].dropna().unique().tolist()
-query = st.text_input("Enter your question:", "")
-if st.button("Use Random Sample"):
-    import random
-    query = random.choice(sample_queries)
-    st.session_state["query"] = query
-    st.experimental_rerun()
 if query:
     st.markdown(f"**Your Query:** {query}")
-    with st.spinner("Retrieving relevant context..."):
         contexts = retrieve_context(query, embed_model, index, df)
         combined_context = "\n\n".join(contexts)
-    with st.spinner("Getting answer from Groq..."):
         answer = ask_groq(query, combined_context)
     st.markdown("### 💡 Answer")
     st.write(answer)
     st.markdown("### 📄 Retrieved Context")
     for i, ctx in enumerate(contexts, 1):
-        st.markdown(f"**Context {i}:**")
-        st.write(ctx)

 import os
 import faiss
 import pickle
+import random
+from datasets import load_dataset
 from sentence_transformers import SentenceTransformer
 from groq import Groq
+from dotenv import load_dotenv
 # Load environment variables
 load_dotenv()
 # Setup Groq client
 client = Groq(api_key=os.getenv("GROQ_API_KEY"))
+MODEL_NAME = "llama-3-70b-8192"  # or try "llama-3-8b-8192" or "llama-3-3b-8192"
+# Streamlit UI
+st.set_page_config(page_title="RAG with Groq", layout="wide")
+st.title("📚 RAG App using Groq API")
+st.markdown("Ask enterprise, financial, and legal questions using Retrieval-Augmented Generation (RAG).")
+# Load dataset from Hugging Face
 @st.cache_data
 def load_data():
     dataset = load_dataset("llmware/rag_instruct_benchmark_tester", split="train")
     return index, embeddings, embed_model
+# Retrieve top-k relevant context
 def retrieve_context(query, embed_model, index, df, k=3):
     query_embedding = embed_model.encode([query])
     D, I = index.search(query_embedding, k)
     context_passages = df.iloc[I[0]]['context'].tolist()
     return context_passages
+# Ask the Groq LLM
 def ask_groq(query, context):
+    prompt = f"""You are a helpful assistant. Use the context to answer the question.
 Context:
 {context}
 {query}
 Answer:"""
     response = client.chat.completions.create(
         messages=[{"role": "user", "content": prompt}],
         model=MODEL_NAME
     )
     return response.choices[0].message.content
+# Load everything
 df = load_data()
 index, embeddings, embed_model = load_embeddings(df)
+# User input
+st.subheader("🔍 Ask your question")
 sample_queries = df['query'].dropna().unique().tolist()
+col1, col2 = st.columns([3, 1])
+with col1:
+    query = st.text_input("Enter your question here:")
+with col2:
+    if st.button("🎲 Random Sample"):
+        query = random.choice(sample_queries)
+        st.experimental_rerun()
+# Handle query
 if query:
     st.markdown(f"**Your Query:** {query}")
+    with st.spinner("🔎 Retrieving relevant context..."):
         contexts = retrieve_context(query, embed_model, index, df)
         combined_context = "\n\n".join(contexts)
+    with st.spinner("🤖 Querying Groq LLM..."):
         answer = ask_groq(query, combined_context)
     st.markdown("### 💡 Answer")
     st.write(answer)
     st.markdown("### 📄 Retrieved Context")
     for i, ctx in enumerate(contexts, 1):
+        with st.expander(f"Context {i}"):
+            st.write(ctx)