Spaces:

nolanzandi
/

virtual-data-analyst

Running

App Files Files Community

nolanzandi commited on Feb 1

Commit

554d139

verified ·

1 Parent(s): 32f5b77

Upload 2 files

Browse files

Files changed (2) hide show

pipelines.py +91 -0
sqlite_functions.py +35 -0

pipelines.py ADDED Viewed

	@@ -0,0 +1,91 @@

+from haystack import Pipeline
+from haystack.components.builders import PromptBuilder
+from haystack.components.generators.openai import OpenAIGenerator
+from haystack.components.routers import ConditionalRouter
+from functions import SQLiteQuery
+from typing import List
+import sqlite3
+import os
+from getpass import getpass
+from dotenv import load_dotenv
+load_dotenv()
+if "OPENAI_API_KEY" not in os.environ:
+    os.environ["OPENAI_API_KEY"] = getpass("Enter OpenAI API key:")
+from haystack.components.builders import PromptBuilder
+from haystack.components.generators import OpenAIGenerator
+llm = OpenAIGenerator(model="gpt-4o")
+sql_query = SQLiteQuery('data_source.db')
+connection = sqlite3.connect('data_source.db')
+cur=connection.execute('select * from data_source')
+columns = [i[0] for i in cur.description]
+cur.close()
+#Rag Pipeline
+prompt = PromptBuilder(template="""Please generate an SQL query. The query should answer the following Question: {{question}};
+            If the question cannot be answered given the provided table and columns, return 'no_answer'
+            The query is to be answered for the table is called 'data_source' with the following
+            Columns: {{columns}};
+            Answer:""")
+routes = [
+     {
+        "condition": "{{'no_answer' not in replies[0]}}",
+        "output": "{{replies}}",
+        "output_name": "sql",
+        "output_type": List[str],
+    },
+    {
+        "condition": "{{'no_answer' in replies[0]}}",
+        "output": "{{question}}",
+        "output_name": "go_to_fallback",
+        "output_type": str,
+    },
+]
+router = ConditionalRouter(routes)
+fallback_prompt = PromptBuilder(template="""User entered a query that cannot be answered with the given table.
+                                            The query was: {{question}} and the table had columns: {{columns}}.
+                                            Let the user know why the question cannot be answered""")
+fallback_llm = OpenAIGenerator(model="gpt-4")
+conditional_sql_pipeline = Pipeline()
+conditional_sql_pipeline.add_component("prompt", prompt)
+conditional_sql_pipeline.add_component("llm", llm)
+conditional_sql_pipeline.add_component("router", router)
+conditional_sql_pipeline.add_component("fallback_prompt", fallback_prompt)
+conditional_sql_pipeline.add_component("fallback_llm", fallback_llm)
+conditional_sql_pipeline.add_component("sql_querier", sql_query)
+conditional_sql_pipeline.connect("prompt", "llm")
+conditional_sql_pipeline.connect("llm.replies", "router.replies")
+conditional_sql_pipeline.connect("router.sql", "sql_querier.queries")
+conditional_sql_pipeline.connect("router.go_to_fallback", "fallback_prompt.question")
+conditional_sql_pipeline.connect("fallback_prompt", "fallback_llm")
+def rag_pipeline_func(queries: str, columns: str):
+   print("RAG PIPELINE FUNCTION")
+   result = conditional_sql_pipeline.run({"prompt": {"question": queries,
+                                                  "columns": columns},
+                                       "router": {"question": queries},
+                                       "fallback_prompt": {"columns": columns}})
+   if 'sql_querier' in result:
+      reply = result['sql_querier']['results'][0]
+   elif 'fallback_llm' in result:
+      reply = result['fallback_llm']['replies'][0]
+   else:
+      reply = result["llm"]["replies"][0]
+   print("reply content")
+   print(reply.content)
+   return {"reply": reply.content}

sqlite_functions.py ADDED Viewed

	@@ -0,0 +1,35 @@

+from typing import List
+from haystack import component
+import pandas as pd
+import sqlite3
+@component
+class SQLiteQuery:
+    def __init__(self, sql_database: str):
+      self.connection = sqlite3.connect(sql_database, check_same_thread=False)
+    @component.output_types(results=List[str], queries=List[str])
+    def run(self, queries: List[str]):
+        print("ATTEMPTING TO RUN QUERY")
+        results = []
+        for query in queries:
+          result = pd.read_sql(query, self.connection)
+          results.append(f"{result}")
+        "self.connection.close()"
+        return {"results": results, "queries": queries}
+sql_query = SQLiteQuery('data_source.db')
+def sqlite_query_func(queries: List[str]):
+    try:
+      result = sql_query.run(queries)
+      return {"reply": result["results"][0]}
+    except Exception as e:
+      reply = f"""There was an error running the SQL Query = {queries}
+              The error is {e},
+              You should probably try again.
+              """
+      return {"reply": reply}