ScientryAPI

Running

raannakasturi commited on Dec 13, 2024

Commit

c8669d6

1 Parent(s): 2427a02

Refactor API key handling and update dependencies; remove unused PDF parsing tool

Files changed (4) hide show

.gitignore CHANGED Viewed

main.py CHANGED Viewed

@@ -1,8 +1,11 @@
 from math_summarizer import generate_math_summary
 from nlp_summarizer import generate_nlp_summary_and_mindmap
-from tools import parse_pdf
 import openai
-import time
 def create_client(api_key):
     client = openai.OpenAI(
@@ -30,6 +33,6 @@ def generate_summary(client, corpus):
         return response
 def main(corpus):
-    client = create_client("glhf_0d3c695626fec941eeb7914dd0e36da5")
     response = generate_summary(client, corpus)
     return response

 from math_summarizer import generate_math_summary
 from nlp_summarizer import generate_nlp_summary_and_mindmap
 import openai
+import dotenv
+import os
+dotenv.load_dotenv()
+API_KEY = os.getenv('API_KEY')
 def create_client(api_key):
     client = openai.OpenAI(
         return response
 def main(corpus):
+    client = create_client(API_KEY)
     response = generate_summary(client, corpus)
     return response

requirements.txt CHANGED Viewed

+openai==1.57.3
+gradio==5.8.0
+python-dotenv==1.0.1
+sumy==0.11.0
+nltk==3.9.1

tools.py DELETED Viewed

@@ -1,19 +0,0 @@
-from langchain_community.document_loaders import PyPDFLoader
-from langchain.text_splitter import RecursiveCharacterTextSplitter
-def parse_pdf(pdf_path):
-    loader = PyPDFLoader(pdf_path)
-    pages = loader.load_and_split()
-    all_text = " ".join([page.page_content for page in pages])
-    start_index = all_text.find("ABSTRACT")
-    end_index = all_text.find("REFERENCES")
-    if start_index != -1 and end_index != -1 and start_index < end_index:
-        relevant_text = all_text[start_index:end_index]
-    else:
-        relevant_text = all_text
-    text_splitter = RecursiveCharacterTextSplitter(chunk_size=250, chunk_overlap=50)
-    text_list = text_splitter.split_text(relevant_text)
-    research_paper_text = "".join(text_list)
-    length_of_research_paper = len(research_paper_text)
-    print(f"Length of Research Paper: {length_of_research_paper}")
-    return research_paper_text