Spaces:

DevsDoCode
/

Deep-Webscout

Runtime error

App Files Files Community

Sreejan commited on Apr 2, 2024

Commit

12fdc0e

1 Parent(s): 66840e4

Initialized

Browse files

Files changed (5) hide show

Dockerfile +14 -0
WebScout_Deep_DDC.py +56 -0
app_fast_api.py +49 -0
app_flask.py +54 -0
requirements.txt +3 -0

Dockerfile ADDED Viewed

	@@ -0,0 +1,14 @@

+# read the doc: https://huggingface.co/docs/hub/spaces-sdks-docker
+# you will also find guides on how best to write your Dockerfile
+FROM python:3.9
+WORKDIR /code
+COPY ./requirements.txt /code/requirements.txt
+RUN pip install --no-cache-dir --upgrade -r /code/requirements.txt
+COPY . .
+CMD ["gunicorn", "-b", "0.0.0.0:7860",  "app_flask:app"]

WebScout_Deep_DDC.py ADDED Viewed

	@@ -0,0 +1,56 @@

+from webscout import DeepWEBS
+def perform_web_search(query, result_num=10, safe=True, extract_webpage=True, overwrite_query_html=False, overwrite_webpage_html=False):
+    # Initialize the DeepWEBS class
+    deep_search = DeepWEBS()
+    # Set up the search parameters
+    search_params = deep_search.DeepSearch(
+        queries=[query],  # Query to search
+        result_num=result_num,  # Number of search results
+        safe=safe,  # Enable SafeSearch
+        types=["web"],  # Search type: web
+        extract_webpage=extract_webpage,  # True for extracting webpages
+        overwrite_query_html=overwrite_query_html,
+        overwrite_webpage_html=overwrite_webpage_html,
+    )
+    # Execute the search and retrieve results
+    results = deep_search.queries_to_search_results(search_params)
+    return results
+def attributes_ext(raw_result):
+    titles_list = []
+    urls_list = []
+    text_list = []
+    for values in raw_result:
+        for title in values['query_results']:
+            titles_list.append(title['title'])
+        for url in values['query_results']:
+            urls_list.append(url['url'])
+        for body in values['query_results']:
+            text_list.append(body['text'])
+    return titles_list, urls_list, text_list
+def main(query, result_num=10, safe=True, extract_webpage=True, overwrite_query_html=False, overwrite_webpage_html=False):
+    raw_output = perform_web_search(query, result_num=result_num, safe=safe, extract_webpage=extract_webpage, overwrite_query_html=overwrite_query_html, overwrite_webpage_html=overwrite_webpage_html)
+    titles_list, urls_list, text_list = attributes_ext(raw_output)
+    return titles_list, urls_list, text_list
+if __name__ == "__main__":
+    # Prompt the user for a search query
+    query = "ipl 2p24"
+    # Perform the web search
+    results = perform_web_search(query)

app_fast_api.py ADDED Viewed

	@@ -0,0 +1,49 @@

+from fastapi import FastAPI, Query
+from typing import List
+import WebScout_Deep_DDC
+app = FastAPI()
+@app.get('/search')
+async def search(
+    query: str = Query(..., description="The search query"),
+    result_num: int = Query(10, description="Number of results to retrieve"),
+    safe: bool = Query(True, description="Enable safe search"),
+    extract_webpage: bool = Query(True, description="Extract webpage content"),
+    overwrite_query_html: bool = Query(False, description="Overwrite query HTML"),
+    overwrite_webpage_html: bool = Query(False, description="Overwrite webpage HTML")
+):
+    if query:
+        # Call the main function with the specified parameters
+        titles_list, urls_list, text_list = WebScout_Deep_DDC.main(
+            query,
+            result_num=result_num,
+            safe=safe,
+            extract_webpage=extract_webpage,
+            overwrite_query_html=overwrite_query_html,
+            overwrite_webpage_html=overwrite_webpage_html
+        )
+        # Create a dictionary containing the extracted attributes
+        response = {
+            'titles': titles_list,
+            'urls': urls_list,
+            'text': text_list
+        }
+        # Return the response as JSON
+        return response
+    else:
+        error_message = {
+            'developer_contact': {
+                'telegram': 'https://t.me/DevsDoCode',
+                'instagram': 'https://www.instagram.com/sree.shades_/',
+                'discord': 'https://discord.gg/ehwfVtsAts',
+                'linkedin': 'https://www.linkedin.com/in/developer-sreejan/',
+                'twitter': 'https://twitter.com/Anand_Sreejan'
+            },
+            'error': 'Oops! Something went wrong. Please contact the developer for assistance.'
+        }
+        return error_message, 400
+# Example Usage : http://127.0.0.1:8000/search?query=python&safe=true

app_flask.py ADDED Viewed

	@@ -0,0 +1,54 @@

+from flask import Flask, request, jsonify
+import WebScout_Deep_DDC
+app = Flask(__name__)
+@app.route('/search', methods=['GET'])
+def search():
+    # Extract query parameter
+    query = request.args.get('query')
+    # Extract additional parameters
+    result_num = int(request.args.get('result_num', 10))
+    safe = request.args.get('safe', True)
+    extract_webpage = request.args.get('extract_webpage', True)
+    overwrite_query_html = request.args.get('overwrite_query_html', False)
+    overwrite_webpage_html = request.args.get('overwrite_webpage_html', False)
+    if query:
+        # Call the main function with the specified parameters
+        titles_list, urls_list, text_list = WebScout_Deep_DDC.main(
+            query,
+            result_num=result_num,
+            safe=safe,
+            extract_webpage=extract_webpage,
+            overwrite_query_html=overwrite_query_html,
+            overwrite_webpage_html=overwrite_webpage_html
+        )
+        # Create a dictionary containing the extracted attributes
+        response = {
+            'titles': titles_list,
+            'urls': urls_list,
+            'text': text_list
+        }
+        # Return the response as prettified JSON
+        return jsonify(response), 200, {'Content-Type': 'application/json; charset=utf-8'}
+    else:
+        error_message = {
+        'developer_contact': {
+            'telegram': 'https://t.me/DevsDoCode',
+            'instagram': 'https://www.instagram.com/sree.shades_/',
+            'discord': 'https://discord.gg/ehwfVtsAts',
+            'linkedin': 'https://www.linkedin.com/in/developer-sreejan/',
+            'twitter': 'https://twitter.com/Anand_Sreejan'
+        },
+        'error': 'Oops! Something went wrong. Please contact the developer for assistance.'
+    }
+        return jsonify(error_message), 400
+if __name__ == '__main__':
+    app.run(debug=True)
+    # Example Usage : http://127.0.0.1:5000/search?query=python%20tutorial&result_num=20&safe=False&types=web&types=video&extract_webpage=False

requirements.txt ADDED Viewed

	@@ -0,0 +1,3 @@

+webscout==1.2.3
+flask==3.0.0
+gunicorn