Spaces:

rafaldembski
/

ScamDetector

Running

App Files Files Community

rafaldembski commited on Oct 1, 2024

Commit

21adf53

verified ·

1 Parent(s): 3ad7349

Update utils/functions.py

Browse files

Files changed (1) hide show

utils/functions.py +57 -64

utils/functions.py CHANGED Viewed

@@ -23,8 +23,6 @@ logging.basicConfig(
 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 DATA_DIR = os.path.join(BASE_DIR, '..', 'data')
 FAKE_NUMBERS_FILE = os.path.join(DATA_DIR, 'fake_numbers.json')
-HISTORY_FILE = os.path.join(DATA_DIR, 'history.json')  # Jeśli nie używasz historii, możesz usunąć te linie
-STATS_FILE = os.path.join(DATA_DIR, 'stats.json')      # Jeśli nie używasz statystyk, możesz usunąć te linie
 # Upewnij się, że katalog 'data' istnieje
 os.makedirs(DATA_DIR, exist_ok=True)
@@ -112,6 +110,24 @@ def simple_checks(message, language):
         warnings.append("Wiadomość zawiera prośbę o poufne informacje.")
     return warnings
 def analyze_message(content, sender_info, additional_info, api_key, language):
     """
     Analizuje treść wiadomości SMS za pomocą modelu AI, wykorzystując system prompts.
@@ -423,38 +439,18 @@ def check_url_with_phishtank(url_to_check, phishtank_api_key):
         logging.error(f"Błąd podczas sprawdzania URL w PhishTank: {e}")
         return False, f"Błąd podczas sprawdzania URL w PhishTank: {e}"
-def analyze_url(url, phishtank_api_key, google_safe_browsing_api_key):
     """
-    Analizuje stronę internetową pod kątem zagrożeń phishingowych.
     """
-    threats = {
-        "PhishTank": False,
-        "Google Safe Browsing": False
-    }
-    # Sprawdzenie PhishTank
-    is_phish, error = check_url_with_phishtank(url, phishtank_api_key)
-    if error:
-        logging.error(f"Błąd podczas sprawdzania URL w PhishTank: {error}")
-    threats["PhishTank"] = is_phish
-    # Sprawdzenie Google Safe Browsing
-    if google_safe_browsing_api_key:
-        google_safe_browsing_result = check_url_with_google_safe_browsing(url, google_safe_browsing_api_key)
-        threats["Google Safe Browsing"] = google_safe_browsing_result
-    else:
-        logging.warning("Brak klucza API Google Safe Browsing.")
-    # Pobranie zawartości strony
-    content = get_page_content(url)
-    return threats, content
-def check_url_with_google_safe_browsing(url_to_check, google_safe_browsing_api_key):
-    """
-    Sprawdza, czy podany URL znajduje się w bazie Google Safe Browsing.
-    """
-    api_url = f"https://safebrowsing.googleapis.com/v4/threatMatches:find?key={google_safe_browsing_api_key}"
     payload = {
         "client": {
             "clientId": "yourcompanyname",
@@ -471,35 +467,53 @@ def check_url_with_google_safe_browsing(url_to_check, google_safe_browsing_api_k
     }
     try:
-        response = requests.post(api_url, json=payload)
         if response.status_code == 200:
             result = response.json()
-            if "matches" in result:
-                return True
-            else:
-                return False
         else:
             logging.error(f"Błąd podczas sprawdzania URL w Google Safe Browsing: {response.status_code}")
-            return False
     except Exception as e:
         logging.error(f"Błąd podczas sprawdzania URL w Google Safe Browsing: {e}")
-        return False
-def get_page_content(url):
     """
-    Pobiera zawartość strony internetowej pod podanym URL.
     """
     try:
         response = requests.get(url)
         if response.status_code == 200:
             logging.info(f"Pobrano zawartość strony {url}.")
-            return response.text[:500]  # Zwraca pierwsze 500 znaków
         else:
             logging.error(f"Nie udało się pobrać zawartości strony {url}. Kod statusu HTTP: {response.status_code}")
-            return f"Nie udało się pobrać zawartości strony. Kod statusu HTTP: {response.status_code}"
     except Exception as e:
         logging.error(f"Błąd podczas pobierania URL {url}: {e}")
-        return f"Błąd podczas pobierania URL: {e}"
 def extract_text_from_image(image_file):
     """
@@ -513,24 +527,3 @@ def extract_text_from_image(image_file):
     except Exception as e:
         logging.error(f"Błąd podczas ekstrakcji tekstu z obrazu: {e}")
         return f"Błąd podczas ekstrakcji tekstu z obrazu: {e}"
-# Funkcje analizy email
-def get_email_info(email_address):
-    """
-    Pobiera informacje o domenie nadawcy e-mail za pomocą zapytania WHOIS.
-    """
-    try:
-        domain = email_address.split('@')[-1]
-        w = whois.whois(domain)
-        organization = w.org if w.org else 'Nieznana'
-        country = w.country if w.country else 'Nieznany'
-        logging.info(f"Domena {domain} - Organizacja: {organization}, Kraj: {country}.")
-        return {
-            'domain': domain,
-            'organization': organization,
-            'country': country
-        }
-    except Exception as e:
-        logging.error(f"Nie udało się pobrać informacji WHOIS dla domeny {email_address}: {e}")
-        return None

 BASE_DIR = os.path.dirname(os.path.abspath(__file__))
 DATA_DIR = os.path.join(BASE_DIR, '..', 'data')
 FAKE_NUMBERS_FILE = os.path.join(DATA_DIR, 'fake_numbers.json')
 # Upewnij się, że katalog 'data' istnieje
 os.makedirs(DATA_DIR, exist_ok=True)
         warnings.append("Wiadomość zawiera prośbę o poufne informacje.")
     return warnings
+def get_phone_info(phone_number):
+    """
+    Weryfikuje numer telefonu i zwraca informacje o kraju i operatorze.
+    """
+    try:
+        parsed_number = phonenumbers.parse(phone_number, None)
+        country = geocoder.description_for_number(parsed_number, 'pl')
+        operator = carrier.name_for_number(parsed_number, 'pl')
+        if not country:
+            country = "Nieznany"
+        if not operator:
+            operator = "Nieznany"
+        logging.info(f"Numer {phone_number} - Kraj: {country}, Operator: {operator}.")
+        return country, operator
+    except NumberParseException as e:
+        logging.error(f"Nie udało się przetworzyć numeru telefonu {phone_number}: {e}")
+        return "Nieznany", "Nieznany"
 def analyze_message(content, sender_info, additional_info, api_key, language):
     """
     Analizuje treść wiadomości SMS za pomocą modelu AI, wykorzystując system prompts.
         logging.error(f"Błąd podczas sprawdzania URL w PhishTank: {e}")
         return False, f"Błąd podczas sprawdzania URL w PhishTank: {e}"
+def get_google_safe_browsing(url_to_check, google_api_key):
     """
+    Sprawdza, czy URL jest bezpieczny za pomocą Google Safe Browsing API.
     """
+    if not google_api_key:
+        logging.error("Brak klucza API Google Safe Browsing.")
+        return False, "Brak klucza API Google Safe Browsing."
+    api_url = "https://safebrowsing.googleapis.com/v4/threatMatches:find"
+    params = {
+        'key': google_api_key
+    }
     payload = {
         "client": {
             "clientId": "yourcompanyname",
     }
     try:
+        response = requests.post(api_url, params=params, json=payload)
         if response.status_code == 200:
             result = response.json()
+            is_threat = bool(result)
+            return is_threat, None
         else:
             logging.error(f"Błąd podczas sprawdzania URL w Google Safe Browsing: {response.status_code}")
+            return False, f"Błąd podczas sprawdzania URL w Google Safe Browsing: {response.status_code}"
     except Exception as e:
         logging.error(f"Błąd podczas sprawdzania URL w Google Safe Browsing: {e}")
+        return False, f"Błąd podczas sprawdzania URL w Google Safe Browsing: {e}"
+def analyze_url(url, phishtank_api_key, google_api_key):
     """
+    Analizuje stronę internetową pod kątem phishingu i innych zagrożeń.
     """
+    # Sprawdzenie PhishTank
+    is_phish, error = check_url_with_phishtank(url, phishtank_api_key)
+    if error:
+        phishing_result = error
+    elif is_phish:
+        phishing_result = "Zagrożenie phishingiem wykryte w PhishTank."
+    else:
+        phishing_result = "Brak zagroże�� phishingowych według PhishTank."
+    # Sprawdzenie Google Safe Browsing
+    is_threat, error = get_google_safe_browsing(url, google_api_key)
+    if error:
+        google_result = error
+    elif is_threat:
+        google_result = "Zagrożenie wykryte przez Google Safe Browsing."
+    else:
+        google_result = "Brak zagrożeń według Google Safe Browsing."
+    # Analiza zawartości strony
     try:
         response = requests.get(url)
         if response.status_code == 200:
+            content = response.text[:500]  # Pobierz pierwsze 500 znaków
             logging.info(f"Pobrano zawartość strony {url}.")
+            return phishing_result, google_result, content
         else:
             logging.error(f"Nie udało się pobrać zawartości strony {url}. Kod statusu HTTP: {response.status_code}")
+            return f"Nie udało się pobrać zawartości strony. Kod statusu HTTP: {response.status_code}", google_result, ""
     except Exception as e:
         logging.error(f"Błąd podczas pobierania URL {url}: {e}")
+        return f"Błąd podczas pobierania URL: {e}", google_result, ""
 def extract_text_from_image(image_file):
     """
     except Exception as e:
         logging.error(f"Błąd podczas ekstrakcji tekstu z obrazu: {e}")
         return f"Błąd podczas ekstrakcji tekstu z obrazu: {e}"