Spaces:

rafaldembski
/

ScamDetector

Running

App Files Files Community

rafaldembski commited on Oct 1, 2024

Commit

9cac03a

verified ·

1 Parent(s): 0ecc366

Update pages/Analysis.py

Browse files

Files changed (1) hide show

pages/Analysis.py +158 -44

pages/Analysis.py CHANGED Viewed

@@ -8,7 +8,7 @@ from utils.functions import (
     update_stats,
     add_to_history,
     is_fake_number,
-    add_fake_number  # Upewnij się, że ta funkcja jest zaimplementowana
 )
 import os
 import re
@@ -31,16 +31,19 @@ def check_urls_with_phishtank(urls):
             'format': 'json',
             'url': url
         }
-        response = requests.post('https://checkurl.phishtank.com/checkurl/', data=params)
-        if response.status_code == 200:
-            data = response.json()
-            in_database = data.get('results', {}).get('in_database', False)
-            valid = data.get('results', {}).get('valid', False)
-            if in_database and valid:
-                phishing_urls.append(url)
-        else:
-            # Obsługa błędów
-            pass
     return phishing_urls
 def check_urls_with_safe_browsing(urls):
@@ -61,18 +64,21 @@ def check_urls_with_safe_browsing(urls):
             'threatEntries': [{'url': url} for url in urls]
         }
     }
-    response = requests.post(
-        f'https://safebrowsing.googleapis.com/v4/threatMatches:find?key={api_key}',
-        headers=headers,
-        json=client_body
-    )
-    if response.status_code == 200:
-        data = response.json()
-        matches = data.get('matches', [])
-        unsafe_urls = [match['threat']['url'] for match in matches]
-    else:
-        # Obsługa błędów
-        pass
     return unsafe_urls
 def show_analysis(language):
@@ -118,12 +124,110 @@ def show_analysis(language):
             'safe_browsing_warning': "Następujące URL są oznaczone jako niebezpieczne przez Google Safe Browsing:",
             'no_safe_browsing_threats': "Brak zagrożeń według Google Safe Browsing.",
             'api_key_missing': "Brak klucza API dla usługi: {}",
-            'analyzing_message': "Analizowanie wiadomości za pomocą modelu AI..."
         },
-        # Uzupełnij tłumaczenia dla 'German' i 'English' analogicznie...
     }
-    translations = page_translations.get(language, page_translations['Polish'])
     st.header(translations['header'])
     st.write(translations['content'])
@@ -170,12 +274,14 @@ def show_analysis(language):
         submitted = st.form_submit_button(translations['analyze_button'])
     if submitted:
         if not message.strip():
             st.error(translations['input_placeholder'])
         elif not phone_number.strip():
             st.error(translations['phone_input_label'])
         else:
             # Informacje o numerze telefonu
             country, operator = get_phone_info(phone_number)
             if country and operator:
                 st.subheader(translations['phone_info_header'])
@@ -185,6 +291,7 @@ def show_analysis(language):
                 st.write(translations['unable_to_retrieve'])
             # Sprawdzenie, czy numer jest w bazie fałszywych numerów
             if is_fake_number(phone_number):
                 st.warning(translations['result_positive'])
                 fraud_detected = True
@@ -193,6 +300,7 @@ def show_analysis(language):
                 fraud_detected = False
             # Przeprowadź proste sprawdzenia heurystyczne
             warnings = simple_checks(message, language)
             if warnings:
                 st.warning(translations['red_flags_found'])
@@ -213,6 +321,7 @@ def show_analysis(language):
             """
             # Analiza URL
             urls = extract_urls(message)
             if urls:
                 st.subheader(translations['url_analysis_header'])
@@ -250,26 +359,31 @@ def show_analysis(language):
                 st.error("API key is missing. Please set the SAMBANOVA_API_KEY environment variable.")
             else:
                 with st.spinner(translations['analyzing_message']):
-                    analysis_text, risk_text, recommendations_text = analyze_message(
-                        message, phone_number, additional_info, api_key, language
-                    )
-                    st.subheader("📑 Message Content Analysis:")
-                    st.markdown(analysis_text)
-                    st.subheader("⚠️ Fraud Risk Assessment:")
-                    st.markdown(risk_text)
-                    st.subheader("✅ User Recommendations:")
-                    st.markdown(recommendations_text)
-                    # Aktualizacja statystyk na podstawie oceny ryzyka
                     try:
-                        match = re.search(r'(\d+)/10', risk_text)
-                        fraud_detected = int(match.group(1)) >= 7 if match else False
-                        update_stats(fraud_detected=fraud_detected)
-                    except:
-                        fraud_detected = False
-                    # Dodanie analizy do historii
-                    add_to_history(message, phone_number, analysis_text, risk_text, recommendations_text)
                 st.info(translations['remember_caution'])

     update_stats,
     add_to_history,
     is_fake_number,
+    add_fake_number
 )
 import os
 import re
             'format': 'json',
             'url': url
         }
+        try:
+            response = requests.post('https://checkurl.phishtank.com/checkurl/', data=params)
+            if response.status_code == 200:
+                data = response.json()
+                in_database = data.get('results', {}).get('in_database', False)
+                valid = data.get('results', {}).get('valid', False)
+                if in_database and valid:
+                    phishing_urls.append(url)
+            else:
+                # Obsługa błędów
+                pass
+        except Exception as e:
+            st.error(f"Błąd podczas sprawdzania URL w PhishTank: {e}")
     return phishing_urls
 def check_urls_with_safe_browsing(urls):
             'threatEntries': [{'url': url} for url in urls]
         }
     }
+    try:
+        response = requests.post(
+            f'https://safebrowsing.googleapis.com/v4/threatMatches:find?key={api_key}',
+            headers=headers,
+            json=client_body
+        )
+        if response.status_code == 200:
+            data = response.json()
+            matches = data.get('matches', [])
+            unsafe_urls = [match['threat']['url'] for match in matches]
+        else:
+            # Obsługa błędów
+            st.error(f"Błąd podczas komunikacji z Google Safe Browsing API: {response.status_code}")
+    except Exception as e:
+        st.error(f"Błąd podczas sprawdzania URL w Google Safe Browsing: {e}")
     return unsafe_urls
 def show_analysis(language):
             'safe_browsing_warning': "Następujące URL są oznaczone jako niebezpieczne przez Google Safe Browsing:",
             'no_safe_browsing_threats': "Brak zagrożeń według Google Safe Browsing.",
             'api_key_missing': "Brak klucza API dla usługi: {}",
+            'analyzing_message': "Analizowanie wiadomości za pomocą modelu AI...",
+            'form_submitted': "Formularz został wysłany.",
+            'starting_phone_analysis': "Rozpoczynam analizę numeru telefonu...",
+            'checking_fake_numbers': "Sprawdzam, czy numer jest w bazie fałszywych numerów...",
+            'performing_simple_checks': "Przeprowadzam proste sprawdzenia heurystyczne...",
+            'starting_url_analysis': "Rozpoczynam analizę URL..."
+        },
+        'German': {
+            'header': "📊 SMS-Analyse",
+            'content': "Hier ist die Schnittstelle zur Analyse von SMS-Nachrichten. Geben Sie unten den Inhalt der Nachricht ein, um zu überprüfen, ob es sich um einen potenziellen Betrug handelt.",
+            'input_placeholder': "Geben Sie den SMS-Inhalt ein...",
+            'analyze_button': "Nachricht analysieren",
+            'result_positive': "Warnung: Die Nachricht könnte ein Betrug sein!",
+            'result_negative': "Die Nachricht scheint sicher zu sein.",
+            'report_button': "Nummer als Betrug melden",
+            'history_header': "Analyseverlauf",
+            'phone_input_label': "Telefonnummer des Absenders (mit Ländervorwahl, z.B. +49123456789):",
+            'additional_info_header': "Zusätzliche Informationen",
+            'frequency_label': "Wie oft erhalten Sie Nachrichten von dieser Nummer?",
+            'frequency_options': ('Zum ersten Mal', 'Gelegentlich', 'Regelmäßig'),
+            'last_received_label': "Wann haben Sie zuletzt eine ähnliche Nachricht erhalten?",
+            'last_received_options': ('Heute', 'In der letzten Woche', 'Im letzten Monat', 'Länger her'),
+            'confidence_level_label': "Wie sicher sind Sie, dass die Nachricht authentisch ist?",
+            'confidence_level_help': "1: Sehr unsicher, 5: Sehr sicher",
+            'unexpected_label': "War der Erhalt dieser Nachricht für Sie unerwartet?",
+            'unexpected_options': ('Ja', 'Nein'),
+            'additional_notes_label': "Zusätzliche Anmerkungen oder Informationen (optional)",
+            'phone_info_header': "Informationen zur Telefonnummer",
+            'country_label': "Land",
+            'operator_label': "Anbieter",
+            'unable_to_retrieve': "Informationen zur Telefonnummer können nicht abgerufen werden.",
+            'red_flags_found': "Folgende potenzielle Warnsignale wurden gefunden:",
+            'remember_caution': "📌 Denken Sie daran: Seien Sie vorsichtig bei Nachrichten von unbekannten Absendern.",
+            'number_reported': "Nummer wurde als Betrug gemeldet.",
+            'number_already_reported': "Nummer wurde bereits als Betrug gemeldet.",
+            'invalid_number': "Die angegebene Telefonnummer ist ungültig.",
+            'failed_to_parse': "Die Telefonnummer konnte nicht verarbeitet werden. Stellen Sie sicher, dass sie im richtigen Format ist.",
+            'url_analysis_header': "🔗 URL-Analyse",
+            'extracted_urls': "Aus der Nachricht extrahierte URLs:",
+            'no_urls_found': "Keine URLs in der Nachricht gefunden.",
+            'checking_urls_phishtank': "Überprüfe URLs mit PhishTank...",
+            'phishtank_warning': "Folgende URLs sind von PhishTank als Phishing markiert:",
+            'no_phishtank_threats': "Keine Phishing-Bedrohungen laut PhishTank.",
+            'checking_urls_safe_browsing': "Überprüfe URLs mit Google Safe Browsing...",
+            'safe_browsing_warning': "Folgende URLs sind von Google Safe Browsing als unsicher markiert:",
+            'no_safe_browsing_threats': "Keine Bedrohungen laut Google Safe Browsing.",
+            'api_key_missing': "API-Schlüssel für Dienst fehlt: {}",
+            'analyzing_message': "Analysiere Nachricht mit AI-Modell...",
+            'form_submitted': "Formular wurde eingereicht.",
+            'starting_phone_analysis': "Beginne Analyse der Telefonnummer...",
+            'checking_fake_numbers': "Überprüfe, ob die Nummer in der Betrugsdatenbank ist...",
+            'performing_simple_checks': "Führe einfache heuristische Prüfungen durch...",
+            'starting_url_analysis': "Beginne URL-Analyse..."
         },
+        'English': {
+            'header': "📊 SMS Analysis",
+            'content': "Here is the interface for analyzing SMS messages. Enter the content of the message below to check if it is a potential fraud.",
+            'input_placeholder': "Enter SMS content...",
+            'analyze_button': "Analyze Message",
+            'result_positive': "Warning: The message may be a fraud!",
+            'result_negative': "The message appears to be safe.",
+            'report_button': "Report number as fraud",
+            'history_header': "Analysis History",
+            'phone_input_label': "Sender's phone number (with country code, e.g., +123456789):",
+            'additional_info_header': "Additional Information",
+            'frequency_label': "How often do you receive messages from this number?",
+            'frequency_options': ('First time', 'Occasionally', 'Regularly'),
+            'last_received_label': "When did you last receive a similar message?",
+            'last_received_options': ('Today', 'Within the last week', 'Within the last month', 'Longer ago'),
+            'confidence_level_label': "How confident are you that the message is authentic?",
+            'confidence_level_help': "1: Very unsure, 5: Very confident",
+            'unexpected_label': "Was receiving this message unexpected for you?",
+            'unexpected_options': ('Yes', 'No'),
+            'additional_notes_label': "Additional notes or information (optional)",
+            'phone_info_header': "Phone Number Information",
+            'country_label': "Country",
+            'operator_label': "Operator",
+            'unable_to_retrieve': "Unable to retrieve phone number information.",
+            'red_flags_found': "The following potential red flags were found:",
+            'remember_caution': "📌 Remember: Be cautious with messages from unknown senders.",
+            'number_reported': "Number has been reported as fraud.",
+            'number_already_reported': "Number has already been reported as fraud.",
+            'invalid_number': "The provided phone number is invalid.",
+            'failed_to_parse': "Failed to parse the phone number. Ensure it is in the correct format.",
+            'url_analysis_header': "🔗 URL Analysis",
+            'extracted_urls': "Extracted URLs from the message:",
+            'no_urls_found': "No URLs found in the message.",
+            'checking_urls_phishtank': "Checking URLs with PhishTank...",
+            'phishtank_warning': "The following URLs are flagged as phishing by PhishTank:",
+            'no_phishtank_threats': "No phishing threats detected by PhishTank.",
+            'checking_urls_safe_browsing': "Checking URLs with Google Safe Browsing...",
+            'safe_browsing_warning': "The following URLs are flagged as unsafe by Google Safe Browsing:",
+            'no_safe_browsing_threats': "No threats detected by Google Safe Browsing.",
+            'api_key_missing': "API key missing for service: {}",
+            'analyzing_message': "Analyzing message using AI model...",
+            'form_submitted': "Form has been submitted.",
+            'starting_phone_analysis': "Starting phone number analysis...",
+            'checking_fake_numbers': "Checking if the number is in the fraud database...",
+            'performing_simple_checks': "Performing simple heuristic checks...",
+            'starting_url_analysis': "Starting URL analysis..."
+        }
     }
+    translations = page_translations.get(language, page_translations['English'])
     st.header(translations['header'])
     st.write(translations['content'])
         submitted = st.form_submit_button(translations['analyze_button'])
     if submitted:
+        st.write(translations['form_submitted'])  # Diagnostyka
         if not message.strip():
             st.error(translations['input_placeholder'])
         elif not phone_number.strip():
             st.error(translations['phone_input_label'])
         else:
             # Informacje o numerze telefonu
+            st.write(translations['starting_phone_analysis'])  # Diagnostyka
             country, operator = get_phone_info(phone_number)
             if country and operator:
                 st.subheader(translations['phone_info_header'])
                 st.write(translations['unable_to_retrieve'])
             # Sprawdzenie, czy numer jest w bazie fałszywych numerów
+            st.write(translations['checking_fake_numbers'])  # Diagnostyka
             if is_fake_number(phone_number):
                 st.warning(translations['result_positive'])
                 fraud_detected = True
                 fraud_detected = False
             # Przeprowadź proste sprawdzenia heurystyczne
+            st.write(translations['performing_simple_checks'])  # Diagnostyka
             warnings = simple_checks(message, language)
             if warnings:
                 st.warning(translations['red_flags_found'])
             """
             # Analiza URL
+            st.write(translations['starting_url_analysis'])  # Diagnostyka
             urls = extract_urls(message)
             if urls:
                 st.subheader(translations['url_analysis_header'])
                 st.error("API key is missing. Please set the SAMBANOVA_API_KEY environment variable.")
             else:
                 with st.spinner(translations['analyzing_message']):
+                    # Upewnij się, że funkcja analyze_message jest zaimplementowana
                     try:
+                        analysis_text, risk_text, recommendations_text = analyze_message(
+                            message, phone_number, additional_info, api_key, language
+                        )
+                        st.subheader("📑 " + translations['header'])
+                        st.markdown(analysis_text)
+                        st.subheader("⚠️ " + translations['red_flags_found'])
+                        st.markdown(risk_text)
+                        st.subheader("✅ " + translations['remember_caution'])
+                        st.markdown(recommendations_text)
+                        # Aktualizacja statystyk na podstawie oceny ryzyka
+                        try:
+                            match = re.search(r'(\d+)/10', risk_text)
+                            fraud_detected = int(match.group(1)) >= 7 if match else False
+                            update_stats(fraud_detected=fraud_detected)
+                        except Exception as e:
+                            st.error(f"Błąd podczas aktualizacji statystyk: {e}")
+                            fraud_detected = False
+                        # Dodanie analizy do historii
+                        add_to_history(message, phone_number, analysis_text, risk_text, recommendations_text)
+                    except Exception as e:
+                        st.error(f"Błąd podczas analizy wiadomości: {e}")
                 st.info(translations['remember_caution'])