Spaces:

rafaldembski
/

ScamDetector

Running

App Files Files Community

rafaldembski commited on Sep 30, 2024

Commit

c7b500a

verified ·

1 Parent(s): dd7ba86

Update pages/Statistics.py

Browse files

Files changed (1) hide show

pages/Statistics.py +69 -39

pages/Statistics.py CHANGED Viewed

@@ -7,11 +7,13 @@ import plotly.graph_objects as go
 import json
 import os
 import re
-from datetime import datetime
 import pycountry
 from streamlit_extras.metric_cards import style_metric_cards
-from streamlit_elements import elements, mui, html
 # Definiowanie ścieżek do plików JSON
 FAKE_NUMBERS_FILE = os.path.join('data', 'fake_numbers.json')
@@ -32,10 +34,10 @@ page_translations = {
         'frauds_over_time': "Liczba Wykrytych Oszustw w Czasie",
         'risk_distribution_title': "Rozkład Ocen Ryzyka Oszustwa",
         'fraud_country_distribution_title': "Rozkład Oszustw Według Krajów",
         'fraud_trend_title': "Trendy Oszustw w Czasie",
         'risk_distribution': "Rozkład Ocen Ryzyka Oszustwa",
         'fraud_country_distribution': "Rozkład Oszustw Według Krajów",
-        'heatmap_title': "Heatmapa Oszustw w Czasie",
         'fraud_vs_nonfraud': "Procentowy Podział: Oszustwa vs Bezpieczne",
         'no_data': "Brak dostępnych danych do wyświetlenia.",
         'download_button': "📥 Pobierz dane jako CSV",
@@ -54,10 +56,10 @@ page_translations = {
         'frauds_over_time': "Anzahl der erkannten Betrügereien im Laufe der Zeit",
         'risk_distribution_title': "Verteilung der Betrugsrisikobewertungen",
         'fraud_country_distribution_title': "Betrug nach Ländern",
         'fraud_trend_title': "Betrugstrends im Laufe der Zeit",
         'risk_distribution': "Verteilung der Betrugsrisikobewertungen",
         'fraud_country_distribution': "Betrug nach Ländern",
-        'heatmap_title': "Heatmap der Betrügereien im Laufe der Zeit",
         'fraud_vs_nonfraud': "Prozentanteil: Betrug vs Sichere Nachrichten",
         'no_data': "Keine Daten zur Anzeige verfügbar.",
         'download_button': "📥 Daten als CSV herunterladen",
@@ -76,10 +78,10 @@ page_translations = {
         'frauds_over_time': "Number of Detected Frauds Over Time",
         'risk_distribution_title': "Distribution of Fraud Risk Scores",
         'fraud_country_distribution_title': "Fraud Distribution by Countries",
         'fraud_trend_title': "Fraud Trends Over Time",
         'risk_distribution': "Distribution of Fraud Risk Scores",
         'fraud_country_distribution': "Fraud Distribution by Countries",
-        'heatmap_title': "Fraud Heatmap Over Time",
         'fraud_vs_nonfraud': "Fraud vs Safe Messages Percentage",
         'no_data': "No data available to display.",
         'download_button': "📥 Download data as CSV",
@@ -109,7 +111,7 @@ def save_json(file_path, data):
     """Zapisuje dane do pliku JSON."""
     with open(file_path, 'w', encoding='utf-8') as file:
         json.dump(data, file, ensure_ascii=False, indent=4)
-        logging.info(f"Dane zostały zapisane do {file_path}.")
 def get_stats_from_json():
     """Pobiera statystyki z pliku stats.json."""
@@ -146,26 +148,38 @@ def main(language):
     # Stylizacja kart metryk
     style_metric_cards()
-    # Dodanie interaktywnego filtra daty
-    st.sidebar.header(translations['select_date_range'])
-    start_date = st.sidebar.date_input(
-        "Start Date",
-        value=datetime.now().date() - pd.Timedelta(days=translations['recent_days']),
-        min_value=datetime.now().date() - pd.Timedelta(days=365),
-        max_value=datetime.now().date()
-    )
-    end_date = st.sidebar.date_input(
-        "End Date",
-        value=datetime.now().date(),
-        min_value=start_date,
-        max_value=datetime.now().date()
-    )
-    # Filtracja historii na podstawie daty
     if history:
         df_history = pd.DataFrame(history)
         # Upewnij się, że 'timestamp' jest w formacie datetime
         df_history['timestamp'] = pd.to_datetime(df_history['timestamp'])
         # Filtracja na podstawie daty
         mask = (df_history['timestamp'].dt.date >= start_date) & (df_history['timestamp'].dt.date <= end_date)
         df_filtered = df_history.loc[mask]
@@ -176,10 +190,13 @@ def main(language):
         fraud_percentage_filtered = (frauds_filtered / total_filtered) * 100 if total_filtered > 0 else 0
         # Wyświetlenie metryk dla filtrowanej historii
-        col1, col2, col3 = st.columns(3)
-        col1.metric(label=translations['total_analyses'], value=total_filtered)
-        col2.metric(label=translations['total_frauds_detected'], value=frauds_filtered)
-        col3.metric(label=translations['fraud_percentage'], value=f"{fraud_percentage_filtered:.2f}%")
         # Wizualizacja procentowego podziału oszustw
         st.markdown("### " + translations['fraud_vs_nonfraud'])
@@ -190,6 +207,8 @@ def main(language):
         fig_fraud_pie.update_layout(title_text=translations['fraud_vs_nonfraud'])
         st.plotly_chart(fig_fraud_pie, use_container_width=True)
         # Trend oszustw w czasie
         st.markdown("### " + translations['frauds_over_time'])
         fraud_over_time = df_filtered.groupby(df_filtered['timestamp'].dt.date)['phone_number'].count().reset_index()
@@ -199,6 +218,8 @@ def main(language):
         fig_trend.update_traces(line=dict(color='firebrick'))
         st.plotly_chart(fig_trend, use_container_width=True)
         # Rozkład ocen ryzyka
         st.markdown("### " + translations['risk_distribution_title'])
         def extract_risk_score(risk_assessment):
@@ -213,6 +234,8 @@ def main(language):
                           color='risk_score', color_continuous_scale=px.colors.sequential.RdBu)
         st.plotly_chart(fig_risk, use_container_width=True)
         # Rozkład oszustw według krajów
         st.markdown("### " + translations['fraud_country_distribution_title'])
         def get_country(row):
@@ -241,27 +264,32 @@ def main(language):
         else:
             st.info(translations['no_data'])
-        # Dodatkowe Wizualizacje
         st.markdown("### " + translations['heatmap_title'])
-        # Heatmapa oszustw na podstawie lokalizacji
         if not fraud_countries.empty:
-            # Przygotowanie danych geograficznych za pomocą Plotly bez konieczności ręcznego wprowadzania lat/lon
-            fig_heatmap = px.density_mapbox(
                 fraud_countries,
-                lat=fraud_countries['iso_alpha'].apply(lambda x: pycountry.countries.get(alpha_3=x).latitude if hasattr(pycountry.countries.get(alpha_3=x), 'latitude') else None),
-                lon=fraud_countries['iso_alpha'].apply(lambda x: pycountry.countries.get(alpha_3=x).longitude if hasattr(pycountry.countries.get(alpha_3=x), 'longitude') else None),
-                z='counts',
-                radius=10,
-                center=dict(lat=20, lon=0),
-                zoom=1,
-                mapbox_style="stamen-terrain",
-                title=translations['heatmap_title']
             )
-            fig_heatmap.update_layout(margin={"r":0,"t":50,"l":0,"b":0})
             st.plotly_chart(fig_heatmap, use_container_width=True)
         else:
             st.info(translations['no_data'])
         # Gauge Chart - Procentowy udział oszustw
         st.markdown("### " + translations['fraud_percentage'])
         fig_gauge = go.Figure(go.Indicator(
@@ -286,3 +314,5 @@ def main(language):
             }
         ))
         st.plotly_chart(fig_gauge, use_container_width=True)

 import json
 import os
 import re
+from datetime import datetime, timedelta
 import pycountry
+# Opcjonalne: Importowanie dodatkowych komponentów
 from streamlit_extras.metric_cards import style_metric_cards
+# Jeśli korzystasz z streamlit_elements, upewnij się, że jest zainstalowany
+# from streamlit_elements import elements, mui, html
 # Definiowanie ścieżek do plików JSON
 FAKE_NUMBERS_FILE = os.path.join('data', 'fake_numbers.json')
         'frauds_over_time': "Liczba Wykrytych Oszustw w Czasie",
         'risk_distribution_title': "Rozkład Ocen Ryzyka Oszustwa",
         'fraud_country_distribution_title': "Rozkład Oszustw Według Krajów",
+        'heatmap_title': "Heatmapa Oszustw w Czasie",
         'fraud_trend_title': "Trendy Oszustw w Czasie",
         'risk_distribution': "Rozkład Ocen Ryzyka Oszustwa",
         'fraud_country_distribution': "Rozkład Oszustw Według Krajów",
         'fraud_vs_nonfraud': "Procentowy Podział: Oszustwa vs Bezpieczne",
         'no_data': "Brak dostępnych danych do wyświetlenia.",
         'download_button': "📥 Pobierz dane jako CSV",
         'frauds_over_time': "Anzahl der erkannten Betrügereien im Laufe der Zeit",
         'risk_distribution_title': "Verteilung der Betrugsrisikobewertungen",
         'fraud_country_distribution_title': "Betrug nach Ländern",
+        'heatmap_title': "Heatmap der Betrügereien im Laufe der Zeit",
         'fraud_trend_title': "Betrugstrends im Laufe der Zeit",
         'risk_distribution': "Verteilung der Betrugsrisikobewertungen",
         'fraud_country_distribution': "Betrug nach Ländern",
         'fraud_vs_nonfraud': "Prozentanteil: Betrug vs Sichere Nachrichten",
         'no_data': "Keine Daten zur Anzeige verfügbar.",
         'download_button': "📥 Daten als CSV herunterladen",
         'frauds_over_time': "Number of Detected Frauds Over Time",
         'risk_distribution_title': "Distribution of Fraud Risk Scores",
         'fraud_country_distribution_title': "Fraud Distribution by Countries",
+        'heatmap_title': "Fraud Heatmap Over Time",
         'fraud_trend_title': "Fraud Trends Over Time",
         'risk_distribution': "Distribution of Fraud Risk Scores",
         'fraud_country_distribution': "Fraud Distribution by Countries",
         'fraud_vs_nonfraud': "Fraud vs Safe Messages Percentage",
         'no_data': "No data available to display.",
         'download_button': "📥 Download data as CSV",
     """Zapisuje dane do pliku JSON."""
     with open(file_path, 'w', encoding='utf-8') as file:
         json.dump(data, file, ensure_ascii=False, indent=4)
+        st.success(f"Dane zostały zapisane do {file_path}.")
 def get_stats_from_json():
     """Pobiera statystyki z pliku stats.json."""
     # Stylizacja kart metryk
     style_metric_cards()
+    # Wyświetlenie metryk
+    col1, col2, col3 = st.columns(3)
+    col1.metric(label=translations['total_analyses'], value=total_analyses)
+    col2.metric(label=translations['total_frauds_detected'], value=total_frauds_detected)
+    if total_analyses > 0:
+        fraud_percentage = (total_frauds_detected / total_analyses) * 100
+    else:
+        fraud_percentage = 0  # Ustawienie na 0% w przypadku braku analiz
+    col3.metric(label=translations['fraud_percentage'], value=f"{fraud_percentage:.2f}%")
+    st.markdown("---")
+    # Dodanie interaktywnego filtra daty w głównym obszarze strony
+    st.header(translations['history_title'])
     if history:
         df_history = pd.DataFrame(history)
         # Upewnij się, że 'timestamp' jest w formacie datetime
         df_history['timestamp'] = pd.to_datetime(df_history['timestamp'])
+        # Definiowanie domyślnego zakresu dat
+        default_start_date = datetime.now().date() - timedelta(days=translations['recent_days'])
+        default_end_date = datetime.now().date()
+        # Filtry daty
+        start_date, end_date = st.date_input(
+            translations['select_date_range'],
+            value=(default_start_date, default_end_date),
+            min_value=df_history['timestamp'].dt.date.min(),
+            max_value=df_history['timestamp'].dt.date.max()
+        )
         # Filtracja na podstawie daty
         mask = (df_history['timestamp'].dt.date >= start_date) & (df_history['timestamp'].dt.date <= end_date)
         df_filtered = df_history.loc[mask]
         fraud_percentage_filtered = (frauds_filtered / total_filtered) * 100 if total_filtered > 0 else 0
         # Wyświetlenie metryk dla filtrowanej historii
+        st.subheader(translations['fraud_trend_title'])
+        col4, col5, col6 = st.columns(3)
+        col4.metric(label=translations['total_analyses'], value=total_filtered)
+        col5.metric(label=translations['total_frauds_detected'], value=frauds_filtered)
+        col6.metric(label=translations['fraud_percentage'], value=f"{fraud_percentage_filtered:.2f}%")
+        st.markdown("---")
         # Wizualizacja procentowego podziału oszustw
         st.markdown("### " + translations['fraud_vs_nonfraud'])
         fig_fraud_pie.update_layout(title_text=translations['fraud_vs_nonfraud'])
         st.plotly_chart(fig_fraud_pie, use_container_width=True)
+        st.markdown("---")
         # Trend oszustw w czasie
         st.markdown("### " + translations['frauds_over_time'])
         fraud_over_time = df_filtered.groupby(df_filtered['timestamp'].dt.date)['phone_number'].count().reset_index()
         fig_trend.update_traces(line=dict(color='firebrick'))
         st.plotly_chart(fig_trend, use_container_width=True)
+        st.markdown("---")
         # Rozkład ocen ryzyka
         st.markdown("### " + translations['risk_distribution_title'])
         def extract_risk_score(risk_assessment):
                           color='risk_score', color_continuous_scale=px.colors.sequential.RdBu)
         st.plotly_chart(fig_risk, use_container_width=True)
+        st.markdown("---")
         # Rozkład oszustw według krajów
         st.markdown("### " + translations['fraud_country_distribution_title'])
         def get_country(row):
         else:
             st.info(translations['no_data'])
+        st.markdown("---")
+        # Heatmapa oszustw w czasie (opcjonalnie)
         st.markdown("### " + translations['heatmap_title'])
         if not fraud_countries.empty:
+            # Przygotowanie danych geograficznych
+            # Użyjemy szerokości i długości geograficznej krajów
+            # Tworzenie mapy gęstości oszustw
+            fig_heatmap = px.scatter_geo(
                 fraud_countries,
+                locations='iso_alpha',
+                color='counts',
+                hover_name='country',
+                size='counts',
+                projection="natural earth",
+                title=translations['heatmap_title'],
+                color_continuous_scale=px.colors.sequential.Plasma,
+                size_max=50
             )
+            fig_heatmap.update_geos(showcountries=True, showcoastlines=True, showcountries=True)
             st.plotly_chart(fig_heatmap, use_container_width=True)
         else:
             st.info(translations['no_data'])
+        st.markdown("---")
         # Gauge Chart - Procentowy udział oszustw
         st.markdown("### " + translations['fraud_percentage'])
         fig_gauge = go.Figure(go.Indicator(
             }
         ))
         st.plotly_chart(fig_gauge, use_container_width=True)
+        st.markdown("---")