Spaces:

rafaldembski
/

ScamDetector

Running

App Files Files Community

rafaldembski commited on Sep 30, 2024

Commit

fe1d0fa

verified ·

1 Parent(s): d37eea1

Update pages/Statistics.py

Browse files

Files changed (1) hide show

pages/Statistics.py +39 -5

pages/Statistics.py CHANGED Viewed

@@ -1,6 +1,7 @@
 import streamlit as st
 import pandas as pd
 import plotly.express as px
 import json
 import re
 from datetime import datetime
@@ -18,6 +19,9 @@ page_translations = {
         'history_title': "Historia analizowanych wiadomości",
         'frauds_over_time': "Liczba wykrytych oszustw w czasie",
         'risk_distribution': "Rozkład ocen ryzyka oszustwa",
         'no_data': "Brak dostępnych danych do wyświetlenia."
     },
     'German': {
@@ -31,6 +35,9 @@ page_translations = {
         'history_title': "Analyseverlauf der Nachrichten",
         'frauds_over_time': "Anzahl der erkannten Betrügereien im Laufe der Zeit",
         'risk_distribution': "Verteilung der Betrugsrisikobewertungen",
         'no_data': "Keine Daten zur Anzeige verfügbar."
     },
     'English': {
@@ -44,6 +51,9 @@ page_translations = {
         'history_title': "History of Analyzed Messages",
         'frauds_over_time': "Number of Detected Frauds Over Time",
         'risk_distribution': "Distribution of Fraud Risk Scores",
         'no_data': "No data available to display."
     }
 }
@@ -96,6 +106,13 @@ def main(language):
     col3.metric(label=translations['fraud_percentage'], value=f"{fraud_percentage:.2f}%")
     # Wyświetlenie historii analiz w tabeli
     if history:
         st.markdown(f"### {translations['history_title']}")
@@ -114,11 +131,8 @@ def main(language):
         frauds_over_time = df_history.groupby(['date', 'fraud_detected']).size().reset_index(name='counts')
         fig_frauds_over_time = px.bar(frauds_over_time, x='date', y='counts', color='fraud_detected', title=translations['frauds_over_time'])
         st.plotly_chart(fig_frauds_over_time)
-    else:
-        st.info(translations['no_data'])
-    # Wizualizacje ryzyka oszustwa (jeśli są dostępne dane)
-    if history:
         st.markdown(f"### {translations['risk_distribution']}")
         # Użycie wyrażenia regularnego do wyodrębnienia liczby z tekstu oceny ryzyka
@@ -127,5 +141,25 @@ def main(language):
             return int(match.group(1)) if match else 0
         df_history['risk_score'] = df_history['risk_assessment'].apply(extract_risk_score)
-        fig_risk_distribution = px.histogram(df_history, x='risk_score', nbins=10, title=translations['risk_distribution'])
         st.plotly_chart(fig_risk_distribution)

 import streamlit as st
 import pandas as pd
 import plotly.express as px
+import plotly.graph_objects as go
 import json
 import re
 from datetime import datetime
         'history_title': "Historia analizowanych wiadomości",
         'frauds_over_time': "Liczba wykrytych oszustw w czasie",
         'risk_distribution': "Rozkład ocen ryzyka oszustwa",
+        'fraud_country_distribution': "Rozkład oszustw według krajów",
+        'heatmap_title': "Mapa ciepła oszustw w czasie",
+        'fraud_vs_nonfraud': "Procentowy podział: Oszustwa vs Bezpieczne",
         'no_data': "Brak dostępnych danych do wyświetlenia."
     },
     'German': {
         'history_title': "Analyseverlauf der Nachrichten",
         'frauds_over_time': "Anzahl der erkannten Betrügereien im Laufe der Zeit",
         'risk_distribution': "Verteilung der Betrugsrisikobewertungen",
+        'fraud_country_distribution': "Betrug nach Ländern",
+        'heatmap_title': "Heatmap der Betrügereien im Laufe der Zeit",
+        'fraud_vs_nonfraud': "Prozentanteil: Betrug vs Sichere Nachrichten",
         'no_data': "Keine Daten zur Anzeige verfügbar."
     },
     'English': {
         'history_title': "History of Analyzed Messages",
         'frauds_over_time': "Number of Detected Frauds Over Time",
         'risk_distribution': "Distribution of Fraud Risk Scores",
+        'fraud_country_distribution': "Fraud Distribution by Countries",
+        'heatmap_title': "Fraud Heatmap Over Time",
+        'fraud_vs_nonfraud': "Fraud vs Safe Messages Percentage",
         'no_data': "No data available to display."
     }
 }
     col3.metric(label=translations['fraud_percentage'], value=f"{fraud_percentage:.2f}%")
+    # Wizualizacja procentowego podziału oszustw
+    fraud_data = [total_frauds_detected, total_analyses - total_frauds_detected]
+    fraud_labels = ['Fraud', 'Non-Fraud']
+    fig_fraud_pie = go.Figure(data=[go.Pie(labels=fraud_labels, values=fraud_data, hole=.3)])
+    fig_fraud_pie.update_layout(title_text=translations['fraud_vs_nonfraud'])
+    st.plotly_chart(fig_fraud_pie)
     # Wyświetlenie historii analiz w tabeli
     if history:
         st.markdown(f"### {translations['history_title']}")
         frauds_over_time = df_history.groupby(['date', 'fraud_detected']).size().reset_index(name='counts')
         fig_frauds_over_time = px.bar(frauds_over_time, x='date', y='counts', color='fraud_detected', title=translations['frauds_over_time'])
         st.plotly_chart(fig_frauds_over_time)
+        # Wizualizacja rozkładu ocen ryzyka oszustwa
         st.markdown(f"### {translations['risk_distribution']}")
         # Użycie wyrażenia regularnego do wyodrębnienia liczby z tekstu oceny ryzyka
             return int(match.group(1)) if match else 0
         df_history['risk_score'] = df_history['risk_assessment'].apply(extract_risk_score)
+        fig_risk_distribution = px.histogram(df_history, x='risk_score', nbins=10, title=translations['risk_distribution'], color_discrete_sequence=['#FFA07A'])
         st.plotly_chart(fig_risk_distribution)
+        # Wizualizacja mapy ciepła
+        st.markdown(f"### {translations['heatmap_title']}")
+        heatmap_data = df_history.groupby('date').size().reset_index(name='count')
+        fig_heatmap = px.density_heatmap(heatmap_data, x='date', y='count', nbinsx=20, nbinsy=20, title=translations['heatmap_title'])
+        st.plotly_chart(fig_heatmap)
+        # Dodanie mapy Europy (wymaga danych krajów dla numerów telefonów)
+        st.markdown(f"### {translations['fraud_country_distribution']}")
+        if 'country' in df_history.columns:
+            country_data = df_history.groupby('country').size().reset_index(name='counts')
+            fig_map = px.choropleth(country_data, locations='country', locationmode='country names', color='counts',
+                                    title=translations['fraud_country_distribution'], color_continuous_scale='Viridis')
+            st.plotly_chart(fig_map)
+        else:
+            st.info("Brak danych o krajach numerów telefonów.")
+    else:
+        st.info(translations['no_data'])
+# Nie dodawaj "if __name__ == '__main__':" w podstronach