Spaces:

rafaldembski
/

ScamDetector

Running

App Files Files Community

rafaldembski commited on Sep 30, 2024

Commit

8deec8b

verified ·

1 Parent(s): b3eb2dd

Update pages/Statistics.py

Browse files

Files changed (1) hide show

pages/Statistics.py +8 -11

pages/Statistics.py CHANGED Viewed

@@ -2,6 +2,7 @@ import streamlit as st
 import pandas as pd
 import plotly.express as px
 import json
 from datetime import datetime
 # Definiowanie tłumaczeń dla zakładki "Statystyki"
@@ -15,7 +16,6 @@ page_translations = {
         'total_frauds_detected': "Wykryte oszustwa",
         'fraud_percentage': "Procent oszustw",
         'history_title': "Historia analizowanych wiadomości",
-        'analyses_over_time': "Liczba analizowanych wiadomości w czasie",
         'frauds_over_time': "Liczba wykrytych oszustw w czasie",
         'risk_distribution': "Rozkład ocen ryzyka oszustwa",
         'no_data': "Brak dostępnych danych do wyświetlenia."
@@ -29,7 +29,6 @@ page_translations = {
         'total_frauds_detected': "Erkannte Betrügereien",
         'fraud_percentage': "Betrugsprozentsatz",
         'history_title': "Analyseverlauf der Nachrichten",
-        'analyses_over_time': "Anzahl der analysierten Nachrichten im Laufe der Zeit",
         'frauds_over_time': "Anzahl der erkannten Betrügereien im Laufe der Zeit",
         'risk_distribution': "Verteilung der Betrugsrisikobewertungen",
         'no_data': "Keine Daten zur Anzeige verfügbar."
@@ -43,7 +42,6 @@ page_translations = {
         'total_frauds_detected': "Frauds Detected",
         'fraud_percentage': "Fraud Percentage",
         'history_title': "History of Analyzed Messages",
-        'analyses_over_time': "Number of Analyzed Messages Over Time",
         'frauds_over_time': "Number of Detected Frauds Over Time",
         'risk_distribution': "Distribution of Fraud Risk Scores",
         'no_data': "No data available to display."
@@ -109,13 +107,6 @@ def main(language):
         # Wyświetlenie tabeli historii
         st.dataframe(df_history[['timestamp', 'phone_number', 'risk_assessment']], height=300)
-        # Wizualizacja liczby analiz w czasie
-        st.markdown(f"### {translations['analyses_over_time']}")
-        df_history['date'] = df_history['timestamp'].dt.date
-        analyses_over_time = df_history.groupby('date').size().reset_index(name='counts')
-        fig_analyses_over_time = px.line(analyses_over_time, x='date', y='counts', title=translations['analyses_over_time'])
-        st.plotly_chart(fig_analyses_over_time)
         # Wizualizacja oszustw w czasie
         st.markdown(f"### {translations['frauds_over_time']}")
         df_history['fraud_detected'] = df_history['risk_assessment'].apply(lambda x: 'Detected Fraud' if '10/10' in x else 'No Fraud')
@@ -128,6 +119,12 @@ def main(language):
     # Wizualizacje ryzyka oszustwa (jeśli są dostępne dane)
     if history:
         st.markdown(f"### {translations['risk_distribution']}")
-        df_history['risk_score'] = df_history['risk_assessment'].apply(lambda x: int(x.split('/')[0]) if '/' in x else 0)
         fig_risk_distribution = px.histogram(df_history, x='risk_score', nbins=10, title=translations['risk_distribution'])
         st.plotly_chart(fig_risk_distribution)

 import pandas as pd
 import plotly.express as px
 import json
+import re
 from datetime import datetime
 # Definiowanie tłumaczeń dla zakładki "Statystyki"
         'total_frauds_detected': "Wykryte oszustwa",
         'fraud_percentage': "Procent oszustw",
         'history_title': "Historia analizowanych wiadomości",
         'frauds_over_time': "Liczba wykrytych oszustw w czasie",
         'risk_distribution': "Rozkład ocen ryzyka oszustwa",
         'no_data': "Brak dostępnych danych do wyświetlenia."
         'total_frauds_detected': "Erkannte Betrügereien",
         'fraud_percentage': "Betrugsprozentsatz",
         'history_title': "Analyseverlauf der Nachrichten",
         'frauds_over_time': "Anzahl der erkannten Betrügereien im Laufe der Zeit",
         'risk_distribution': "Verteilung der Betrugsrisikobewertungen",
         'no_data': "Keine Daten zur Anzeige verfügbar."
         'total_frauds_detected': "Frauds Detected",
         'fraud_percentage': "Fraud Percentage",
         'history_title': "History of Analyzed Messages",
         'frauds_over_time': "Number of Detected Frauds Over Time",
         'risk_distribution': "Distribution of Fraud Risk Scores",
         'no_data': "No data available to display."
         # Wyświetlenie tabeli historii
         st.dataframe(df_history[['timestamp', 'phone_number', 'risk_assessment']], height=300)
         # Wizualizacja oszustw w czasie
         st.markdown(f"### {translations['frauds_over_time']}")
         df_history['fraud_detected'] = df_history['risk_assessment'].apply(lambda x: 'Detected Fraud' if '10/10' in x else 'No Fraud')
     # Wizualizacje ryzyka oszustwa (jeśli są dostępne dane)
     if history:
         st.markdown(f"### {translations['risk_distribution']}")
+        # Użycie wyrażenia regularnego do wyodrębnienia liczby z tekstu oceny ryzyka
+        def extract_risk_score(risk_assessment):
+            match = re.search(r'(\d+)/10', risk_assessment)
+            return int(match.group(1)) if match else 0
+        df_history['risk_score'] = df_history['risk_assessment'].apply(extract_risk_score)
         fig_risk_distribution = px.histogram(df_history, x='risk_score', nbins=10, title=translations['risk_distribution'])
         st.plotly_chart(fig_risk_distribution)