Spaces:

rafaldembski
/

ScamDetector

Running

App Files Files Community

rafaldembski commited on Sep 30, 2024

Commit

3655f6c

verified ·

1 Parent(s): c3c70ea

Update pages/Statistics.py

Browse files

Files changed (1) hide show

pages/Statistics.py +71 -81

pages/Statistics.py CHANGED Viewed

@@ -1,96 +1,86 @@
 import streamlit as st
 import pandas as pd
 import plotly.express as px
-from utils.functions import get_stats, get_history, is_fake_number
 from datetime import datetime
-# Funkcja do załadowania statystyk
-def load_stats():
-    stats = get_stats()
-    return stats
-# Funkcja do załadowania historii
-def load_history():
-    history = get_history()
-    return pd.DataFrame(history)
-# 1. Statystyki ogólne
-st.markdown("## 📊 Ogólne Statystyki")
-# Ładowanie danych
-stats = load_stats()
-history_df = load_history()
 # Kluczowe metryki
 total_analyses = stats["total_analyses"]
 total_frauds_detected = stats["total_frauds_detected"]
 # Wyświetlenie metryk w poziomych kolumnach
 col1, col2, col3 = st.columns(3)
 col1.metric(label="Liczba przeanalizowanych wiadomości", value=total_analyses)
 col2.metric(label="Wykryte oszustwa", value=total_frauds_detected)
-col3.metric(label="Procent oszustw", value=f"{(total_frauds_detected/total_analyses)*100:.2f}%")
-# 2. Dynamika analiz w czasie
-st.markdown("### 📈 Dynamika analiz w czasie")
-history_df['timestamp'] = pd.to_datetime(history_df['timestamp'])
-history_df['date'] = history_df['timestamp'].dt.date
-# Grupowanie po dacie
-analyses_per_day = history_df.groupby('date').size().reset_index(name='count')
-# Wykres dynamiki analiz
-fig_analyses = px.line(analyses_per_day, x='date', y='count', title='Liczba analiz dziennie', labels={'count':'Liczba analiz', 'date':'Data'})
-st.plotly_chart(fig_analyses, use_container_width=True)
-# 3. Wykryte oszustwa na przestrzeni czasu
-st.markdown("### 🚨 Wykryte oszustwa na przestrzeni czasu")
-history_df['fraud_detected'] = history_df['risk_assessment'].apply(lambda x: 'Tak' if 'wysokie ryzyko' in x else 'Nie')
-frauds_per_day = history_df[history_df['fraud_detected'] == 'Tak'].groupby('date').size().reset_index(name='count')
-# Wykres wykrytych oszustw
-fig_frauds = px.bar(frauds_per_day, x='date', y='count', title='Liczba wykrytych oszustw dziennie', labels={'count':'Liczba oszustw', 'date':'Data'})
-st.plotly_chart(fig_frauds, use_container_width=True)
-# 4. Najczęściej zgłaszane numery
-st.markdown("### 📞 Najczęściej zgłaszane numery jako oszustwa")
-# Grupa zgłoszonych numerów
-fake_numbers_df = history_df[history_df['fraud_detected'] == 'Tak'].groupby('phone_number').size().reset_index(name='count').sort_values(by='count', ascending=False).head(10)
-# Tabela zgłoszonych numerów
-st.table(fake_numbers_df)
-# 5. Kraje i operatorzy telefonii komórkowej związani z oszustwami
-st.markdown("### 🌍 Kraje i operatorzy telefonii komórkowej związani z oszustwami")
-if not history_df.empty:
-    history_df['country'], history_df['operator'] = zip(*history_df['phone_number'].apply(lambda x: get_phone_info(x) if is_fake_number(x) else (None, None)))
-    country_stats = history_df[history_df['country'].notna()].groupby('country').size().reset_index(name='count').sort_values(by='count', ascending=False)
-    # Wykres mapy krajów
-    fig_map = px.choropleth(country_stats, locations='country', locationmode='country names', color='count', title='Liczba zgłoszonych oszustw według kraju')
-    st.plotly_chart(fig_map, use_container_width=True)
-# 6. Średni czas analizy wiadomości
-st.markdown("### ⏱ Średni czas analizy wiadomości")
-history_df['analysis_time'] = (history_df['timestamp'].max() - history_df['timestamp'].min()).seconds
-average_analysis_time = history_df['analysis_time'].mean()
-# Wyświetlenie średniego czasu analizy
-st.metric(label="Średni czas analizy", value=f"{average_analysis_time:.2f} sekund")
-# 7. Statystyki użytkowników
-st.markdown("### 👥 Statystyki użytkowników")
-# Placeholder dla użytkowników, np. statystyk związanych z kontami (jeśli aplikacja ma użytkowników zarejestrowanych)
-st.metric(label="Liczba użytkowników", value="500")  # Zastąp dynamiczną wartością, jeśli dostępna
-# 8. Zgłoszenia numerów jako oszustwa
-st.markdown("### 🚩 Zgłoszenia numerów jako oszustwa")
-reports_per_day = history_df[history_df['fraud_detected'] == 'Tak'].groupby('date').size().reset_index(name='count')
-# Wykres zgłoszeń numerów
-fig_reports = px.bar(reports_per_day, x='date', y='count', title='Liczba zgłoszeń numerów jako oszustwa dziennie', labels={'count':'Liczba zgłoszeń', 'date':'Data'})
-st.plotly_chart(fig_reports, use_container_width=True)
-# 9. Historia analiz
-st.markdown("### 🕑 Historia analizowanych wiadomości")
-st.dataframe(history_df[['timestamp', 'phone_number', 'analysis', 'risk_assessment', 'recommendations']].head(10))

 import streamlit as st
 import pandas as pd
 import plotly.express as px
+import json
 from datetime import datetime
+# Ustawienie konfiguracji strony (należy upewnić się, że nie zostanie to wywołane więcej niż raz)
+st.set_page_config(page_title="📊 Statystyki", page_icon="📈", layout="wide")
+# Funkcja do pobierania statystyk
+def get_stats():
+    stats_file = 'stats.json'
+    try:
+        with open(stats_file, 'r') as f:
+            stats = json.load(f)
+        return stats
+    except (json.JSONDecodeError, FileNotFoundError):
+        return {"total_analyses": 0, "total_frauds_detected": 0}
+# Funkcja do pobierania historii analiz
+def get_history():
+    history_file = 'history.json'
+    try:
+        with open(history_file, 'r') as f:
+            history = json.load(f)
+        return history
+    except (json.JSONDecodeError, FileNotFoundError):
+        return []
+# Pobieranie danych z plików
+stats = get_stats()
+history = get_history()
 # Kluczowe metryki
 total_analyses = stats["total_analyses"]
 total_frauds_detected = stats["total_frauds_detected"]
 # Wyświetlenie metryk w poziomych kolumnach
+st.title("📊 Statystyki Aplikacji")
+st.markdown("Poniżej znajdują się statystyki analizy wiadomości w aplikacji.")
 col1, col2, col3 = st.columns(3)
 col1.metric(label="Liczba przeanalizowanych wiadomości", value=total_analyses)
 col2.metric(label="Wykryte oszustwa", value=total_frauds_detected)
+# Obsługa przypadku, gdy total_analyses jest równe 0
+if total_analyses > 0:
+    fraud_percentage = (total_frauds_detected / total_analyses) * 100
+else:
+    fraud_percentage = 0  # Ustawienie 0% w przypadku braku analiz
+col3.metric(label="Procent oszustw", value=f"{fraud_percentage:.2f}%")
+# Wyświetlenie historii analiz w tabeli
+if history:
+    st.markdown("### Historia analizowanych wiadomości")
+    df_history = pd.DataFrame(history)
+    # Formatowanie daty
+    df_history['timestamp'] = pd.to_datetime(df_history['timestamp'])
+    # Wyświetlenie tabeli historii
+    st.dataframe(df_history[['timestamp', 'phone_number', 'risk_assessment']], height=300)
+    # Wizualizacja liczby analiz w czasie
+    st.markdown("### Liczba analizowanych wiadomości w czasie")
+    df_history['date'] = df_history['timestamp'].dt.date
+    analyses_over_time = df_history.groupby('date').size().reset_index(name='counts')
+    fig_analyses_over_time = px.line(analyses_over_time, x='date', y='counts', title='Liczba analizowanych wiadomości w czasie')
+    st.plotly_chart(fig_analyses_over_time)
+    # Wizualizacja oszustw w czasie
+    st.markdown("### Liczba wykrytych oszustw w czasie")
+    df_history['fraud_detected'] = df_history['risk_assessment'].apply(lambda x: 'Wykryte oszustwo' if '10/10' in x else 'Brak oszustwa')
+    frauds_over_time = df_history.groupby(['date', 'fraud_detected']).size().reset_index(name='counts')
+    fig_frauds_over_time = px.bar(frauds_over_time, x='date', y='counts', color='fraud_detected', title='Wykryte oszustwa w czasie')
+    st.plotly_chart(fig_frauds_over_time)
+else:
+    st.info("Brak dostępnych danych do wyświetlenia.")
+# Wizualizacje ryzyka oszustwa (jeśli są dostępne dane)
+if history:
+    st.markdown("### Rozkład ocen ryzyka oszustwa")
+    df_history['risk_score'] = df_history['risk_assessment'].apply(lambda x: int(x.split('/')[0]) if '/' in x else 0)
+    fig_risk_distribution = px.histogram(df_history, x='risk_score', nbins=10, title='Rozkład ocen ryzyka oszustwa (1-10)')
+    st.plotly_chart(fig_risk_distribution)