"""
خدمة التنبؤ بالأسعار
"""

import pandas as pd
import numpy as np
import joblib
import os
from datetime import datetime, timedelta
from sklearn.ensemble import RandomForestRegressor
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

import config


class PricePrediction:
    """خدمة التنبؤ بالأسعار باستخدام التعلم الآلي"""
    
    def __init__(self):
        """تهيئة خدمة التنبؤ بالأسعار"""
        self.model_path = config.PRICE_PREDICTION_MODEL
        self.model = self._load_model()
        self.scaler = None
        self.materials_data = self._load_materials_data()
        self.market_indices = self._load_market_indices()
    
    def _load_model(self):
        """تحميل نموذج التنبؤ المدرب مسبقاً"""
        try:
            if os.path.exists(self.model_path):
                model = joblib.load(self.model_path)
                return model
            else:
                # إذا لم يكن النموذج موجوداً، قم بإنشاء نموذج جديد
                model = RandomForestRegressor(
                    n_estimators=100,
                    max_depth=15,
                    min_samples_split=5,
                    min_samples_leaf=2,
                    random_state=42
                )
                return model
        except Exception as e:
            print(f"خطأ في تحميل نموذج التنبؤ: {str(e)}")
            return RandomForestRegressor(random_state=42)
    
    def _load_materials_data(self):
        """تحميل بيانات المواد وأسعارها التاريخية"""
        # محاكاة تحميل البيانات من مصدر بيانات
        materials_data = {
            'خرسانة': {
                'تاريخ': [datetime(2025, 1, 1) - timedelta(days=30*i) for i in range(12)],
                'سعر': [750, 740, 735, 730, 720, 715, 710, 700, 695, 690, 685, 680],
                'وحدة': 'م3'
            },
            'حديد تسليح': {
                'تاريخ': [datetime(2025, 1, 1) - timedelta(days=30*i) for i in range(12)],
                'سعر': [5500, 5450, 5400, 5350, 5300, 5250, 5200, 5150, 5100, 5050, 5000, 4950],
                'وحدة': 'طن'
            },
            'إسمنت': {
                'تاريخ': [datetime(2025, 1, 1) - timedelta(days=30*i) for i in range(12)],
                'سعر': [25, 25, 24.5, 24.5, 24, 24, 23.5, 23.5, 23, 23, 22.5, 22.5],
                'وحدة': 'كيس'
            },
            'رمل': {
                'تاريخ': [datetime(2025, 1, 1) - timedelta(days=30*i) for i in range(12)],
                'سعر': [140, 140, 135, 135, 130, 130, 125, 125, 120, 120, 115, 115],
                'وحدة': 'م3'
            },
            'بلوك خرساني': {
                'تاريخ': [datetime(2025, 1, 1) - timedelta(days=30*i) for i in range(12)],
                'سعر': [11, 11, 10.5, 10.5, 10, 10, 9.5, 9.5, 9, 9, 8.5, 8.5],
                'وحدة': 'قطعة'
            }
        }
        return materials_data
    
    def _load_market_indices(self):
        """تحميل مؤشرات السوق المؤثرة على الأسعار"""
        # محاكاة تحميل البيانات من مصدر بيانات
        market_indices = {
            'تاريخ': [datetime(2025, 1, 1) - timedelta(days=30*i) for i in range(12)],
            'مؤشر_البناء': [105, 104, 103, 102, 101, 100, 99, 98, 97, 96, 95, 94],
            'مؤشر_النفط': [80, 79, 78, 77, 76, 75, 74, 73, 72, 71, 70, 69],
            'مؤشر_سعر_الصرف': [3.75, 3.75, 3.75, 3.75, 3.75, 3.75, 3.75, 3.75, 3.75, 3.75, 3.75, 3.75],
            'مؤشر_التضخم': [2.5, 2.4, 2.3, 2.2, 2.1, 2.0, 1.9, 1.8, 1.7, 1.6, 1.5, 1.4]
        }
        return market_indices
    
    def train(self, training_data=None):
        """
        تدريب نموذج التنبؤ بالأسعار
        
        المعلمات:
            training_data: بيانات التدريب (اختياري)، إذا لم يتم توفيرها سيتم استخدام البيانات المتاحة
        
        إرجاع:
            مؤشرات أداء النموذج
        """
        # تجهيز بيانات التدريب
        if training_data is None:
            # استخدام البيانات المتاحة لتوليد مجموعة تدريب
            X, y = self._prepare_training_data()
        else:
            X, y = self._extract_features_target(training_data)
        
        # تقسيم البيانات إلى تدريب واختبار
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42)
        
        # تطبيع البيانات
        self.scaler = StandardScaler()
        X_train_scaled = self.scaler.fit_transform(X_train)
        X_test_scaled = self.scaler.transform(X_test)
        
        # تدريب النموذج
        self.model.fit(X_train_scaled, y_train)
        
        # تقييم النموذج
        y_pred = self.model.predict(X_test_scaled)
        
        # حساب مؤشرات الأداء
        mae = mean_absolute_error(y_test, y_pred)
        rmse = np.sqrt(mean_squared_error(y_test, y_pred))
        r2 = r2_score(y_test, y_pred)
        
        # حفظ النموذج
        try:
            joblib.dump(self.model, self.model_path)
            joblib.dump(self.scaler, os.path.join(os.path.dirname(self.model_path), 'price_scaler.pkl'))
        except Exception as e:
            print(f"خطأ في حفظ النموذج: {str(e)}")
        
        return {
            'mae': mae,
            'rmse': rmse,
            'r2': r2
        }
    
    def _prepare_training_data(self):
        """تجهيز بيانات التدريب من البيانات المتاحة"""
        # توليد بيانات تدريب افتراضية
        data = []
        target = []
        
        # استخدام بيانات المواد وأسعارها التاريخية
        for material_name, material_info in self.materials_data.items():
            for i in range(len(material_info['تاريخ'])):
                # استخراج المؤشرات في التاريخ المقابل
                date_index = self.market_indices['تاريخ'].index(material_info['تاريخ'][i]) if material_info['تاريخ'][i] in self.market_indices['تاريخ'] else 0
                
                # تكوين ميزات التدريب (المؤشرات السوقية والشهر)
                features = [
                    material_info['تاريخ'][i].month,  # الشهر
                    self.market_indices['مؤشر_البناء'][date_index],
                    self.market_indices['مؤشر_النفط'][date_index],
                    self.market_indices['مؤشر_سعر_الصرف'][date_index],
                    self.market_indices['مؤشر_التضخم'][date_index]
                ]
                
                # إضافة معرّف للمادة (تمثيل رقمي)
                material_id = list(self.materials_data.keys()).index(material_name)
                features.append(material_id)
                
                data.append(features)
                target.append(material_info['سعر'][i])
                
                # إضافة ضوضاء عشوائية لزيادة حجم البيانات
                for _ in range(5):
                    noisy_features = features.copy()
                    for j in range(1, 5):  # إضافة ضوضاء للمؤشرات فقط
                        noisy_features[j] += np.random.normal(0, 0.5)
                    
                    noisy_price = material_info['سعر'][i] * (1 + np.random.normal(0, 0.02))  # ضوضاء 2%
                    
                    data.append(noisy_features)
                    target.append(noisy_price)
        
        return np.array(data), np.array(target)
    
    def _extract_features_target(self, training_data):
        """استخراج الميزات والأهداف من بيانات التدريب"""
        # استخراج الميزات والأهداف من البيانات المقدمة
        features = []
        target = []
        
        for item in training_data:
            features.append([
                item['date'].month,  # الشهر
                item['building_index'],
                item['oil_index'],
                item['exchange_rate'],
                item['inflation_rate'],
                item['material_id']
            ])
            target.append(item['price'])
        
        return np.array(features), np.array(target)
    
    def predict_prices(self, materials, prediction_date=None, market_conditions=None):
        """
        التنبؤ بأسعار المواد
        
        المعلمات:
            materials: قائمة المواد المطلوب التنبؤ بأسعارها
            prediction_date: تاريخ التنبؤ (اختياري)، إذا لم يتم توفيره سيتم استخدام التاريخ الحالي
            market_conditions: ظروف السوق (اختياري)، إذا لم يتم توفيرها سيتم استخدام آخر قيم متاحة
        
        إرجاع:
            قاموس بأسعار المواد المتنبأ بها
        """
        if prediction_date is None:
            prediction_date = datetime.now()
        
        if market_conditions is None:
            # استخدام آخر قيم متاحة للمؤشرات
            market_conditions = {
                'مؤشر_البناء': self.market_indices['مؤشر_البناء'][0],
                'مؤشر_النفط': self.market_indices['مؤشر_النفط'][0],
                'مؤشر_سعر_الصرف': self.market_indices['مؤشر_سعر_الصرف'][0],
                'مؤشر_التضخم': self.market_indices['مؤشر_التضخم'][0]
            }
        
        # التحقق من وجود المواد في البيانات
        material_names = list(self.materials_data.keys())
        valid_materials = [m for m in materials if m in material_names]
        
        if not valid_materials:
            return {}
        
        # تحميل المعايير إذا كانت متوفرة
        scaler_path = os.path.join(os.path.dirname(self.model_path), 'price_scaler.pkl')
        if self.scaler is None and os.path.exists(scaler_path):
            try:
                self.scaler = joblib.load(scaler_path)
            except Exception as e:
                print(f"خطأ في تحميل المعايير: {str(e)}")
                # إنشاء معايير جديدة
                X, _ = self._prepare_training_data()
                self.scaler = StandardScaler()
                self.scaler.fit(X)
        
        # إعداد ميزات التنبؤ
        features = []
        for material in valid_materials:
            material_id = material_names.index(material)
            
            material_features = [
                prediction_date.month,  # الشهر
                market_conditions['مؤشر_البناء'],
                market_conditions['مؤشر_النفط'],
                market_conditions['مؤشر_سعر_الصرف'],
                market_conditions['مؤشر_التضخم'],
                material_id
            ]
            
            features.append(material_features)
        
        # تطبيع الميزات
        if self.scaler is not None:
            features_scaled = self.scaler.transform(features)
        else:
            features_scaled = features
        
        # التنبؤ بالأسعار
        predicted_prices = self.model.predict(features_scaled)
        
        # إرجاع النتائج
        results = {}
        for i, material in enumerate(valid_materials):
            # تطبيق عامل تصحيح (2% عشوائية)
            correction_factor = 1.0 + np.random.uniform(-0.02, 0.02)
            price = max(0, predicted_prices[i] * correction_factor)
            
            results[material] = {
                'سعر': price,
                'وحدة': self.materials_data[material]['وحدة'],
                'تاريخ_التنبؤ': prediction_date.strftime('%Y-%m-%d'),
                'هامش_الخطأ': '±5%'  # تقدير هامش الخطأ
            }
        
        return results
    
    def get_price_trends(self, material, periods=6):
        """
        الحصول على اتجاهات الأسعار المستقبلية
        
        المعلمات:
            material: المادة المطلوب التنبؤ باتجاهات أسعارها
            periods: عدد الفترات المستقبلية (الشهور)
        
        إرجاع:
            قائمة بالأسعار المتوقعة للفترات المستقبلية
        """
        if material not in self.materials_data:
            return []
        
        # الحصول على التاريخ الحالي
        current_date = datetime.now()
        
        # التنبؤ بالأسعار للفترات المستقبلية
        price_trends = []
        
        for i in range(periods):
            prediction_date = current_date + timedelta(days=30 * (i + 1))
            
            # افتراض تغيرات طفيفة في المؤشرات مع مرور الوقت
            market_conditions = {
                'مؤشر_البناء': self.market_indices['مؤشر_البناء'][0] * (1 + 0.01 * i),  # زيادة 1% شهرياً
                'مؤشر_النفط': self.market_indices['مؤشر_النفط'][0] * (1 + 0.005 * i),  # زيادة 0.5% شهرياً
                'مؤشر_سعر_الصرف': self.market_indices['مؤشر_سعر_الصرف'][0],  # ثابت
                'مؤشر_التضخم': self.market_indices['مؤشر_التضخم'][0] * (1 + 0.01 * i)  # زيادة 1% شهرياً
            }
            
            # التنبؤ بالسعر
            predicted_price = self.predict_prices([material], prediction_date, market_conditions)
            
            price_trends.append({
                'تاريخ': prediction_date.strftime('%Y-%m'),
                'سعر': predicted_price[material]['سعر'] if material in predicted_price else 0
            })
        
        return price_trends
    
    def analyze_factors(self, material):
        """
        تحليل العوامل المؤثرة على سعر المادة
        
        المعلمات:
            material: المادة المطلوب تحليلها
        
        إرجاع:
            قاموس بالعوامل المؤثرة وأهميتها النسبية
        """
        if material not in self.materials_data or not hasattr(self.model, 'feature_importances_'):
            return {}
        
        # الحصول على أهمية الميزات من النموذج
        feature_importances = self.model.feature_importances_
        
        # أسماء الميزات
        feature_names = ['الشهر', 'مؤشر البناء', 'مؤشر النفط', 'سعر الصرف', 'معدل التضخم', 'نوع المادة']
        
        # ترتيب الميزات حسب الأهمية
        importance_pairs = [(name, importance) for name, importance in zip(feature_names, feature_importances)]
        importance_pairs.sort(key=lambda x: x[1], reverse=True)
        
        # إرجاع العوامل المؤثرة وأهميتها
        factors = {}
        for name, importance in importance_pairs:
            factors[name] = round(importance * 100, 2)  # تحويل إلى نسبة مئوية
        
        return {
            'العوامل_المؤثرة': factors,
            'المادة': material,
            'وحدة': self.materials_data[material]['وحدة'],
            'سعر_حالي': self.materials_data[material]['سعر'][0],
            'اتجاه_السعر': self._get_price_trend(material)
        }
    
    def _get_price_trend(self, material):
        """تحديد اتجاه سعر المادة بناءً على البيانات التاريخية"""
        if material not in self.materials_data:
            return "غير معروف"
        
        prices = self.materials_data[material]['سعر']
        if len(prices) < 2:
            return "غير معروف"
        
        # حساب متوسط التغير الشهري
        price_changes = [(prices[i] - prices[i+1]) / prices[i+1] * 100 for i in range(len(prices)-1)]
        avg_monthly_change = sum(price_changes) / len(price_changes)
        
        if avg_monthly_change > 1:
            return "ارتفاع حاد"
        elif avg_monthly_change > 0.2:
            return "ارتفاع معتدل"
        elif avg_monthly_change > -0.2:
            return "استقرار"
        elif avg_monthly_change > -1:
            return "انخفاض معتدل"
        else:
            return "انخفاض حاد"
    
    def export_price_forecast(self, materials, periods=6, output_file=None):
        """
        تصدير توقعات الأسعار إلى ملف
        
        المعلمات:
            materials: قائمة المواد المطلوب التنبؤ بأسعارها
            periods: عدد الفترات المستقبلية (الشهور)
            output_file: مسار ملف الإخراج (اختياري)
        
        إرجاع:
            مسار الملف المصدر أو البيانات مباشرة إذا لم يتم تحديد ملف
        """
        # التحقق من وجود المواد في البيانات
        valid_materials = [m for m in materials if m in self.materials_data]
        
        if not valid_materials:
            return None
        
        # إعداد بيانات التوقعات
        forecast_data = []
        
        for material in valid_materials:
            # الحصول على اتجاهات الأسعار
            price_trends = self.get_price_trends(material, periods)
            
            for trend in price_trends:
                forecast_data.append({
                    'المادة': material,
                    'الوحدة': self.materials_data[material]['وحدة'],
                    'التاريخ': trend['تاريخ'],
                    'السعر المتوقع': trend['سعر'],
                    'هامش الخطأ': '±5%'
                })
        
        # تحويل البيانات إلى DataFrame
        forecast_df = pd.DataFrame(forecast_data)
        
        # تصدير البيانات إلى ملف إذا تم تحديده
        if output_file:
            try:
                ext = os.path.splitext(output_file)[1].lower()
                
                if ext == '.csv':
                    forecast_df.to_csv(output_file, index=False, encoding='utf-8-sig')
                elif ext in ['.xlsx', '.xls']:
                    forecast_df.to_excel(output_file, index=False)
                elif ext == '.json':
                    forecast_df.to_json(output_file, orient='records', force_ascii=False)
                else:
                    print(f"تنسيق غير مدعوم: {ext}")
                    return None
                
                return output_file
            except Exception as e:
                print(f"خطأ في تصدير توقعات الأسعار: {str(e)}")
                return None
        
        return forecast_df