# مجموعات البيانات يحتوي هذا المجلد على مجموعات البيانات المستخدمة لتدريب نماذج التعلم الآلي في نظام تسعير المناقصات. ## المجموعات المتوفرة - `cost_data.csv`: بيانات تكاليف المشاريع السابقة - `risk_data.csv`: بيانات المخاطر وتأثيراتها - `local_content_data.csv`: بيانات المحتوى المحلي - `documents_data.csv`: بيانات المستندات المصنفة - `entities_data.csv`: بيانات الكيانات المستخرجة ## هيكل مجموعات البيانات ### cost_data.csv بيانات تكاليف المشاريع السابقة مع خصائص كل مشروع: | العمود | الوصف | النوع | |--------|-------|------| | project_id | رقم المشروع | نص | | project_type | نوع المشروع | نص | | location | الموقع | نص | | area | المساحة (م²) | رقم | | floors | عدد الطوابق | رقم | | duration_months | مدة التنفيذ (شهور) | رقم | | tender_type | نوع المناقصة | نص | | client_type | نوع العميل | نص | | total_cost | إجمالي التكلفة | رقم | | cost_per_sqm | تكلفة المتر المربع | رقم | | material_cost | تكلفة المواد | رقم | | labor_cost | تكلفة العمالة | رقم | | equipment_cost | تكلفة المعدات | رقم | | overhead_percentage | نسبة المصاريف العامة | رقم | ### risk_data.csv بيانات المخاطر وتأثيراتها: | العمود | الوصف | النوع | |--------|-------|------| | risk_id | رقم المخاطرة | نص | | project_id | رقم المشروع | نص | | risk_category | فئة المخاطرة | نص | | risk_description | وصف المخاطرة | نص | | impact | التأثير | نص | | probability | الاحتمالية | نص | | risk_score | درجة المخاطرة | رقم | | response_strategy | استراتيجية الاستجابة | نص | | actual_impact | التأثير الفعلي | نص | | actual_cost | التكلفة الفعلية | رقم | ## الإحصاءات - عدد المشاريع: 500+ - الفترة الزمنية: 2018-2024 - التوزيع الجغرافي: جميع مناطق المملكة العربية السعودية ## الترخيص والقيود هذه البيانات للاستخدام الداخلي فقط ولا يجوز مشاركتها خارج الشركة.