Spaces:
Sleeping
Sleeping
# مجموعات البيانات | |
يحتوي هذا المجلد على مجموعات البيانات المستخدمة لتدريب نماذج التعلم الآلي في نظام تسعير المناقصات. | |
## المجموعات المتوفرة | |
- `cost_data.csv`: بيانات تكاليف المشاريع السابقة | |
- `risk_data.csv`: بيانات المخاطر وتأثيراتها | |
- `local_content_data.csv`: بيانات المحتوى المحلي | |
- `documents_data.csv`: بيانات المستندات المصنفة | |
- `entities_data.csv`: بيانات الكيانات المستخرجة | |
## هيكل مجموعات البيانات | |
### cost_data.csv | |
بيانات تكاليف المشاريع السابقة مع خصائص كل مشروع: | |
| العمود | الوصف | النوع | | |
|--------|-------|------| | |
| project_id | رقم المشروع | نص | | |
| project_type | نوع المشروع | نص | | |
| location | الموقع | نص | | |
| area | المساحة (م²) | رقم | | |
| floors | عدد الطوابق | رقم | | |
| duration_months | مدة التنفيذ (شهور) | رقم | | |
| tender_type | نوع المناقصة | نص | | |
| client_type | نوع العميل | نص | | |
| total_cost | إجمالي التكلفة | رقم | | |
| cost_per_sqm | تكلفة المتر المربع | رقم | | |
| material_cost | تكلفة المواد | رقم | | |
| labor_cost | تكلفة العمالة | رقم | | |
| equipment_cost | تكلفة المعدات | رقم | | |
| overhead_percentage | نسبة المصاريف العامة | رقم | | |
### risk_data.csv | |
بيانات المخاطر وتأثيراتها: | |
| العمود | الوصف | النوع | | |
|--------|-------|------| | |
| risk_id | رقم المخاطرة | نص | | |
| project_id | رقم المشروع | نص | | |
| risk_category | فئة المخاطرة | نص | | |
| risk_description | وصف المخاطرة | نص | | |
| impact | التأثير | نص | | |
| probability | الاحتمالية | نص | | |
| risk_score | درجة المخاطرة | رقم | | |
| response_strategy | استراتيجية الاستجابة | نص | | |
| actual_impact | التأثير الفعلي | نص | | |
| actual_cost | التكلفة الفعلية | رقم | | |
## الإحصاءات | |
- عدد المشاريع: 500+ | |
- الفترة الزمنية: 2018-2024 | |
- التوزيع الجغرافي: جميع مناطق المملكة العربية السعودية | |
## الترخيص والقيود | |
هذه البيانات للاستخدام الداخلي فقط ولا يجوز مشاركتها خارج الشركة. |