v3 / models /datasets /README.md
EGYADMIN's picture
Upload 115 files
82676b8 verified
# مجموعات البيانات
يحتوي هذا المجلد على مجموعات البيانات المستخدمة لتدريب نماذج التعلم الآلي في نظام تسعير المناقصات.
## المجموعات المتوفرة
- `cost_data.csv`: بيانات تكاليف المشاريع السابقة
- `risk_data.csv`: بيانات المخاطر وتأثيراتها
- `local_content_data.csv`: بيانات المحتوى المحلي
- `documents_data.csv`: بيانات المستندات المصنفة
- `entities_data.csv`: بيانات الكيانات المستخرجة
## هيكل مجموعات البيانات
### cost_data.csv
بيانات تكاليف المشاريع السابقة مع خصائص كل مشروع:
| العمود | الوصف | النوع |
|--------|-------|------|
| project_id | رقم المشروع | نص |
| project_type | نوع المشروع | نص |
| location | الموقع | نص |
| area | المساحة (م²) | رقم |
| floors | عدد الطوابق | رقم |
| duration_months | مدة التنفيذ (شهور) | رقم |
| tender_type | نوع المناقصة | نص |
| client_type | نوع العميل | نص |
| total_cost | إجمالي التكلفة | رقم |
| cost_per_sqm | تكلفة المتر المربع | رقم |
| material_cost | تكلفة المواد | رقم |
| labor_cost | تكلفة العمالة | رقم |
| equipment_cost | تكلفة المعدات | رقم |
| overhead_percentage | نسبة المصاريف العامة | رقم |
### risk_data.csv
بيانات المخاطر وتأثيراتها:
| العمود | الوصف | النوع |
|--------|-------|------|
| risk_id | رقم المخاطرة | نص |
| project_id | رقم المشروع | نص |
| risk_category | فئة المخاطرة | نص |
| risk_description | وصف المخاطرة | نص |
| impact | التأثير | نص |
| probability | الاحتمالية | نص |
| risk_score | درجة المخاطرة | رقم |
| response_strategy | استراتيجية الاستجابة | نص |
| actual_impact | التأثير الفعلي | نص |
| actual_cost | التكلفة الفعلية | رقم |
## الإحصاءات
- عدد المشاريع: 500+
- الفترة الزمنية: 2018-2024
- التوزيع الجغرافي: جميع مناطق المملكة العربية السعودية
## الترخيص والقيود
هذه البيانات للاستخدام الداخلي فقط ولا يجوز مشاركتها خارج الشركة.