A newer version of the Streamlit SDK is available:
1.45.0
مجموعات البيانات
يحتوي هذا المجلد على مجموعات البيانات المستخدمة لتدريب نماذج التعلم الآلي في نظام تسعير المناقصات.
المجموعات المتوفرة
cost_data.csv
: بيانات تكاليف المشاريع السابقةrisk_data.csv
: بيانات المخاطر وتأثيراتهاlocal_content_data.csv
: بيانات المحتوى المحليdocuments_data.csv
: بيانات المستندات المصنفةentities_data.csv
: بيانات الكيانات المستخرجة
هيكل مجموعات البيانات
cost_data.csv
بيانات تكاليف المشاريع السابقة مع خصائص كل مشروع:
العمود | الوصف | النوع |
---|---|---|
project_id | رقم المشروع | نص |
project_type | نوع المشروع | نص |
location | الموقع | نص |
area | المساحة (م²) | رقم |
floors | عدد الطوابق | رقم |
duration_months | مدة التنفيذ (شهور) | رقم |
tender_type | نوع المناقصة | نص |
client_type | نوع العميل | نص |
total_cost | إجمالي التكلفة | رقم |
cost_per_sqm | تكلفة المتر المربع | رقم |
material_cost | تكلفة المواد | رقم |
labor_cost | تكلفة العمالة | رقم |
equipment_cost | تكلفة المعدات | رقم |
overhead_percentage | نسبة المصاريف العامة | رقم |
risk_data.csv
بيانات المخاطر وتأثيراتها:
العمود | الوصف | النوع |
---|---|---|
risk_id | رقم المخاطرة | نص |
project_id | رقم المشروع | نص |
risk_category | فئة المخاطرة | نص |
risk_description | وصف المخاطرة | نص |
impact | التأثير | نص |
probability | الاحتمالية | نص |
risk_score | درجة المخاطرة | رقم |
response_strategy | استراتيجية الاستجابة | نص |
actual_impact | التأثير الفعلي | نص |
actual_cost | التكلفة الفعلية | رقم |
الإحصاءات
- عدد المشاريع: 500+
- الفترة الزمنية: 2018-2024
- التوزيع الجغرافي: جميع مناطق المملكة العربية السعودية
الترخيص والقيود
هذه البيانات للاستخدام الداخلي فقط ولا يجوز مشاركتها خارج الشركة.