تبدأ هذه الوحدة بسؤال توجيهي.
اختَر إحدى الإجابات التالية:
إذا كان عليك منح الأولوية لتحسين أحد المجالات التالية
في مشروع تعلُّم الآلة، أيّ منها سيكون له أثر
أكبر؟
تحسين جودة مجموعة البيانات
البيانات هي الأهم.
إن جودة وحجم مجموعة البيانات مهمة أكثر بكثير
الخاصة بك التي تستخدمها لبناء نموذجك.
تطبيق دالة الخسارة بشكل أكثر ذكاءً لتدريب نموذجك
صحيح، يمكن لدالة الخسارة الأفضل أن تساعد في تطبيق النموذج بشكل أسرع، إلا أنه
لا يزال يفصلك عن عنصر آخر في هذه القائمة.
إليك سؤال توجيهي أكثر:
حدِّد الوقت الذي تقضيه عادةً في إعداد البيانات وتحويلها في مشروع التعلم الآلي.
أكثر من نصف مدة المشروع
نعم، يقضي ممارسو تعلُّم الآلة معظم وقتهم
وإنشاء مجموعات البيانات والقيام بهندسة الخصائص.
أقل من نصف وقت المشروع
مزيد من الخطط فعادةً ما يتم استخدام التعلم الآلي في 80% من الوقت
المشروع في إنشاء مجموعات البيانات وتحويل البيانات.
في هذه الوحدة، ستتعرّف على مزيد من المعلومات عن خصائص مجموعات بيانات تعلُّم الآلة وكيفية إعداد بياناتك لضمان تحقيق نتائج عالية الجودة عند تدريب النموذج وتقييمه.
تاريخ التعديل الأخير: 2025-07-27 (حسب التوقيت العالمي المتفَّق عليه)
[null,null,["تاريخ التعديل الأخير: 2025-07-27 (حسب التوقيت العالمي المتفَّق عليه)"],[[["This module emphasizes the critical role of data quality in machine learning projects, highlighting that it significantly impacts model performance more than algorithm choice."],["Machine learning practitioners typically dedicate a substantial portion of their project time (around 80%) to data preparation and transformation, including tasks like dataset construction and feature engineering."],["The module covers key concepts in data preparation, such as identifying data characteristics, handling unreliable data, understanding data labels, and splitting datasets for training and evaluation."],["Learners will gain insights into techniques for improving data quality, mitigating issues like overfitting, and interpreting loss curves to assess model performance."],["This module builds upon foundational machine learning concepts, assuming familiarity with topics like linear regression, numerical and categorical data handling, and basic machine learning principles."]]],[]]