غابة عشوائية

يرجى مراجعة هذه المقالة وإزالة وسم المقالات غير المراجعة، ووسمها بوسوم الصيانة المناسبة.
من ويكيبيديا، الموسوعة الحرة
غابة عشوائية
معلومات عامة
جزء من
البداية
2001 عدل القيمة على Wikidata
المكتشف أو المخترع

الغابة العشوائية أو الغابات العشوائية (بالإنجليزية: Random forest)‏ عبارة عن خوارزمية للتعلم الآلي تم تطويرها بناءً على مجموعة من أشجار القرار.[1][2] تستخدم هذه الخوارزمية للتصنيف، الانحدار ومهام أخرى. عادةً ما تتمتع خوارزمية الغابة العشوائية بدقة أفضل مقارنة بشجرة القرار.[2][3]

تاريخ[عدل]

أول شخص ابتكر خوارزمية الغابة العشوائية كان تيم هو في 1995. تم تحسين هذه الخوارزمية بواسطة ليو بريمان.[4]

طريقة[عدل]

لإنشاء غابة عشوائية، يجب تقسيم البيانات إلى مجموعات جزئية عشوائية متعددة. ثم يتم تدريب شجرة لكل مجموعة جزئية. سيكون لكل شجرة تنبؤها الخاصة لكل مثال جديد قادم. سيتم تحديد التنبؤ النهائي للنموذج عن طريق التصويت.[3][5]

أهمية المتغيرات[عدل]

يمكن لخوارزمية الغابة العشوائية ترتيب المتغيرات بناءً على أهميتها. الصيغة الأساسية لتقييم الأهمية هي نفس صيغة شجرة القرار (على سبيل المثال الانتروبيا أو معامل جيني). الفرق الوحيد هو أنه سيتم حساب متوسط درجات الأهمية للأشجار المختلفة.[1][2]

المراجع[عدل]

  1. ^ أ ب Piryonesi، S. M.؛ El-Diraby، T. E. (2020) [Published online: December 21, 2019]. "Data Analytics in Asset Management: Cost-Effective Prediction of the Pavement Condition Index". Journal of Infrastructure Systems. ج. 26 ع. 1. DOI:10.1061/(ASCE)IS.1943-555X.0000512.{{استشهاد بدورية محكمة}}: صيانة الاستشهاد: url-status (link)
  2. ^ أ ب ت T. Hastie, R. Tibshirani, and J. Friedman, “The Elements of Statistical Learning,” Bayesian Forecast. Dyn. Model., vol. 1, pp. 1–694, 2009.
  3. ^ أ ب Piryonesi, S. Madeh; El-Diraby, Tamer E. (2020-06). "Role of Data Analytics in Infrastructure Asset Management: Overcoming Data Size and Quality Problems". Journal of Transportation Engineering, Part B: Pavements (بالإنجليزية). 146 (2): 04020022. DOI:10.1061/JPEODX.0000175. ISSN:2573-5438. Archived from the original on 2020-09-15. {{استشهاد بدورية محكمة}}: تحقق من التاريخ في: |تاريخ= (help)
  4. ^ Breiman، Leo (2001). "Random Forests". Machine Learning. ج. 45 ع. 1: 5–32. DOI:10.1023/A:1010933404324. مؤرشف من الأصل في 2020-09-17.
  5. ^ Provost, F., & Fawcett, T. (2013). Data Science for Business: What you need to know about data mining and data-analytic thinking. " O'Reilly Media, Inc.".