معدل خطأ بايز: الفرق بين النسختين

من ويكيبيديا، الموسوعة الحرة
[مراجعة غير مفحوصة][مراجعة غير مفحوصة]
تم حذف المحتوى تمت إضافة المحتوى
لا ملخص تعديل
سطر 2: سطر 2:
{{وصلات قليلة|تاريخ=فبراير 2019}}
{{وصلات قليلة|تاريخ=فبراير 2019}}
{{يتيمة|تاريخ=فبراير 2019}}
{{يتيمة|تاريخ=فبراير 2019}}
في التصنيف الإحصائي، فإن '''معدل خطأ بايز''' هو أقل معدل خطأ ممكن لأي مصنِّف لنتيجة عشوائية ( على سبيل المثال، التصنيف إلى واحدة من فئتين). وهو مماثل للخطأ غير القابل للاختزال. <ref name="stat">Fukunaga, Keinosuke (1990) ''Introduction to Statistical Pattern Recognition'' by</ref><ref name="Tumer">K. Tumer, K. (1996) "Estimating the Bayes error rate through classifier combining" in ''Proceedings of the 13th International Conference on Pattern Recognition'', Volume 2, 695–699</ref>
في التصنيف الإحصائي، فإن '''معدل خطأ بايز''' هو أدنى معدل خطأ ممكن لأي مصنِّف لإعطاء نتيجة عشوائية (على سبيل المثال، التصنيف إلى إحدى الفئعيه). وهو مماثل للخطأ غير القابل للاختزال.&nbsp;<ref name="stat">Fukunaga, Keinosuke (1990) ''Introduction to Statistical Pattern Recognition'' by</ref><ref name="Tumer">K. Tumer, K. (1996) "Estimating the Bayes error rate through classifier combining" in ''Proceedings of the 13th International Conference on Pattern Recognition'', Volume 2, 695–699</ref>


يوجد عدد من الطرق لتقدير معدل الخطأ في بيز. فمثلاً تسعى إحدى الطرق للحصول على حدود تحليلية تعتمد في الأصل على متغيرات التوزيع، وبالتالي يصعب تقديرها. ويركز نهج آخر على الكثافة كل صنف، في حين تجمع طريقة أخرى بين المصنفات المختلفة وتقارن بينها.
يوجد عدد من الطرق لتقدير معدل خطأ بايز. إحدى الطرق تقوم على الحصول على مجموعات تحليلة تعتمد في تشكيلها على متغيرات التوزيع، وبالتالي يصعب تقديرها. ويركز نهج آخر على الكثافة كل صنف، في حين تجمع طريقة أخرى بين المصنفات المختلفة وتقارن بينها.


وتعتبرمعدل خطأ بايز ذات أهمية كبيرة في دراسة الأنماط و[[تعلم الآلة|التعلم الآلي]].<ref>{{استشهاد بكتاب|عنوان=The Elements of Statistical Learning|السنة=2009|وصلة=https://archive.org/details/elementsstatisti00frie_044|ناشر=Springer|ISBN=978-0387848570|طبعة=2nd|صفحة=[https://archive.org/details/elementsstatisti00frie_044/page/n38 17]|الأخير=Hastie|الأول=Trevor}}</ref>
ويعتبر معدل خطأ بايز ذا أهمية كبيرة في دراسة الأنماط و[[تعلم الآلة|التعلم الآلي]].<ref>{{استشهاد بكتاب|عنوان=The Elements of Statistical Learning|السنة=2009|وصلة=https://archive.org/details/elementsstatisti00frie_044|ناشر=Springer|ISBN=978-0387848570|طبعة=2nd|صفحة=[https://archive.org/details/elementsstatisti00frie_044/page/n38 17]|الأخير=Hastie|الأول=Trevor}}</ref>


== تقدير الخطأ ==
== تقدير الخطأ ==
من حيث التعلم الآلي وتصنيف الأنماط، يمكن تقسيم التسميات الخاصة بمجموعة من الملاحظات العشوائية إلى فئتين أو أكثر. تسمى كل ملاحظة (instance) والفئة التي تنتمي إليها هي (label). معدل الخطأ في بايز لتوزيع البيانات هو احتمال أن يتم تصنيف الحالة بشكل خاطئ بواسطة مصنف يعرف احتمال الفئة الصحيحة. بالنسبة لمصنف متعدد الفئات، قد يتم حساب معدل خطأ بيزعلى النحو التالي:{{بحاجة لمصدر|تاريخ=فبراير 2013}}
من حيث التعلم الآلي وتصنيف الأنماط، يمكن تقسيم التسميات الخاصة بمجموعة من الملاحظات العشوائية إلى فئتين أو أكثر. تسمى كل ملاحظة (instance) والفئة التي تنتمي إليها هي (label). معدل خطأ بايز لتوزيع البيانات هو احتمال أن يتم تصنيف الحالة بشكل خاطئ بواسطة مصنف يعرف احتمال الفئة الصحيحة. بالنسبة لمصنف متعدد الفئات، قد يتم حساب معدل خطأ بيزعلى النحو التالي:{{بحاجة لمصدر|تاريخ=فبراير 2013}}


:<math>{\displaystyle p=1-\textstyle \sum _{C_{i}\neq C_{\text{max,x}}}\int \limits _{x\in H_{i}}P(C_{i}|x)p(x)\,dx}</math><math />
:<math>{\displaystyle p=1-\textstyle \sum _{C_{i}\neq C_{\text{max,x}}}\int \limits _{x\in H_{i}}P(C_{i}|x)p(x)\,dx}</math><math />
سطر 15: سطر 15:
حيث x هو تمثل الحالة، Ci هي فئة يالحالة، Hi هي المنطقة التي تُصنف كـ Ci بواسطة دالة التصنيف.{{بحاجة لتوضيح|reason=what is Cmax|date=February 2013}}
حيث x هو تمثل الحالة، Ci هي فئة يالحالة، Hi هي المنطقة التي تُصنف كـ Ci بواسطة دالة التصنيف.{{بحاجة لتوضيح|reason=what is Cmax|date=February 2013}}


يعتبر خطأ بايز غير صفري إذا كانت فئات التصنيف غير حتمية، أي أن هناك احتمالًا غير صفري لحقيقة معينة تنتمي لأكثر من فئة واحدة.{{بحاجة لمصدر|تاريخ=فبراير 2013}}
يعتبر خطأ بايز&nbsp;غير صفري إذا كانت فئات التصنيف غير حتمية، أي أن هناك احتمالًا غير صفري لحقيقة معينة تنتمي لأكثر من فئة واحدة.{{بحاجة لمصدر|تاريخ=فبراير 2013}}


== المراجع ==
== المراجع ==

نسخة 09:55، 22 يناير 2021

في التصنيف الإحصائي، فإن معدل خطأ بايز هو أدنى معدل خطأ ممكن لأي مصنِّف لإعطاء نتيجة عشوائية (على سبيل المثال، التصنيف إلى إحدى الفئعيه). وهو مماثل للخطأ غير القابل للاختزال. [1][2]

يوجد عدد من الطرق لتقدير معدل خطأ بايز. إحدى الطرق تقوم على الحصول على مجموعات تحليلة تعتمد في تشكيلها على متغيرات التوزيع، وبالتالي يصعب تقديرها. ويركز نهج آخر على الكثافة كل صنف، في حين تجمع طريقة أخرى بين المصنفات المختلفة وتقارن بينها.

ويعتبر معدل خطأ بايز ذا أهمية كبيرة في دراسة الأنماط والتعلم الآلي.[3]

تقدير الخطأ

من حيث التعلم الآلي وتصنيف الأنماط، يمكن تقسيم التسميات الخاصة بمجموعة من الملاحظات العشوائية إلى فئتين أو أكثر. تسمى كل ملاحظة (instance) والفئة التي تنتمي إليها هي (label). معدل خطأ بايز لتوزيع البيانات هو احتمال أن يتم تصنيف الحالة بشكل خاطئ بواسطة مصنف يعرف احتمال الفئة الصحيحة. بالنسبة لمصنف متعدد الفئات، قد يتم حساب معدل خطأ بيزعلى النحو التالي:[بحاجة لمصدر]

حيث x هو تمثل الحالة، Ci هي فئة يالحالة، Hi هي المنطقة التي تُصنف كـ Ci بواسطة دالة التصنيف.[بحاجة لتوضيح]

يعتبر خطأ بايز غير صفري إذا كانت فئات التصنيف غير حتمية، أي أن هناك احتمالًا غير صفري لحقيقة معينة تنتمي لأكثر من فئة واحدة.[بحاجة لمصدر]

المراجع

  1. ^ Fukunaga, Keinosuke (1990) Introduction to Statistical Pattern Recognition by
  2. ^ K. Tumer, K. (1996) "Estimating the Bayes error rate through classifier combining" in Proceedings of the 13th International Conference on Pattern Recognition, Volume 2, 695–699
  3. ^ Hastie، Trevor (2009). The Elements of Statistical Learning (ط. 2nd). Springer. ص. 17. ISBN:978-0387848570.