يرجى إعادة صياغة هذه المقالة باستخدام التنسيق العام لويكيبيديا

شعاع الدعم الآلي

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث
Arwikify.svg
يرجى إعادة صياغة هذه المقالة باستخدام التنسيق العام لويكيبيديا، مثل إضافة الوصلات والتقسيم إلى الفقرات وأقسام بعناوين. (نوفمبر 2013)

متجهات آلات دعم التمييز

متجهات آلات دعم التمييز[عدل]

تندرج متجهات آلات دعم التمييز (أو شبكات دعم التمييز) تحت خوارزمات تعلم الآلة المراقبة(المرمزة) لتحليل البيانات من أجل تصنيفها تصنيفا احصائيا و عمل تحليل الإنحدار اللازم لها. يكون المدخل للعملية هي جزء من البيانات من أجل مران الخوارزم و تكون مرمزة بتصنيفها لإحدى الفصيلتين؛ منتمية للنوعية س أو لا منتمية لها.عندما ترسم البيانات على محاور الخصائص، يقوم الخوارزم بإيجاد إطار خطى للفصل بين خصائص كلٍ من النوعيتين بحيث أن تكون الهوة بينهما متسعة قدر ما يمكن. ثم تتم عملية التعلم نفسها عقب المران حيث يتم تصنيف جزء آخر من البيانات تبعا للإطار الذي وجد في عملية المران. إلى جانب قدرة خوارزم الدعم الآلى على إيجاد الإطار الخطى، تتمكن أيضا من إيجاد أُطر غير خطية بتطبيق خدعة المصفوفة

يعد من أشهر طرق التصنيف الأتوماتيكي تعلم آلي, تعتمد على إيجاد منحني أو مستوي فائق يفصل العينات المدخلة عن بعضها البعض, و يتميز بانحصاره في تصنيف المسائل ذات الفئات الثنائية. 1 للعينات الإيجابية أو -1 للعينات السلبية, على سبيل المثال: لتصنيف عينات بيانات مرضى تخص مرض الإيدز, إذا كان الخرج 1 يعني أن الشخص مصاب بمرض الإيدز, و في حال كان الخرج -1 أي أن الشخص غير مصاب مرض الإيدز [1][2].

التعريف[عدل]

يقوم هذا الخوارزم بحساب سطح أو مجموعة أسطح في بعد آخر يختلف طوله عن طول متجه الخصائص. تحدد دقة الخوارزم بقدرته على الفصل بين النوعيتين بحيث تكون أقرب عينة من كلى النوعيتين أبعد ما يكون عن بعضهما البعض و هو ما يسمى بالحافة، و بصفة عامة كلما زادت الحافة أو هامش الفصل، كلما قل الخطأ في حالة التعميم لجزء البيانات الغير خاص بمرحلة المران. بالرغم مما تبدو عليه المشكلة من سهولة، إلا أنه في أغلب الأحيان لا يمكن الفصل بين النوعيتين خطياً، و حينها نلجأ لتحويل محاور متجهات الخصائص لبعد أعلى بحيث يتم الفصل بينهم بسطح. و يراعى في هذا المنظور العبء الحسابى فيتم حساب الضرب القياسى للمتجهات بواسطة دالة المصفوفة، حيث يكون السطح الفاصل معرف بمجموعة من النقاط نتاج ضربهم القياسى مع متجه في الإحداثيات الجديدة (ذات البعد الأعلى) تكون ثابتة.

التاريخ[عدل]

في عام 1963، اخترع العالمان فلاديمير فابنك و أليكسى شيرفونينكيز خوارزم متجه آلات دعم التمييز. أما الخوارزم المعتمد المستخدم حاليا (الهامش المرن) فقد طرحه كورينا كورتز و فابنك على 1993 و نُشر عام 1995.

التحفيز[عدل]

إن عملية تصنيف البيانات تعد من أكثر عمليات تعلم الآلة شيوعاً. بوجود نقاط البيانات التي تنتمى لنوع من اثنين، يكون الهدف هو تصنيف نقطة جديدة و تحديد لأىٍ من النوعيتين تنتمى. ينظر لنقطة البيان على أنها متجه له عدد ج من الخصائص، و إذا تم الفصل بسطح بُعده ينقص عن ج بواحد يكون التصنيف خطياَ، و يكون غير خطيا ما عدا ذلك. و في حالة توافر أكثر من فاصل خطى، يتم اختيار الفاصل الذي يضمن هامش أوسع بين أقرب نقطتين من نوعيتين مختلفتين لبعضهم و هو ما يسمى بالمستوى ذو الهامش الأكبر.

طریقة عمل متجهات آلات دعم التمييز الخطية[عدل]

تكون المعطيات مجموعة من النقاط س عددها ن و يكون متجه خصائصها طوله ج و المتجه ص بطول ن و كل قيمة فيه تكون إما واحد (منتمية للنوعية المعنية) أو سالب واحد ( لا منتمية لها). كل متجه س ك يكون طوله ص حيث تتراوح قيمة ك بين ١ و ن. يكمن هدف خوارزم في إيجاد المستوى الذي يفصل بين الفصيلتين (المرمزة ١ و عكسها و تكون مرمزة ١-) مع وجود أكبر و أوسع هامش بين الفصيلتين. العينات من البيانات التي تقع على هذا الهامش تسمى بمتجهات الدعم التي تحقق المعادلة
س . ف – ب =0 و تمثل علامة النقطة (.) الضرب القياسى للمتجهات، و يمثل ب/‖ف‖ مقدر إزاحة المستوى الفاصل عن نقطة الأصل باتجاه المتجه ف العمودى على هذا المستوى. أما مقدار الهامش فيكون ٢/‖ف‖ و يهدف الخوارزم لتقليل المتجه ف بحيث تزيد قيمة هامش (حافة)الفصل.
تخضع العينات الإيجابية (المنتمية للنوعية) للمعادلة س . ف – ب ≥ ١، أما العينات السلبية فتخضع للمعادلة س . ف – ب ≤ ١-.
و بإعادة تنسيق المعادلات نصل إلى مشكلة الأمثلة
و تصبح إيجاد أقل‖ف‖^٢/٢ خاضعة لشرط

ص ك (س ك . ف – ب ) ≥ ١ لكل قيم ك ما بين ١ و ن[3].

شعاع الدعم الآلي يفصل بين عينات من فئتين

طریقة عمل متجهات آلات دعم التمييز اللاخطية[عدل]

في عام 1992 اقترح برنارد بوسر، ايزابيل جيون، و فلاديمير فابنك طريقة لخلق خوارزم التصنيف غير الخطى بتطبيق خدعة المصفوفة (المُقتَر من قِبَل إيزارمان و آخرون). الخوارزم النهائى يكون شبيه بالخطى مع استبدال كل عملية ضرب قياسى بمصفوفة لا خطية، و بذلك يقوم الخوارزم بإيجاد المستوى ذو الهامش الأقصى في إحداثيات الخصائص بعد تحويلها. و من أشهر تلك المصفوفات:
- متعددة الحدود المتجانسة : ع (س ك، س ل) = (س ك . س ل )^ز
- متعددة الحدود الغير متجانسة: ع (س ك، س ل) = (س ك . س ل +١ )^ز
- دالة جاوس المعتمدة قيمتها على البعد من نقطة الأصل: ع (س ك، س ل) =ه(-γ || س ك- س ل ||^٢ ) ، حيث تكون γ > 0 حيث ع هي دالة المصفوفة

متجهات آلات دعم التمييز الخطية ذات الهامش المرن[عدل]

في عام 1995، اقترح كورينا كورتز و فلاديمير فابنك خوارزم معدِل لفكرة الهامش الأقصى مع السماحية بوجود عينات يتم ترميزها برمز خاطئ. إذا تعذر وجود مستوى يفصل بين العينات الموجبة و السالبة، تقوم فكرة الهامش المرن على إيجاد مستوى يفصل بين نوعى العينتين بأقل خطأ ممكن بحيث تتواجد (تُرمز) أقل عدد من العينات برمز خاطئ. و تصبح مشكلة الأمثلة هي إيجاد
أقل ‖ف‖^٢/٢ + دك∑ * ط لكل قيم ك ما بين ١ و ن
و تكون خاضعة ً لشرط ص ك (س ك . ف – ب ) ≥ ١- دك لكل قيم ك ما بين ١ و ن، حيث تحدد المتغيرات دك الغير سالبة درجة خطأ التمييز للعينة س ك.[4]

وصلات داخل ویکي[عدل]

Support_vector_machine
تعلم آلي
تعلم الآلة

مراجع[عدل]

[ما هي؟]

  1. ^ [1] H. Byun and S.-W. Lee, "Applications of support vector machines for pattern recognition: A survey," in Pattern recognition with support vector machines, ed: Springer, 2002, pp. 213-236.
  2. ^ [1] C. Cortes and V. Vapnik, "Support-vector networks," Machine learning, vol. 20, pp. 273-297, 1995.
  3. ^ Gino J. Lim and Eva K. Lee (2008). Optimization in Medicine and Biology. New York: Auerbach Publications. ISBN 9780849305634
  4. ^ Richard O. Duda, Peter E. Hart, and David G. Stork (2000). Pattern Classification (2nd ed.). ISBN 0471056693

وصلات خارج ويكي[عدل]

An Idiot’s guide to Support vector machines SVMs

svmtutorial.pdf

من أشهر المكتبات التطبيقة لشعاع الدعم الآلي, تضم تطبيقات في العديد من لغات البرمجة libsvm