التلخيص التلقائي

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث

التلخيص التلقائي هو خلق نسخة مختصرة من النص بواسطة برنامج كمبيوتر. نتاج هذا الإجراء لا يزال يحتوي على أهم النقاط من النص الأصلي.

ان ظاهرة الإغراق المعلوماتي باتت تعني أن الحصول على ملخصات متماسكة ومتطورة بشكل صحيح هو أمر حيوي. وكما ان الوصول إلى البيانات زاد كذلك الاهتمام بالتلخيص التلقائي. مثال على استخدام تكنولوجيا التلخيص هو محركات البحث من جوجل.

الاستخراج والتجريد[عدل]

على نطاق واسع، الأشخاص يميزون بين نهجين : الاستخراج والتجريد.

تقنيات الاستخراج ما هي الا عملية نسخ المعلومات التي تعتبر ذات أهمية من قبل النظام للموجز (على سبيل المثال، البنود الرئيسية، والجمل أو الفقرات)، في حين يتطلب التجريد اعادة صياغة لأقسام من المستند المصدر. بشكل عام، يمكن للتجريد تلخيص النص بقوة وكثافة أكبر من الاستخراج، ولكن البرامج التي يمكنها القيام بذلك من الصعب تطويرها لأنها تتطلب استخدام تقنيات مولدات اللغات الطبيعية، الذي هو في حد ذاته مجال تحت التطوير.

أنواع الملخصات[عدل]

هناك أنواع مختلفة من الملخصات على حسب ما يركز عليه برنامج التلخيص لتقديم موجز النص، على سبيل المثال ملخصات عامة أو ملخصات ذات الصلة بالاستعلام (التي تسمى أحيانا ملخصات منحازة للاستعلام). نظم التلخيص قادرة على خلق كل من نصوص ملائمة للاستعلام وملخصات عامة مولَدة آليا اعتمادا على ما يحتاجه المستخدم. كما انه من الممكن أيضا تلخيص وثائق الوسائط المتعددة، على سبيل المثال الصور أو الأفلام. بعض النظم ستقوم بإنشاء ملخص على أساس وثيقة مصدر واحد، والبعض الآخر يمكنها استخدام وثائق مصادر متعددة (على سبيل المثال، مجموعة من القصص الإخبارية عن الموضوع نفسه). وتعرف هذه الأنظمة بأنظمة التلخيص متعددة الوثائق.

بعض الطرق المعاونة التلخيص[عدل]

ان تقنيات تعلم الآلة من المجالات وثيقة الصلة مثل استرجاع المعلومات أو تعدين النصوص تم استخدامها وتطويعها لمساعدة في التلخيص التلقائي. وبصرف النظر عن المُلَخِصَات كاملة التلقائية (اف ا اس)، هناك نظم تساعد المستخدمين بمهمة التلخيص (التلخيص البشري بمساعدة الآلة)، على سبيل المثال من خلال تسليط الضوء على مقاطع لتكون موجودة ضمن الملخص، وهناك أنظمة تعتمد على المعالجة البعدية بواسطة البشر (التلخيص الآلي بمساعدة البشر).

التقييم[عدل]

من القضايا المستمرة في هذا المجال هو عملية التقييم. الحكم البشري لديه تنوع كبير على ما يعتبر جيد من الملخصات، مما يعني أن عملية التقييم التلقائي صعبة بشكل خاص. ويمكن استخدام التقييم اليدوي، ولكن هذا مكلف للوقت وللعمالة لأنه يتطلب البشر لقراءة ليس فقط الملخصات ولكن أيضا وثائق المصدر. اما عن القضايا الأخرى فتتعلق بالتماسك والتغطية. احدى المقاييس المستخدمة في مؤتمرات فهم الوثائق السنوية التابعة لمنظمة نيست، والتي تقدم المجموعات البحثية انظمتها لكل من التلخيص ومهام الترجمة، هو المقياس روج (بديل للانحياز الرجوعي لتقييم جيستينج)[1]. تحسب في الأساس من تداخلات ال(ن-غرام) بين الملخصات التلقائية وملخصات الإنسان المكتوبة من قبل. التداخل العالي المستوى من الضروري ان يدل على مستوى عالٍ من المفاهيم المشتركة بين الملخصين. علما أن مثل هذا المقاييس غير قادر على تقديم أي معلومات عن التماسك. ان مشكلة انفور (Anaphor resolution) تبقى هي المشكلة الأخرى يجب أن تحل بشكل كامل.

لمزيد من المعلومات[عدل]

  • Endres-Niggemeyer، Brigitte (1998). Summarizing Information. ISBN 3-540-63735-4. 
  • Marcu، Daniel (2000). The Theory and Practice of Discourse Parsing and Summarization. ISBN 0-262-13372-5. 
  • Mani، Inderjeet (2001). Automatic Summarization. ISBN 1-58811-060-5. 
  • Lehmam، Abderrafih (2010). Essential summarizer: innovative automatic text summarization software in twenty languages in: Proceeding RIAO '10 Adaptivity, Personalization and Fusion of DOCUMENTAIRE Paris, France, France ©2010 Heterogeneous Information LE CENTRE DE HAUTES ETUDES INTERNATIONALES D'INFORMATIQUE. 

انظر أيضا[عدل]