هذه المقالة يتيمة. ساعد بإضافة وصلة إليها في مقالة متعلقة بها
يرجى مراجعة هذه المقالة وإزالة وسم المقالات غير المراجعة، ووسمها بوسوم الصيانة المناسبة.

استخراج المعلومات

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث
N write.svg
هذه مقالة جديدة غير مراجعة. ينبغي أن يزال هذا القالب بعد أن يراجعها محرر ما عدا الذي أنشأها؛ إذا لزم الأمر فيجب أن توسم المقالة بقوالب الصيانة المناسبة. (أبريل 2010)

استخراج المعلومات (آي إي) هو نوع من استرجاع المعلومات التي تهدف إلى استخراج المعلومات المهيكلة تلقائيا من الوثائق غير المهيكلة المقروءة آليا، بشكل عام استخراج المعلومات المهيكلة من نصوص اللغات البشرية عن طريق معالجة اللغة الطبيعية.

ونظرا لصعوبة المشكلة، فإن النهج الحالي لاستخراج المعلومات هو التركيز على مجالات محدودة ضيقة. ومن الأمثلة على ذلك هو الاستخراج من تقارير وكالات الأنباءمن عمليات الدمج بين الشركات، كما توضح العلاقة التالية:

دمج_بين(الشركة_1، الشركة_2، تاريخ)،

من الجملة الأخبارية على الإنترنت مثل:

امس، أعلنت شركة غزل النسيج المحدودة عن حصولها على شركة الاقطان العربية.

الهدف الاشمل لعملية استخراج المعلومات هو السماح للمعالجة الحاسوبية ان تتم سلفا على البيانات غير الهيكلية. وثمة هدف أكثر تحديدا هو السماح للتفكير المنطقي أن يقوم بالاستدلال على أساس المحتوى المنطقي للبيانات المدخلة. البيانات الهيكلية هي بيانات واضحة المعالم دلاليا من المجال المختار، تم تفسيره بدقة وعناية وفقا للتصنيف والسياق.

تاريخ استخراج المعلومات[عدل]

استخراج المعلومات يعود إلى أواخر 1970s في الأيام الأولى من معالجة اللغات الطبيعية.[1] وكان أول نظام تجاري من منتصف 1980s هو "جاسبر" وتم بناءه لرويترز عبر مجموعة كارنيجي بهدف تقديم الأخبار المالية في وقت نشرها للتجار المنافسين. [2]

انظر أيضا[عدل]

المراجع[عدل]