استرجاع المعلومات

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث

علم استرجاع المعلومات هو علم البحث عن الوثائق وعن المعلومات داخل الوثائق وعن الميتاداتا المتعلقة بالوثائق بالإضافة إلى البحث في قواعد البيانات وشبكة الانترنت. هناك تداخل في استخدام المفاهيم بين كل من استرجاع البيانات واسترجاع الوثائق واسترجاع المعلومات واسترجاع النصوص، ولكن لكل منها كيانه العلمي الخاص ونظرياته وتقنياته. استرجاع المعلومات يقوم على عدة علوم من أهمها علوم الحاسب والرياضيات وعلم المكتبات وعلم المعلومات ومعمارية المعلومات واللغويات وعلم الإحصاء وعلم الفيزياء وعلم النفس الإدراكي وعلوم أخرى.

تستخدم أنظمة استرجاع المعلومات الاتوماتيكية لتقليل ما يسمى بالإغراق المعلوماتي. ان الكثير من الجامعات والمكتبات العامة تستخدم نظم استرجاع المعلومات لتوفير الوصول إلى الكتب والمجلات العلمية والوثائق الأخرى. وتعتبر محركات البحث على شبكة الانترنت احدى الامثلة النموذجية لتطبيقات استرجاع المعلومات, وتستخدم أنظمة استرجاع المعلومات معايير لقياس جودة نتائج البحث كالدقة والمراجعة.

تاريخ استرجاع المعلومات[عدل]

ان فكرة استخدام الحاسوب للبحث المعلومات قد نشرت في مقالة باللغة الإنجليزية تحت عنوان كما قد نتصور As We May Think وكتبها فنيفار بوش في عام 1945.[1] ان أول أنظمة استرجاع للمعلومات تعمل اتوماتيكيا كانت في الخمسينات والستينات من القرن العشرين. وبحلول 1970 العديد من التقنيات المختلفة تم اثبات انها تؤدي بشكل فعال مع ذخائر النصوص (Corpora) الصغيرة مثل مجموعة كرانفيلد (بضعة آلاف من الوثائق)[1]. مع ذلك بدأ استخدام أنظمة الاسترجاع التي تبحث في كميات معلومات اوسع أو أكبر في أوائل السبعينات. ومن امثلة أنظمة الاسترجاع واسعة النطاق المستخدمة في تلك الاونة نظام لوكاهيد دايلوج.

وفي عام 1992 قامت إدارة الدفاع الأمريكية بالتعاون والاشتراك مع المعهد الوطني للمعايير والتكنولوجيا (بالإنجليزية: NIST) بدعم ورعاية مؤتمر استرجاع المعلومات (بالإنجليزية: TREC) كجزء من برنامج تيبستر النصي. وكان الهدف من هذا هو مساعد مجتمع استرجاع المعلومات وذلك بأمداده بالبنى التحتية التي يحتاجها لتقييم الطرق والاساليب الجديدة على مجموعات نصية كبيرة الحجم جدا. وهذا بالتاي حفز البحث في الاساليب التي تتميز بمعالجة كميات نصية كبيرة. كذلك ظهور محركات البحث على الإنترنت كان محفزا كبيرا لأنظمة استرجاع المعلومات التي تعالج كميات نصية كبيرة.

ان استخدام الطرق الرقمية لتخزين واسترجاع المعلومات قاد إلى ظاهرة التكهين الرقمي، والتي تعني ان يكون المصدر الرقمي لم يعد مقروءاً بسبب ان الوسيط الصلب أو القارئ أو المكونات الصلبة أو الحزم الإلكترونية لم تعد متوفرة.

الخط الزمني لتطور استرجاع المعلومات[عدل]

  • قبل 1900
    ما بين 1880 و 1890: هلمان هوليرث اخترع تسجيل البيانات على وسائط مقروءة بواسطة ماكينات معينة
    في 1890: بطاقات هوليرث وماكينات البطاقات المثقوبة اِستُخدِمَت لمعالجة البيانات.
  • ما بين 1940 و 1950:
    أواخر الاربعينيات: الجيش الأمريكي يواجه مشكلة في تخزين واسترجاع الوثائق البحث العلمية المتعلقة بالحرب المأخوذة من الالمان
    في عام 1945: ظهرت مقالة فنيفار بوش كما قد نتصور As We May Think في مجلة اتلانتك منثلي ونظام استرجاع المعلومات هو مجموعه من الإجراءات المميكنه عاده تستخدم في الرجوع إلى البيانات التي تحويهاالوثائق وتكشيف تلك البيانات واختزانها بطريقه يمكن استعادتهاعند الطلب...
    في عام 1947: بدأ هانز بتر لوهنز (مهندس أبحاث في أي بي ام) بميكنة نظام قائم على البطاقات المثقوبة لاستخدامها في البحث عن المركبات الكيميائية.
    في الخمسينيات اهتمام متزايد في الولايات المتحدة من "الفجوة العلمية" مع اتحاد الجمهوريات الاشتراكية السوفياتية ذات الدوافع، وشجع التمويل، وقدمت خلفية عن نظم البحث المميكنة للمواد المطبوعة (آلن وآخرون كينت) واختراع فهرسة الاقتباس (يوجين غارفيلد).
    في 1950 تم صياغة المصطلح "استرجاع البيانات" بواسطة العالم كيلفن مورس.
    في العام 1951: أجرى فيليب باجلي أول تجربة في استرجاع الوثائق المحوسبة في أطروحة ماجستير في معهد ماساتشوستس للتكنولوجيا.[2]
    في العام 1955: انضم الين كينت إلى جامعة كيس وسترن ريسرف، وأصبح في نهاية المطاف المدير المساعد لمركز الوثائق وبحوث الاتصالات. وفي نفس السنة، قام كينت وزملاؤه بنشر بحث في الوثائق الأميركية يوصفت بدقة مقياسي الدقة والاستجابة (Recall and Precision)، فضلا عن تفاصيل لمقترح "إطار" لتقييم نظام استرجاع المعلومات، التي تشمل أساليب أخذ العينات الإحصائية لتحديد عدد من الوثائق ذات الصلة التي لم يتم استردادها.
    في 1958: المؤتمر الدولي للمعلومات العلمية واشنطن العاصمة تضمن النظر في نظم استرجاع المعلومات كحل للمشاكل التي تم تحديدها. انظر : وقائع المؤتمر الدولي للمعلومات العلمية، 1958 (الأكاديمية الوطنية للعلوم، واشنطن العاصمة، 1959)
    في 1959: قام هانز بتر لوهنز بنشر "الترميز الالي للوثائق لسترجاع المعلومات".
  • في الستينيات:
    في أوئل الستينيات: بدأ جيرار سالتون العمل على استرجاع المعلومات في جامعة هارفارد، في وقت لاحق انتقل إلى جامعة كورنيل.
    في عام 1960: ملفين ايرل (بيل) مارون وجون لاري كوهينز[3] نشروا "في التعلق, والفهرسة الاحتمالية, واسترجاع المعلومات"، في مجلة إيه سي إم 7 (3) :216 - 244، 1960 تموز / يوليو.
    عام 1962:
    • نشرت سيريل جورج كليفردون النتائج المبكرة لدراسات كرانفيلد، وتطوير نموذج لتقييم نظام لاسترجاع المعلومات. انظر: جورج كيرلس كليفردون، "تقرير عن اختبار وتحليل للتحقيق في مقارنة الكفاءة للأنظمة الفهرسة". مجموعة كرانفيلد للملاحة الجوية، كرانفيلد، بريطانيا، عام 1962.
    • نشر كينت "تحليل المعلومات واسترجاعها".
    عام 1963:
    • تقرير واينبرغ "العلم والحكومة والمعلومات" أعطى التعبير الكامل لفكرة وجود "أزمة المعلومات العلمية." واختير اسم التقرير بعد الدكتور ألفين واينبرغ.
    • جوزيف بيكر وروبرت مايو هايز نشروا "النصوص في استرجاع المعلومات". بيكر وهايز نشروا أيضاً "تخزين المعلومات واسترجاعها: الأدوات والعناصر والنظريات"، نيويورك، وايلي (1963).
    عام 1964:
    في منتصف الستينيات:

أنظر أيضا[عدل]

المراجع[عدل]

  1. ^ أ ب Singhal، Amit (2001). "Modern Information Retrieval: A Brief Overview". Bulletin of the IEEE Computer Society Technical Committee on Data Engineering 24 (4): 35–43. 
  2. ^ Doyle، Lauren؛ Becker, Joseph. Information Retrieval and Processing. Melville. صفحات 410 pp. ISBN 0471221511. 
  3. ^ Maron، Melvin E. (2008). "An Historical Note on the Origins of Probabilistic Indexing". Information Processing and Management 44: 971–972. 

يمكنك أن تساعد!