تنقيب في النصوص: الفرق بين النسختين

من ويكيبيديا، الموسوعة الحرة
[مراجعة غير مفحوصة][مراجعة غير مفحوصة]
تم حذف المحتوى تمت إضافة المحتوى
CipherBot (نقاش | مساهمات)
ط تدقيق إملائي وتنسيق
CipherBot (نقاش | مساهمات)
ط تدقيق إملائي وتنسيق
سطر 1: سطر 1:
التنقيب في النصوص، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص. واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من [[الصلة]]، و[[الحداثة (براءة اختراع)|الحداثة]]، والإهتمام. المهام النموذجية للتنقيب في النصوص تشمل [[تصنيف النصوص]]، [[تجميع النص]]، و[[استخراج مفهوم/كيان]]، وإنتاج التصنيفات الحبيبية، و[[تحليل المشاعر]]، و[[تلخيص الوثيقة]]، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين [[الكيانات المسماة]]).
التنقيب في النصوص، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص. واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من [[الصلة]]، و[[الحداثة (براءة اختراع)|الحداثة]]، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل [[تصنيف النصوص]]، [[تجميع النص]]، و[[استخراج مفهوم/كيان]]، وإنتاج التصنيفات الحبيبية، و[[تحليل المشاعر]]، و[[تلخيص الوثيقة]]، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين [[الكيانات المسماة]]).
{{بذرة}}
{{بذرة}}



نسخة 01:46، 20 يونيو 2010

التنقيب في النصوص، وأحيانا يشار إليها بالتناوب باسم التنقيب في البيانات النصية، أي ما يعني تقريبا تحليلات النصوص، يشير إلى عملية استخلاص معلومات عالية الجودة من النص. واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل التعلم الإحصائي للانماط. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في قاعدة بيانات)، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من الصلة، والحداثة، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل تصنيف النصوص، تجميع النص، واستخراج مفهوم/كيان، وإنتاج التصنيفات الحبيبية، وتحليل المشاعر، وتلخيص الوثيقة، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين الكيانات المسماة).