تنقيب في النصوص: الفرق بين النسختين

[نسخة منشورة]

تم حذف المحتوى تمت إضافة المحتوى

مضمن

نسخة 19:53، 10 مارس 2019

التنقيب في النصوص، وأحيانا يشار إليها بالتناوب باسم التنقيب في البيانات النصية، أي ما يعني تقريبا تحليلات النصوص، يشير إلى عملية استخلاص معلومات عالية الجودة من النص.^[1]^[2]^[3] واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل التعلم الإحصائي للانماط. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في قاعدة بيانات)، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من الصلة، والحداثة، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل تصنيف النصوص، تجميع النص، واستخراج المفاهيم، وإنتاج التصنيفات الحبيبية، وتحليل المشاعر، وتلخيص الوثائق، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين الكيانات المسماة).

مثال : فهرسة النصوص

يمكن أن يتعلق التنقيب النصي بفهرسة النصوص بالنسبة للكلمات التي تحتوي عليها وهذا هو ابسط تطبيق للتنقيب النصي. ويمكن بعد ذلك ان نسأل الفهرس عن طريق كلمات مفتاحية لمعرفة التشابه بينها وبين قائمة النصوص. يمكن توصيف خوارزمية الفهرسة بالشكل التالي :

فهرسة النص بالنسبة للكلمات التي يحتوي عليها.
عمل فهرسة عكسية (فهرسة الكلمات بالنسبة للنصوص).
عند تحليل السؤال الاستعلامي للفهرس المكون من كلمات دلالية نقوم بحساب التشابه بينها وبين الفهرسة العكسية للنصوص.
وهذا يعطينا ترتيب النصوص بحسب تشابهها مع كلمات المفتاحية المطروحة.

التطبيقات الممكنة

تطبيقات التنقيب النصي كثيرة تبدأ من الفهرسة بالنسبة لمحركات البحث إلى استخراج المعرفة من النصوص غير المنظمة. هناك بعض التقنيات مثل تحويل الكلمات إلى جذوع تمكننا من تطوير الفهرسة مع ضياع بعض المعنى بالمقابل.

مراجع

^ Coussement، Kristof؛ Van Den Poel، Dirk (2008). "Integrating the voice of customers through call center emails into a decision support system for churn prediction". Information & Management. ج. 45 ع. 3: 164–74. DOI:10.1016/j.im.2008.01.005.
^ Alessandro Valitutti؛ Carlo Strapparava؛ Oliviero Stock (2005). "Developing Affective Lexical Resources" (PDF). Psychology Journal. ج. 2 ع. 1: 61–83.
^ [1]نسخة محفوظة November 29, 2009, على موقع واي باك مشين.

في كومنز صور وملفات عن: تنقيب في النصوص

هذه بذرة مقالة عن الحاسوب أو العاملين في هذا المجال، بحاجة للتوسيع. فضلًا شارك في تحريرها.

[1] Coussement، Kristof؛ Van Den Poel، Dirk (2008). "Integrating the voice of customers through call center emails into a decision support system for churn prediction". Information & Management. ج. 45 ع. 3: 164–74. DOI:10.1016/j.im.2008.01.005.

[2] Alessandro Valitutti؛ Carlo Strapparava؛ Oliviero Stock (2005). "Developing Affective Lexical Resources" (PDF). Psychology Journal. ج. 2 ع. 1: 61–83.

[3] [1]نسخة محفوظة November 29, 2009, على موقع واي باك مشين.

[1]

[2]

[3]

@@ سطر 1: / سطر 1: @@
-'''التنقيب في النصوص'''، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص.<ref>{{cite journal |doi=10.1016/j.im.2008.01.005 |url=http://EconPapers.repec.org/RePEc:rug:rugwps:08/502 |title=Integrating the voice of customers through call center emails into a decision support system for churn prediction |year=2008 |last1=Coussement |first1=Kristof |last2=Van Den Poel |first2=Dirk |journal=Information & Management |volume=45 |issue=3 |pages=164–74}}</ref><ref>{{cite journal
+'''التنقيب في النصوص'''، وأحيانا يشار إليها بالتناوب باسم [[التنقيب في البيانات]] النصية، أي ما يعني تقريبا [[تحليلات النصوص]]، يشير إلى عملية استخلاص [[معلومات]] عالية الجودة من النص.<ref>{{cite journal |doi=10.1016/j.im.2008.01.005 |المسار=http://EconPapers.repec.org/RePEc:rug:rugwps:08/502 |العنوان=Integrating the voice of customers through call center emails into a decision support system for churn prediction |السنة=2008 |الأخير1=Coussement |الأول1=Kristof |الأخير2=Van Den Poel |الأول2=Dirk |journal=Information & Management |volume=45 |issue=3 |الصفحات=164–74}}</ref><ref>{{cite journal
- |author1=Alessandro Valitutti |author2=Carlo Strapparava |author3=Oliviero Stock | title = Developing Affective Lexical Resources
+ |المؤلف1=Alessandro Valitutti |المؤلف2=Carlo Strapparava |المؤلف3=Oliviero Stock | العنوان = Developing Affective Lexical Resources
  | journal = Psychology Journal
- | year = 2005
+ | السنة = 2005
  | issue = 1
- | pages = 61–83
+ | الصفحات = 61–83
- | url = http://www.psychnology.org/File/PSYCHNOLOGY_JOURNAL_2_1_VALITUTTI.pdf
+ | المسار = http://www.psychnology.org/File/PSYCHNOLOGY_JOURNAL_2_1_VALITUTTI.pdf
  | volume = 2
 }}</ref><ref>[http://intelligent-enterprise.informationweek.com/blog/archives/2007/02/defining_text_a.html ]{{webarchive |url=https://web.archive.org/web/20091129171151/http://intelligent-enterprise.informationweek.com/blog/archives/2007/02/defining_text_a.html |date=November 29, 2009 }}</ref> واستخلاص المعلومات عالية الجودة يكون من خلال التقسيم للأنماط والاتجاهات من خلال وسائل مثل [[التعلم الإحصائي للانماط]]. وعادة ما يتطلب التنقيب في النصوص ال عملية هيكلة للنص المدخل (عادة تحليل، جنبا إلى جنب مع إضافة بعض المميزات اللغوية المشتقة وإزالة أخرى، ومن ثم الإدراج في [[قاعدة بيانات]])، واستخلاص الأنماط في البيانات المهيكلة، وأخيرا تقييم وتفسير للناتج. 'ذات جودة عالية' في مجال التنقيب في النصوص عادة ما يشير مزيج من [[الصلة]]، و[[الحداثة (براءة اختراع)|الحداثة]]، والاهتمام. المهام النموذجية للتنقيب في النصوص تشمل [[تصنيف النصوص]]، [[تجميع النص]]، و[[استخراج المفاهيم]]، وإنتاج التصنيفات الحبيبية، و[[تحليل المشاعر]]، و[[تلخيص الوثائق]]، ونمذجة العلاقات بين الكيانات (أي تعلم العلاقات بين [[الكيانات المسماة]]).
@@ سطر 22: / سطر 22: @@
 {{مراجع}}
-{{شريط بوابات|معلوماتية|لغويات}}
+{{شريط بوابات|معلوماتية|لسانيات}}
 {{تصنيف كومنز|Text mining}}
 {{ضبط استنادي}}
 {{بذرة حوسبة}}
 [[تصنيف:تطبيقات الذكاء الاصطناعي]]
 [[تصنيف:تنقيب البيانات]]