تصنيف أقسام الكلام

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث

في علم معالجة اللغات الطبيعية تصنيف أقسام الكلام هي عملية تعليم أو تدليل الكلمات في نص أو متن نصي إلى نوع محدد من أجزاء الكلام المقابل لهذه الكلمة مثل (يأكل: فعل)، بناء على تعريف الكلمة وسياقها.[1][2][3] كان هذا التصنيف يعمل يدويا وألان يتم في سياق اللغويات الحاسوبية باستخدام بعض الخوارزميات المتخصصة في ذلك. هناك نوعان من تصنيف أجزاء الكلام: الأول يعتمد على القواعد والثاني على الاحتمالات الإحصائية. في العملية تصنيف أجزاء الكلام ليست سهلة كما تبدو لأن هناك كثير من الغموض واللبس في كثير من الحالات. مثل لو افترضنا كلمة ذهب في العربية هل تعني الفعل ذهب أي غادر ام الاسم ذهب وهو نوع من المعادن؟ من السهل معرفة نوع الكلمة من سياق الكلام بالنسبة للإنسان لكن بالنسبة للكمبيوتر العملية أكثر تعقيد. أيضا من المشكلات التي تواجه تصنيف الأقسام إذا كان النص يحتوي على كلمتين بنهم شرطة تمثل ككلمة واحدة وغيرها من المشاكل العديدة.

مراجع[عدل]

  1. ^ Eugene Charniak نسخة محفوظة 11 يوليو 2017 على موقع Wayback Machine.
  2. ^ Kenneth Ward Church (1988). "A stochastic parts program and noun phrase parser for unrestricted text". ANLC '88: Proceedings of the second conference on Applied natural language processing. Association for Computational Linguistics Stroudsburg, PA. doi:10.3115/974235.974260. 
  3. ^ Xu Sun (2014). Structure Regularization for Structured Prediction (PDF). Neural Information Processing Systems (NIPS). صفحات 2402–2410. 

انظر أيضا[عدل]

Computer.svg
هذه بذرة مقالة عن الحاسوب أو العاملين في هذا المجال بحاجة للتوسيع. شارك في تحريرها.