أصول نصية

من ويكيبيديا، الموسوعة الحرة
اذهب إلى التنقل اذهب إلى البحث
Human Language Families (wikicolors).png

المتن (بالإنجليزية: corpus)‏ في اللسانيات، عبارة عن مجموعة من البيانات اللغوية (عادة ما تكون موجودة في قاعدة بيانات حاسوبية).[1] تسمى أيضًا أصول نصية. وفي علم لسانيات المتون، يتم استخدامها لإجراء التحليل الإحصائي واختبار الفرضيات، والتحقق من الأحداث أو التحقق من صحة القواعد اللغوية ضمن نطاق لغة معينة.[2]

نظرة عامة[عدل]

قد تحتوي المتون على نصوص بلغة واحدة (متن أحادي اللغة) أو بيانات نصية بلغات متعددة (متن متعددة اللغات).

من أجل جعل المتون أكثر فائدة لإجراء البحوث اللغوية، غالبًا ما يخضعون لعملية تعرف باسم التعليق التوضيحي أو التذليل. مثال على التذليل للمتن هو وضع علامات تصنيف اقسام الكلام، حيث تتم إضافة معلومات حول قسم الكلام لكل كلمة (فعل، اسم، صفة، وما إلى ذلك) إلى المتن في شكل علامات أو سوم. مثال آخر يشير إلى الشكل الأساسي (الجذر) لكل كلمة. عندما لا تكون لغة المتن هي نفسها لغة عمل الباحثين الذين يستخدمونها، يتم استخدام الترجمة بين السطور لجعل التذليل ثنائي اللغة.[2]

مراجع[عدل]

  1. ^ Ph. D., Rhetoric and English; M. A., Modern English and American Literature; B. A., English. "What Are Corpora in Language Studies?". ThoughtCo (باللغة الإنجليزية). مؤرشف من الأصل في 26 نوفمبر 2020. اطلع عليه بتاريخ 28 ديسمبر 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)
  2. أ ب "Text Corpus | Project Gutenberg Self-Publishing - eBooks | Read eBooks online". self.gutenberg.org. مؤرشف من الأصل في 27 أبريل 2019. اطلع عليه بتاريخ 28 ديسمبر 2020. الوسيط |CitationClass= تم تجاهله (مساعدة)

انظر أيضا[عدل]

Open book 01.png
هذه بذرة مقالة عن الأدب بحاجة للتوسيع. شارك في تحريرها.