أصول نصية

من ويكيبيديا، الموسوعة الحرة
(بالتحويل من مجموع نصوص)
اذهب إلى: تصفح، ‏ ابحث

مجموع النصوص (إنجليزي: corpus، ذخيرة ، متن، مدونة) هو مجموعة كبيرة ومنظمة من النصوص (التي أصبحت الآن عادة مخزنة ومعالجة إلكترونيا).[1][2][3] وهي تستخدم للقيام بالتحليل الإحصائي واختبار الفرضيات، والتحقق من الوقائع أو التحقق من صحة القواعد اللغوية على فضاء محدد. يرتبط مفهوم ذخيرة النصوص بما يسما في اللغات اللاتينية "corpus" (جمعها "corpora") فمن هنا يمكننا إعطاء اسم آخر إلى هذا المفهوم الجديد 'المدونة'. والشعبة التي تهتم بهذا المفهوم هي 'لسانيات المدونة'.

قد تحتوي الذخيرة على نصوص من لغة واحدة (ذخيرة أحادية اللغة) أو نصوص من لغات متعددة (ذخيرة متعددة اللغات). الذخائر التي تم تهيئتها خصيصا لمقارنتها جنبا إلى جنب تسمى الذخائر المتوازية.

مراجع[عدل]

  1. ^ Wołk، K.؛ Marasek، K. "A Sentence Meaning Based Alignment Method for Parallel Text Corpora Preparation". Advances in Intelligent Systems and Computing. Springer. 275: 107–114. ISBN 978-3-319-05950-1. ISSN 2194-5357. 
  2. ^ Wołk، K.؛ Marasek، K. (2015). "Tuned and GPU-accelerated Parallel Data Mining from Comparable Corpora". Lecture Notes in Artificial Intelligence. Springer: 32–40. ISBN 978-3-319-24032-9. 
  3. ^ ESL Student Attitudes toward Corpus Use in L2 Writing. Journal of Second Language Writing, 13(4), 257–283. Retrieved 21 March 2012.

انظر أيضا[عدل]

Open book 01.png
هذه بذرة مقالة عن الأدب بحاجة للتوسيع. شارك في تحريرها.