مجموع نصوص

من ويكيبيديا، الموسوعة الحرة
(بالتحويل من ذخيرة النصوص)
اذهب إلى: تصفح، ‏ ابحث

مجموع النصوص أو ذخيرة النصوص هو مجموعة كبيرة ومنظمة من النصوص (التي أصبحت الآن عادة مخزنة ومعالجة إلكترونيا). وهي تستخدم للقيام بالتحليل الإحصائي واختبار الفرضيات، والتحقق من الوقائع أو التحقق من صحة القواعد اللغوية على فضاء محدد. يرتبط مفهوم ذخيرة النصوص بما يسما في اللغات اللاتينية "corpus" (جمعها "corpora") فمن هنا يمكننا إعطاء اسم آخر إلى هذا المفهوم الجديد 'المدونة'. والشعبة التي تهتم بهذا المفهوم هي 'لسانيات المدونة'.

قد تحتوي الذخيرة على نصوص من لغة واحدة (ذخيرة أحادية اللغة) أو نصوص من لغات متعددة (ذخيرة متعددة اللغات). الذخائر التي تم تهيئتها خصيصا لمقارنتها جنبا إلى جنب تسمى الذخائر المتوازية.

انظر أيضا[عدل]

Midori Extension.svg هذه بذرة مقالة تحتاج للنمو والتحسين. ساهم في إثرائها بالمشاركة في تحريرها.