تي اف-اي دي دف

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث

معامل التي اف-اي دي دف (تردد المصطلح-معكوس تردد الوثيقة(TF-IDF)) هو معامل غالبا ما يستخدم في استرجاع المعلومات وتعدين النصوص. هذا المعامل هو مقياس إحصائي يستخدم لتقييم مدى أهمية وجود كلمة في مستند معين في ذخيرة النصوص. الأهمية تزيد نسبيا بزيادة عدد مرات ظهور الكلمة أو المصطلح في المستند ولكن تُقَابَل بتردد الكلمة في الذخيرة بشكل عام. غالبا ما تستخدم الأشكال المختلفة للمعامل، بواسطة محركات البحث كأداة مركزية في لتقييم وترتب الوثائق حسب الصلة وفقا لاستعلام المستخدم.

واحدة من أبسط دوال الترتيب تحسب بواسطة جمع المعامل لكل مصطلح من مصطلحات الاستعلام؛ العديد من دوال الترتيب الأكثر تطورا هو شكل من أشكال هذا النموذج البسيط.

Midori Extension.svg هذه بذرة مقالة بحاجة للتوسيع. شارك في تحريرها.