مساعدة:بوت استخراج البيانات

من ويكيبيديا، الموسوعة الحرة

كتب هذا البوت reza1615 و ZxxZxxZ

يقوم هذا البوت باستخراج البيانات من قالب معلومات المقالات الإنجليزية ويضعها في ملف إكسل لكي يتم استخدامها في إنشاء مشاريع مقالات بوتية.

كود البوت متوفر هنا

يقوم البوت بإنشاء الملفات التالية:

  1. tempresult.txt
  2. encats.txt
  3. NeededBoxes.txt
  4. NeededCategories.txt
  5. resultexcelc.txt
  1. يتم تخزين قالب المعلومات في هذا الملف
  2. يتم تخزين التصانيف المعادلة في هذا الملف
  3. يتم تخزين وترجمة قالب المعلومات في هذا الملف
  4. يتم تخزين المقالات التي يحبذ إنشاؤها (لكي لا تبقى وصلات حمراء في المقالات)
  5. يتم تخزين الملف الذي سيتم استخدامه في إكسل بهذا الاسم

الدليل[عدل]

سنأخذ نموذجاً لشرح كيفية استخدام هذا البوت. لنفترض بأننا نريد إنشاء مقالات عن مواسم جائزة الأوسكار. وهذه المقالة إحدى المقالات التي نريد شمولها في المشروع.

  1. نفتح المقالة في حالة التعديل
  2. ننسخ كل خانات القالب في السطر رقم 600 من كود البوت
  3. نشغل البوت

التشغيل[عدل]

يتم تشغيل البوت في حالتين (arguments)

  1. faonly
  2. enonly
  1. یستخرج المقالات الموجودة في العربیة
  2. یستخرج المقالات غیر الموجودة في العربیة

نختار تصنيفاً يشمل كل المقالات التي نريد استخراج بياناتها (في النموذج هذا category:Academy Awards ceremonies )

نكتب الأمر التالي في سطر الأمر (command line)

python boxfinder.py -cat:Academy_Awards_ceremonies -enonly

الاستخدام[عدل]

  1. افتح ملف اكسل
  2. من تبويبة data، اختر زر From Text، ثم اختر اسم الملف (resultexcelc.txt)