مساعدة:إنشاء مقالات عن طريق البوت

من ويكيبيديا، الموسوعة الحرة

مقدمة

كتبت هذا الدليل حتى يكون مُساعدة للذين يرغبون بالمساهمة عبر البوت. لا بد من التذكير بأن المشاريع البوتية مهما زادت جودتها تبقي بوتية و لا تُقاس بالمشاريع البشرية من حيث الدقة. أريد أن أشكر صديقي الذي كل ما لدي من خبرة تعلمتها منه ولم يبخل علي يومًا مما يعرفه من العلم. اهدي هذا الدليل لصديقي المفضل وهو المستخدم رضا في ويكي الفارسية.

المستوى

اعتذر من كل السادة ذوي الخبرات العالية علي بساطة هذا الدليل. كما تعرفون هناك عدة دلائل وطرق معقدة وذات تقنية عالية. لكنني سعيت بكتابة هذا الدليل إلى أن اختار أسهل الطرق وأبسط الإرشادات واعتبرت أن القارئ لا يعرف شيئا عن المشاريع البوتية ولا يملك أية خبرة على الإطلاق. فاعتذر من حضراتكم مرة أخرى.

الشروط

لابد لكل مشروع ان يتبع يمتلك الشروط التي سيتم شرحها.

  1. ملحوظية
  2. امتلاك 50 كلمة
  3. امتلاك قالب معلومات
  4. امتلاك تصنيف واحد
  5. مصدر موثوق واحد
  6. قالب تصفح

ملحوظية

يعد أي موضوع يتناوله مقال ما في ويكيبيديا مهمًا و ضروري الوجود إذا كان موضع بحث ونقاش في عدد من مصادر المعلومات المنشورة أو المرئية أو المسموعة. في الكثير من الحالات المختلف عليها يكون المعيار الأساسي هو مدى شهرة الموضوع ومدى تناوله في مصادر المعلومات ووسائل الإعلام، بحيث تكون إضافته لويكيبيديا مبررة وليس مجرد دعاية . يجب أن يتوفر عند البحث عن عنوان أي مقالة كمية جيدة من مصادر المعلومات المستقلة عن الشخص، أو الموقع الإلكتروني، أو القناة التلفزيونية، بحيث تزودنا بوجهات النظر المختلفة ونقد هذا الموضوع والشيء موضع النقاش

قالب معلومات

يستخدم صندوق المعلومات (Infobox) في حال وجود معلومات كثيرة و يجب ترتيب هذه المعلومات بشكل معين . وجود قالب معلومات يساعد الجمالية للمقالة و أيضاَ يساعد القارئ بان يتعرف علي موضوع المقالة بنظرة إجمالية.

تصنيف

التصنيف هي خاصة ضمن برنامج الميدياويكي تسمح بوضع الصفحات ضمن تصنيفات تستخدم من قبل المستخدمين أو القراء للوصول إلى مجموعة من المقالات عن موضوع معين. من الممكن ببساطة اعتبار التصنيف على أنه هي صفحة جداول تستخدم لتصنيف المواضيع؛ على سبيل المثال، تصنيف:علوم يهدف منه جمع المواضيع المفردة المتعلقة بالعلوم، مثل علم الأحياء والكيمياء.

مصدر موثوق

إن كلمة "مصدر" كما هي مستخدمة في ويكيبيديا تشير إلى ثلاث عناصر هي، المنشور (الكتاب، المقال)، المؤلف (الكاتب، الصحفي)، والناشر (صحيفة الأهرام، موقع الجزيرة.. الخ)، وإن هذه العناصر الثلاث هي التي تحدد مدى الوثوقية. تعتمد وثوقية المصدر على المحتوى. حيث أنه يجب أن تكون المحتويات مختارة ومدروسة بعناية من قبل مراجعين أو هيئة النشر. وبشكل عام فإنه مع زيادة عدد الأشخاص المنخرطين في عملية النشر والتأكد من الحقائق وتحليل البيانات تزداد وثوقية العمل المنجز

قوالب تصفح

تستخدم قوالب التصفح لإضافة مساعدات للتصفح ولتحسين المقالات وتوحيد المنظر العام لصفحات المقالات التي تشترك في موضوعات متقاربة، مثل مقالات اللغات، البلاد، ... إلخ.

علي كل مشروع بوتي ان يمتلك ما سبق ذكره. كل مشروع لايملك او لا يستطيع ان يملك الشروط يتعرض لخطر منع التنفيذ او الحذف.

الخطوات

بعد التاكيد من ان المشروع يمتلك الشروط اللازمة على المستخدم أن يتبع الخطوات التالية لتنفيذ مشروعه.

  1. امتلاك بوت
  2. إعداد قائمة بيانات المشروع
  3. موافقة المجتمع علي المشروع 1
  4. إنشاء شاكلة المشروع
  5. إنشاء نموذج تجريبي (خمس مقالات على الأكثر)
  6. موافقة المجتمع علي المشروع 2
  7. إنشاء خمسون نموذج
  8. موافقة المجتمع علي المشروع 3
  9. تنفيذ المشروع
  10. إجراءات مابعد التنفيذ

الخطوة الأولی - امتلاك بوت

المشاريع البوتية تنفذ من خلال حساب مستخدم بوت. فلهذا على المستخدم أن يمتلك بوت. لامتلاك بوت رجاء اقرؤا الرابط التالي. مساعدة:الشروع في العمل مع بوت بايثون

الخطوة الثانية - إعداد قائمة بيانات المشروع

ويمكننا استخراج البيانات بطريقتين:

  1. باستخدام بوت استخراج البيانات وهي الطريقة الأفضل والتي سيتم شرحها
  2. باستخدام صفحات القوائم من ويكيبيديا أو من خارجها وهي غير مفضلة لأسباب منها:
  • المعلومات المستخرجة ستكون قليلة
  • غالباً لن تستطيع ربطها عبر وصلة إنترويكي
    • إما لعدم معرفة اسم المقالة المقابلة في ويكيبيديا الإنكليزية أو غيرها (إذا كانت القائمة مستوردة من خارج ويكيبيديا)
    • أو أن اسم نص الوصلة الظاهر يختلف عن اسم المقالة كما في حالة استخدام [[اسم المقالة|نص الوصلة الظاهر]] (إذا كانت القائمة مستوردة من ويكيبيديا)

للبدء بالمشروع نحدد تصنيف يضم المقالات التي نريد إنشاء مقابل لها في ويكيبيديا العربية، ويجب أن تحتوي هذه المقالات على صندوق معلومات لكي يستخرج البوت بياناته، وسنأخذ مثال محدد لنتابع الشرح عليه:

اخترت التصنيف en:Category:Communes of Alpes-Maritimes والذي يضم حالياً 164 مقالة، نفتح إحدى هذه المقالات في حالة التعديل وننسخ المتغيرات الموجودة في قالب المعلومات ونرتبها ونفتح ملف بوت استخراج البيانات ونعدل السطر 600 ليصبح على الشكل التالي:

    items=(u'image',u'image flag',u'image coat of arms',u'map',u'mayor',u'term',u'elevation m',u'area km2',u'population',u'population date',u'latitude',u'longitude',u'INSEE',u'postal code',u'website',u'region',u'department',u'arrondissement') #City Infobox French commune

نشغل البوت وبعد الانتهاء سنحصل على ملف resultexcelc.txt ممتلئ بالمعلومات، نفتح برنامج الإكسل ونستورد هذه المعلومات إما بالنسخ واللصق أو من تبويبة data، اختر زر From Text، ثم اختر اسم الملف (resultexcelc.txt)

العمل على ملف الإكسل

قد توجد بعض الأعمدة فارغة أو بعض الصفوف لا تحتوي معلومات كافية خاصة في نهاية الملف (إما أن المقالات لا تحتوي قالب صندوق معلومات أو لخلل ما) احذف هذه الصفوف. أيضاً علينا التدقيق في هذه البيانات قد يكون أحد الأعمدة يحتوي نفس القيمة لجميع المقالات (مثلاً اسم المنطقة الأكبر، ...) نقوم بحذف هذا العمود ونضيف قيمته مباشرة إلى نص الشاكلة. يفضل أن يحتوي ملف الإكسل على المتغييرات فقط، الآن أصبح لدينا ملف جاهز لنعمل عليه (كما في الصورة رقم 1).

1- ملف إكسل جاهز للبدء بالعمل عليه

نبدأ بالعمل على ملف الإكسل وسأشرح حسب الطريقة التي أعمل بها (إذا كان لديك طريقة أبسط وأسهل شاركنا بها):

  1. العمود الأخير باسم names ننقله إلى بداية الملف وهو يمثل أسماء المقالات في ويكيبيديا الإنكليزية، ثم ندرج عمود فارغ في بداية الملف ونكتب فيه تعريب/ترجمة أسماء هذه المقالات.
  2. نترجم البيانات التي تحتاج إلى ترجمة في باقي الأعمدة.
  3. ندرج صف فارغ في بداية الملف ونكتب فيه أرقام متسلسلة للأعمدة، الغاية منه سهولة توزيع المتغيرات ضمن الشاكلة (كما في الصورة رقم 2).
    2- بعد التعريب والتنسيق
  4. نقوم بإنشاء شاكلة/نموذج مقالة ونصيغها بحيث تتضمن أكبر قدر ممكن من البيانات التي لدينا في ملف الإكسل ونقوم بتنسيقها بأعلى درجة ممكنة ومراجعتها عدة مرات لأن أي خطأ فيها سيتكرر في جميع المقالات التي سننشأها لاحقاً، مثال مستخدم:Zaher kadour/بلديات إقليم الألب البحرية.

إعداد ملف المقالات

سنقوم بإضافة بعض البيانات إلى ملف الإكسل:

  1. نفتح ملف الإكسل وندرج ثلاثة أعمدة في بدايته
  • نكتب في العمود الأول AAAXXX
  • في العمود الثاني اسم المقالة بالعربية
  • في العمود الثالث YYY{{نسخ:مستخدم:Zaher kadour/بلديات إقليم الألب البحرية مع استبدال مستخدم:Zaher kadour/بلديات إقليم الألب البحرية بعنوان صفحة الشاكلة التي أنشأتها.
  • في العمود الأخير من الملف تكتب }}BBB

ملاحظة: باستخدام خاصية السحب في الإكسل نقوم بملئ هذه الأعمدة

3- ملف إكسل جاهز

بعد إجراء هذه التعديلات سيصبح ملف الإكسل كما في الصورة رقم 3

4- نسخ مسافة فارغة
5- نافذة بحث واستبدال

نقوم بنسخ الصفوف التي تحتوي البيانات (ماعدا أول صفين) ونلصقها في ملف نصي بترميز UTF-8 ونحدد مسافة فارغة بين قيمتي عمودين (الصورة رقم 4) ونفتح نافذة بحث واستبدال ونلصق في خانة بحث وفي خانة استبدال نكتب | ونضغط زر استبدال الكل (الصورة رقم 5) ثم نلصق XXX| وفي خانة استبدال نكتب XXX ونضغط زر استبدال الكل وثم نلصق في خانة البحث |YYY وفي خانة استبدال نكتب YYY ونضغط زر استبدال الكل.

6- ملف نصي جاهز

الآن أصبح لدينا ملف نصي جاهز لوضعه في مجلد البوت وكل سطر منه يمثل مقالة (الصورة رقم 6) ونسميه مثلاً pages.txt

الخطوة الثالثة - صنع شاکلة للمقالات

تعتبر هذه الخطوة من أهم الخطوات لأنها الحجر الأساس لکل المشروع فزیادة الدقة و الاهتمام فی صنع الشاکلة یزید جودة المشروع کله. شاكلة المشروع هي صفحة تتكرر في المشروع كله وتتغيير المقادير في كل مقالة حسب قائمة البيانات التي صنعناها في الخطوات السابقة فقط.

كلما كانت قائمة بيانات المشروع أوسع، هذا يعني أن مقالات المشروع ستصبح ذات جودة أعلى. لصنع الشاكلة لابد من صياغة نص المقالة بحيث يحتوي جميع البيانات التي لدينا في ملف الإكسل ويكون مترابط بسلاسة وخالي من الأخطاء الإملائية واللغوية وعلى درجة عالية من التنسيق والإتقان.

يمكنكم أن تشاهدوا شاكلة مشروع البحيرات في

أمثلة أخرى للإطلاع عليها

ما هذه الأعداد الموجودة في الشاكلة و ماذا يعني {{{1}}} أو {{{2}}} و {{{3}}} و ....؟ كما تذكرون قائمة البيانات في الملف الاكسل كانت مكونة من عدة أعمدة فمقدار كل عمود سياخذ مكان أحد الاعداد. كيف يتم ذلك؟ سنشرحه في النموذج المذكور. نحن نرى بأن الاسم العربي للبحيرة موجود في عمود C الاسم الإنجليزي للبحيرة موجود في عمودA و اسم المقاطعة في عمود B و الخ فعلينا أن نرتب البيانات بالشكل المنظم حسب الشاكلة. يعني في البداية الاسم العربي للبحيرة ثم اسمها الإنجليزي ثم مقاطعتها و مدينتها و الخ

بشكل أبسط لدينا في الشاكلة النص التالي
{{{1}}} (بالإنجليزية: {{{2}}}) هي إحدى بحيرات ولاية مينيسوتا وتقع {{{1}}} بقرب مدينة {{{3}}} الأمريكية في [[{{{4}}}]]
ونحن نريد نتيجه هكذا

بحيرة أيتكين (بالإنجليزية: Aitkin) هي إحدى بحيرات ولاية مينيسوتا وتقع بحيرة أيتكين بقرب مدينة ليبي الأمريكية في مقاطعة أيتكين، مينيسوتا.

فكما تشاهدون بحيرة أيتكين اخذت مكان {{{1}}} و Aitkin اخذت مكان {{{2}}} و إلى آخره. يجب ترتيب البيانات على الشكل التالي:

AAAXXXاسم المقالةYYY{{نسخ:الشاكلة|المقدار الأول|المقدار الثاني|المقدار الثالث|....}}BBB

ملاحظة: إذا كنت تريد أن يظهر نص بالمقالة في حال وجود بيانات ما وعدم ظهوره في حال عدم وجود البيانات استخدم الأسلوب التالي
{{ {{{|safesubst:}}}#if:{{{5}}}| نص {{{5}}} نص}}
ورقم 5 هو رقم المتغير ويمكنك تغييره كما تشاء. كما في هذا المثال

تنفيذ (إنشاء)

شغل البوت بالأمر

python pagefromfile.py -file:pages.txt -start:AAA -end:BBB -titlestart:XXX -titleend:YYY -notitle -safe

ملاحظات

  1. لو طلبنا من بوت استخراج البيانات استخراج قيمة المتغير name التي تتواجد في أغلب قوالب صندوق المعلومات، سينتج لدينا عمودين في ملف الإكسل بنفس الاسم، علينا الانتباه إلى أن العمود الذي يوجد في نهاية الملف هو الذي يمثل اسم المقالة، أما العمود الآخر غالباً لا يمثل عنوان المقالة، وتختلف هذه الحالة حسب نوع المقالات لأنه ربما يكون اسم الشخص الثلاثي أو اختصار له أو اسم المدينة بدون اسم المنطقة أو....
  2. بعد الانتهاء من إعداد الملف النصي قم بتجربة إنشاء بعض المقالات في نطاقك الشخصي وذلك بتغير القيمة اسم المقالة بين XXX و YYY إلى صفحة فرعية في نطاقك الشخصي مثال مستخدم:Zaher kadour/تجربة1 وتأكد أن كل متغير أخذ قيمته وتأكد من وصلة الإنترويكي وأن المقالات لا تحتوي أخطاء. مثال1 مثال2 مثال3.
  3. في البداية قم بإنشاء خمس مقالات وتأكد من مراجعتهم بشكل دقيق وإذا كانت النتائج كما يجب أن تكون، يمكنك المتابعة بإنشاء جميع المقالات.