ترجمة بمساعدة الحاسوب

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث

نظرة عامة[عدل]

الـترجمة بمساعدة الحاسوب (ت م ح - CAT)، مصطلح واسع النطاق إذ يشمل مجموعة من الأدوات، من البسيطة إلى الأكثر تعقيداً إلى حدٍ ما. ويمكن لتلك أن تشمل:

  • المدققات الإملائية، إما أن تضاف إلى برنامج معالجة الكلمات، أو برامج إضافة.
  • مدققات القواعد، فهي أيضاً إما أن تركّب إلى برنامج معالجة الكلمات، أو برامج إضافة.
  • يتيح مديرو المصطلحات للمترجم إدارة بنك المصطلحات الخاص به بشكل إلكتروني. وهذا يمكن أن يتراوح إنشاؤه من خلال جدول بسيط في برنامج المترجم لمعالجة الكلمات أو جدول بيانات، قاعدة بيانات ُتنشأ في برنامج مثل FileMaker Pro

لنتائج أكثر قوةً (وأكثر تكلفةً), مجموعة برامج متخصصة مثل أو،LogiTerm, MultiTerm, Termex وغيرها.

  • المعاجم في القرص المدمج، إما أن تكون أحادية أو ثنائية اللغة.
  • قواعد البيانات، إما أن تكون على قرص مدمج أو يمكن الوصول إليها عن طريق شبكة الإنترنت (مثل منتدى المصطلحات المفتوحة

TERMIUM،أو بنوك المصطلحات الكبيرة من مكتب كويبيك للغة الفرنسية.

  • أدوات بحث النص الكامل (أو الفهرسة) تسمح للمستخدم بالاستفسار عن النصوص المترجمة والوثائق المرجعية في مختلف الأنواع، ويجد المرء في مجال الترجمة برامج فهرسة مثل natural وبرامح البحث أي أس وآي أس ISYA ودت سيرتش DT search.
  • وتساعد برامج كونكوردانسرز على استرجاع كلمة أو تعبير وكل منهما في سياق أحادي اللغة وثنائي اللغة أو متعدد اللغات مثل بايتكست (Bitext) أو ترجمة الذاكرة.
  • بايتكست ((Bitext هو تطور جديد نتيجة لدمج مصدر النص وترجمته والتي يمكن تحليلها باستخدام أداة بحث النص الكامل والكونكوردانسرز (concordancers).
  • وتتيح البرامج الحاسوبية لإدارة المشاريع للغويين البنية المعقدة لمشاريع الترجمة وإسناد المهام المختلفة لمختلف القطاعات النص في اللغة وترجمتها لعدة لغات.
  • وتعد الأنظمة الأوتوماتيكية تقريباً كالترجمة الآلية ولكنها تستخدم بالتقرير في الحالات الغامضة وهذه هي التي تسمى أحياناً بمساعد حقوق الترجمة الآلية.

برامج ذاكرة الترجمة[عدل]

تخزن مسبقاً برامج ذاكرة الترجمة النصوص الأصلية المترجمة والنصوص المقابلة لها في اللغة الأخرى في قاعدة بيانات وتسترجع الأجزاء المشابهة أو المرتبطة بالنصوص الجديدة خلال الترجمة. تقسم برامج كهذه النص الأصلي إلى وحدات سهل التحكم بها تعرف ب"الأجزاء. " فقد تعتبر جملة من النص الأصلي أو وحدة تشبه الجملة (رؤوس الأقلام أو العناوين أوعناصر في قائمة) جزءً بحد ذاتها أو قد تجزأ النصوص إلى وحدات أكبر كالفقرات أو أصغر كالجمل. بينما يعمل المترجم على ترجمة ملف ما، يعرض البرنامج كل جزء من النص الأصلي على التوالي ويوفر ترجمة سابقة لإعادة استعمالها وذلك إذا وجد البرنامج جزء مطابق للنص الأصلي في قاعدة بياناته.أما إذا لم يجد ما يناسبه فإن البرنامج يسمح للمترجم أن يدخل ترجمة للجزء الجديد ثم إذا اكتملت ترجمة الجزء يحفظها البرنامج وينتقل للجزء الجديد الذي يليه. إن ذاكرة الترجمة كمفهوم هي قاعدة بيانات بسيطة لحقول تحتوي على الجزء الأصلي وترجمته ومعلومات أخرى مثل تاريخ تكوين الجزء وآخر مرة أدخل فيه واسم المترجم وهكذا. هناك طريقة أخرى لذاكرة الترجمة لا يتضمن تكوين قاعدة بيانات بل يعتمد على وثائق مرجعية منحازة (مثل: ستار ترانزيت). تعمل بعض برامج ذاكرة الترجمة كبيئة لوحدها بينما البرامج الأخرى تعمل كبرامج قابلة للزيادة أو جامعة إلى معالجة الكلمات تجارياً أو برامج أخرى للعمل. ان البرامج القابلة للزيادة تسمح للملفات الأصلية من صيغ مختلفة مثل ملفات سطح المكتب وجداول البيانات ورمزHTML أن تستخدم بواسطة برنامج ذاكرة الترجمة.



التطبيقات[عدل]

هناك العديد من البرمجيات الخاصة بترجمة اللغة الطبيعية، العديد منها على الانترنت، مثل نظام systran الذي يدعم كل من ترجمة غوغل (google translate) وبابل فيش (babble fish)التابع لنظام آلتافيستا(Alta vista). وبالرغم من عدم توفر نظام الكأس المقدسة "النظام التلقائي للترجمة الآلية ذات الجودة العالية " (نتتاجع)، والعديد من النظم تنتج نواتج معقولة.

على الرغم من العيوب المتاصلة، فإن برامج الترجمة الآلية تستخدم في جميع أنحاء العالم. وعلى الأغلب فإن أكثر مستخدميه المؤسسين هم اللجنة الأوروبية.

يستخدم توغل تكست Toggletext نظام يقوم على نقل المعلومة معروف باسم (kataku) للترجمة بين اللغتين الانكليزيه والاندونيسيه.

ادعت غوغل انه تم الحصول على نتائج واعدة الملكية باستخدام محرك الترجمة الآلية الإحصاٍئية. لدى محرك الترجمة الإحصائية المستخدمة في أدوات غوغل للغات من اللغة العربية إلى الإنكليزية ومن الصينية إلى الإنجليزية قد شمل رصيد0.4281 أكثر من الوصيفه آى بى ام للbleu - 4 التي حصلت على 0.3954 نقطة (صيف 2006) في الاختبارات التي اجراها المعهد الوطني للمعايير والتكنولوجيا.

نفذت Uwe Mueggeموقع تجريبي يستخدم لغة مسيطرة تجمع بينها وبين اداة غوغل التي تنتج ترجمة آلية عالية الجودة باللغات الإنجليزية والالمانيه والفرنسية في موقعها على شبكة الإنترنت.

في الاونة الأخيرة مع التركيز على الارهاب، فان مصادر عسكرية في الولايات المتحدة قد استثمرت مبالغ كبيرة من المال في هندسة اللغة الطبيعية والهندسه. كما أن صندوق رأس المال الاستثماري التي تموله المخابرات الأمريكية للمجتمع، قد استثمر استثمار كبير من التكنولوجيات الجديدة لتنشيط القطاع الخاص وأصحاب المشاريع. إحدى الشركات المطروحة هي لانغويج ويفر. حاليا المجتمع العسكري مهتم بترجمة ومعالجة اللغات مثل العربية والباشتو والداري. مكتب تكنولوجيا معالجة المعلومات في داربا تستضيف برامج مثل المد والجزر ومترجم بابل. وقد منحت القوة الجوية الأمريكية عقد بمليون دولار لتطوير تكنولوجية ترجمة اللغات.

بعض تطبيقات الترجمة بمساعدة الحاسوب[عدل]

التطبيق صيغ الملفات المدعومة نظام التشغيل الترخيص
فِرتال Virtaal XLIFF, Gettext PO and MO, TMX, TBX, Wordfast TM, Qt ts متعدد المنصات (بايثون) رخصة جنو العمومية
GlobalSight Text ANSI / ASCII / Unicode for Windows, Text for Apple Macintosh, HTML, XML (ASP.NET, ASP, JSP, XSL), SGML, SVG (Scalable Vector Graphics), MS Word for Windows, MS Excel, MS PowerPoint, RTF, RC, QuarkXPress, Adobe FrameMaker, Adobe PageMaker, Interleaf /Quicksilver, Adobe InDesign متعدد المنصات (جافا) رخصة أباتشي 2.0
gtranslator PO POSIX رخصة جنو العمومية
لوكالايز Lokalize Gettext PO, Qt ts, XLIFF متعدد المنصات رخصة جنو العمومية
OmegaT Plain text, HTML, XHTML, StarOffice, OpenOffice.org, OpenDocument (ODF), MS Office Open XML, Help & Manual, HTML Help Compiler (HCC), LaTeX, DokuWiki, QuarkXPress CopyFlow Gold, DocBook, Android Resource, Java Properties, Typo3 LocManager, Mozilla DTD, Windows RC, WiX, ResX, INI files, XLIFF, Gettext PO, SubRip Subtitles, SVG Images متعدد المنصات (جافا) رخصة جنو العمومية
Open Language Tools XLIFF, HTML/XHTML, XML, DocBook SGML, ASCII, StarOffice/OpenOffice/ODF, .po (gettext), .properties, .java (ResourceBundle), .msg/.tmsg (catgets) متعدد المنصات (جافا) CDDL
Poedit Gettext PO متعدد المنصات رخصة إم إي تي
Pootle Gettext PO, XLIFF, OpenOffice GSI files (.sdf), TMX, TBX, Java Properties, DTD, CSV, HTML, XHTML, Plain Text متعدد المنصات (بايثون) رخصة جنو العمومية