المعرف الكيميائي الدولي

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث

المعرف الكيميائي الدولي (بالإنجليزية: IUPAC International Chemical Identifier) ويرمز له (InChI) وتلفظ (إنشي) وهي تعريفات نصية للمواد الكيميائية، مصممة لكي تعطي طريقة معيارية مقروءة بشريا تستخدم لتشفير المعلومات الجزيئية بحيث تسهل البحث عن هذه المعلومات في قواعد البيانات، وعلى الشبكة العنكبوتية. وقد طورها الاتحاد الدولي للكيمياء البحتة والتطبيقية والمعهد الوطني للمعايير والتقنية (National Institute of Standards and Technology) خلال الأعوام 2000-2005، حيث الشكل والخوارزميات غير مسجلة الملكية والبرمجيات مجانية تحت رخصة مفتوحة المصدر LGPL (رغم أن مصطلح "InChI" هي علامة تجارية للاتحاد الدولي للكيمياء البحتة والتطبيقية).[1]

نظرة شاملة[عدل]

تصف المعرفات المواد الكيميائية باعتبارها "طبقات" من المعلومات، تتعلق بالذرات وروابطها، ومعلومات المماثل الكيميائي (tautomer)، ومعلومات النظائر، والكيمياء الفراغية، والمعلومات عن الشحنة الإلكترونية. ليس من الواجب تقديم جميع الطبقات؛ على سبيل المثال، يمكن إغفال طبقة المماثل الكيميائي ( tautomer) إذا كان هذا النوع من المعلومات غير متصل بتطبيق معين.

تختلف المعرفات الكيميائية الدولية عن أرقام التسجيل كاس في عدد من الجوانب وهي:

  • أنها قابلة للاستخدام بحرية وبدون ملكية؛
  • يمكن حسابها من المعلومات الهيكلية وليس من الضروري أن تكون منظمة من قبل بعض المنظمات؛
  • معظم المعلومات في إنشي مقروءة بشريا (لمن يمارسها).

يمكن النظر إلى إنشي على أنها نسخة رسمية وعامة للغاية من تسمية الاتحاد الدولي للكيمياء البحتة والتطبيقية. يمكن للمعرفات الكيميائية الدولية التعبير عن مزيد من المعلومات مقارنة بترميز مواصفات الإدخال النصي المبسط للجزيئات، وتختلف في أن كل بنية هيكلية لها سلسلة إنشي وحيدة وهو أمر هام في تطبيقات قواعد البيانات. المعلومات عن الإحداثيات ثلاثية الأبعاد للذرات غير ممثلة في الإنشي، ولهذا الغرض يمكن استخدام نمط مثل بنك معلومات البروتينات (Protein Data Bank).

إن خوارزمية إنشي تحول المعلومات الهيكلية المدخلة إلى معرف إنشي وحيد في عملية ثلاثية الخطوات: التسوية (normalization) (لإزالة المعلومات الزائدة)، التمثيل القانوني (canonicalization) (لتوليد عنوان عددي وحيد لكل ذرة)، والتسلسل (serialization)(لتقديم سلسلة من الحروف).

إن مفتاح الإنشي (InChIKey)، ويشار إليه أحيانا (Hashed InChI)، هو تمثيل رقمي مكثف ثابت الطول (25 محرفا) للإنشي لايمكن للإنسان فهمه. وقد أصدرت مواصفات مفتاح الإنشي في أيلول 2007 من أجل تسهيل عمليات البحث على الشبكة العالمية عن المركبات الكيميائية، لأنها كانت تسبب بعض المشاكل مع الطول الكامل للإنشي.[2]

أمثلة[عدل]

CH3CH2OH
إيثانول
InChI=1/C2H6O/c1-2-3/h3H,2H2,1H3
L-Ascorbic acid.svg
L-حمض الأسكوربيك
InChI=1/C6H8O6/c7-1-2(8)5-3(9)4(10)6(11)12-5/h2,5,7-10H,1H2/t2-,5+/m0/s1

بنية الإنشي والطبقات[عدل]

يبدأ كل إنشي بالشكل المحرفي "InChI =" يليه رقم النسخة، وهي حاليا 1. تنظم بقية المعلومات وفق سلسلة من الطبقات والطبقات الثانوية، حيث تقدم كل طبقة نوعا واحدا ومعينا من المعلومات. يفصل خط مائل طبقات "/" بين الطبقات والطبقات الثانوية، وتبدأ بحرف معين ومميز (باستثناء الطبقة الثانوية للصيغة الكيميائية للطبقة الرئيسية). إن الطبقات الست مع الطبقات الثانوية الهامة هي:

  1. الطبقة الرئيسية
    • الصيغة الكيميائية (بدون بادئة). وهذه هي الطبقة الثانوية فقط الني يحب أن تكون موجودة في كل إنشي.
    • ارتباطات الذرة (البادئة : "c"). الذرات في الصيغة الكيميائية (باستثناء ذرات الهيدروجين) ترقم بالتسلسل؛ هذه الطبقة الثانوية تصف أي من الذرات مرتبطة مع الذرات الأخرى.
    • ذرات الهيدروجين (البادئة : "h"). تصف كيفية ارتباط ذرات الهيدروجين مع كل من الذرات أخرى.
  2. طبقة الشحنة.
    • طبقة ثانوية مشحونة إيجابيا (البادئة : "p")
    • طبقة ثانوية مشحونة سالبيا (البادئة : "q")
  3. طبقة كيميائية فراغية
  4. طبقة النظائر
  5. طبقة H الثابتة
  6. طبقة إعادة التوصيل

الحرف البادئ المحدد له ميزة أنه يمكن للمستخدم بسهولة البحث وفق المحارف لإيجاد المعرفات التي تتطابق فقط في بعض الطبقات.

مفتاح الإنشي[عدل]

اقرأ أيضا[عدل]

المراجع[عدل]

  1. ^ McNaught، Alan (2006). "The IUPAC International Chemical Identifier:InChl". Chemistry International 28 (6) (IUPAC). اطلع عليه بتاريخ 2007-09-18. 
  2. ^ "The IUPAC International Chemical Identifier (InChI)". IUPAC. 5 September 2007. اطلع عليه بتاريخ 2007-09-18. 

وصلات خارجية[عدل]

ملفات توضيحية[عدل]

برامج وخدمات[عدل]

  • Generate InChI (interactive service at University of Cambridge, either interactive or WSDL)
  • Search Google for molecules (generates InChI from interactive chemical and searches Google for any pages with embedded InChIs). Requires Javascript enabled on browser
  • ChemSketch, free chemical structure drawing package that includes input and output in InCHI format
  • PubChem online molecule editor that supports SMILES/SMARTS and InChI
  • ChemSpider Services that allows generation of InChI and conversion of InChI to structure (also SMILES and generation of other properties)
  • MarvinSketch from ChemAxon, implementation to draw structures (or open other file formats) and output to InChI file format
  • InChIMatic Draw your molecule and Google will search for it
  • BKchem implements its own InChI parser and uses the IUPAC implementation to generate InChIstrings