مستخدم:Ezaleslam/جودة البيانات

من ويكيبيديا، الموسوعة الحرة


تشير جودة البيانات إلى حالة كمية المعلومات سواءً كانت نوعية أو كمية . هناك المزيد من تعريفات جودة البيانات ، ولكن البيانات تعتبر بشكل عام ذات جودة عالية إذا كانت "مناسبة [لها] للاستخدام المقصود في العمليات وصنع القرار والتخطيط ". [1] [2] [3] علاوةً على ذلك ، تعتبر البيانات ذات جودة عالية إذ أنها ستمثل بشكل صحيح تكوين العالم الحقيقي التي يشير إليها.

وبخلاف هذه التعريفات ، تعيش مجتمعات ما بعد الصناعة والأكثر تطوراً بالمعلومات وتكنولوجيا الاتصالات وأصبح مصطلح جودة البيانات شائع جداً وكلما زادت جودة البيانات أزدهرت هذه المجتمعات أكثر[4]، والزيادة في عدد مصادر البيانات ، تصبح مسألة اتساق البيانات الداخلية مهمة ، بغض النظر عن مدى ملائمتها لأي غرض خارجي معين. غالبًا ما يكون لدى الأشخاص أفكار مختلفة حول جودة البيانات ، حتى عند مناقشة نفس مجموعة البيانات المستخدمة لنفس الغرض. في تفس السياق ، يتم استخدام إدارة البيانات لتشكيل تعريفات ومعايير جودة البيانات المتفق عليها. في مثل هذه الحالات ، قد يلزم تنقية البيانات ، بما في ذلك التوحيد القياسي ، لضمان جودة البيانات. [5]


التعريفات[عدل]

يعد تحديد جودة البيانات أمراً صعباً نظراً للسياقات المتعددة التي يتم تستخدم فيها البيانات ، ووجهات النظر المختلفة بين المستخدمين النهائيين والمنتجين وأمناء البيانات.[6]

من منظور المستهلك ، جودة البيانات هي: [6]

  • "البيانات الصالحة للإستخدام من قبل مستهلكي البيانات"
  • البيانات التي"تلبي أو تتجاوز توقعات المستهلك"
  • البيانات التي "تفي بمتطلبات الاستخدام المقصود"

من منظور الأعمال التجارية ، فإن جودة البيانات هي:

  • البيانات "الملائمة للاستخدام" في أدوارها التشغيلية واتخاذ القرار والأدوار الأخرى المقصودة "أو التي تثبت" التوافق مع المعايير "التي تم وضعها ، بحيث يتم لتحقيق الملائمة للاستخدام" [7]
  • البيانات "الملائمة للاستخدامات المقصودة في العمليات واتخاذ القرار والتخطيط" [8]
  • "قدرة البيانات على تلبية متطلبات الأعمال والنظام والمتطلبات الفنية لمؤسسة ما" [9]

من المنظور القائم على المعايير ، فإن جودة البيانات هي:

  • "الدرجة التي تفي بها مجموعة من الخصائص المتأصلة (أبعاد الجودة) للكائن (البيانات) بالمتطلبات" [10] [6]
  • "فائدة البيانات ودقتها وصحتها لتطبيقها" [11]

يمكن القول ، في جميع هذه الحالات ، "جودة البيانات" هي مقارنة الحالة الفعلية لمجموعة معينة من البيانات بالحالة المرغوبة ، والتي يشار إليها غالبًا باسم "ملائمة للاستخدام" ، "للمواصفات" ، "لتلبية توقعات المستهلك" أو "خالية من العيوب" أو "تفي بالمتطلبات". غالبًا ما يتم صياغة هذه التوقعات والقواعد والمتطلبات بواسطة فرد أو أكثر أو مجموعات أو منظمات معايير أو قوانين ولوائح أو سياسات التوظيف أو سياسات تطوير البرامج. [6]

أبعاد جودة البيانات[عدل]

عندالتعمق أكثر ، يتم تحديد تلك التوقعات والمواصفات والمتطلبات من حيث الخصائص أو أبعاد البيانات ، أمثلة: [6] [7] [8] [9] [12]

  • إمكانية الوصول أو التوفر
  • الدقة أو الصحة
  • قابلية المقارنة
  • الكمال أو الشمولية
  • الاتساق والتماسك والوضوح
  • المصداقية أو الثقة أو الصيت
  • المرونة
  • المعقولية
  • الملاءمة أو الصلة أو الفائدة
  • حسن التوقيت أو الكمون
  • التفرد
  • الصلاحية أو المعقولية

تشير مراجعة تحديد النطاق المنهجية للأدبيات إلى أن أبعاد جودة البيانات والأساليب ذات البيانات الحقيقية لا تتسق في الأدبيات ، ونتيجة لذلك فإن تقييمات الجودة تمثل تحديًا بسبب الطبيعة المعقدة وغير المتجانسة لهذه البيانات.[12]

تاريخ[عدل]

قبل ظهور تخزين بيانات الكمبيوتر غير المكلف ، تم استخدام أجهزة الكمبيوتر الضخمة الحاسوبية للحفاظ على بيانات الاسم والعناوين لخدمات التوصيل. كان هذا حتى يمكن توجيه البريد بشكل صحيح إلى وجهته. استخدمت الحواسيب المركزية قواعد العمل لتصحيح الأخطاء الإملائية الشائعة والأخطاء المطبعية في الإسم والعناوين ، وكذلك تتبع العملاء الذين انتقلوا أو ماتوا أو ذهبوا إلى السجن أو المتزوجين أو المطلقون أو من عانى من أي أحداث أخرى غيرت حياتهم، الوكالات الحكومية بدأت في إتاحة البيانات البريدية لعدد قليل من الشركات الخاصة بخدمات ألإحالة المرجعية لبيانات العملاء مع السجل الوطني لتغيير العنوان (NCOA) . وفرت هذه التكنولوجيا على الشركات الكبيرة ملايين من الدولارات مقارنةً بالتصحيح اليدوي لبيانات العميل، تم توفير الشركات الكبيرة على الطوابع البريدية ، حيث وصلت الفواتير والمواد التسويقية المباشرة إلى العميل المقصود بشكل أكثر دقة، تم بيع جودة البيانات في البداية كخدمة ، حيث تم نقل جودة البيانات داخل جدران الشركات ، حيث أصبحت تقنية الخادم منخفضة التكلفة ومتاحة بشكل أقوى.

غالبا ما ركزت الشركات التي تركز على التسويق جهودها في مجال الجودة على معلومات الاسم والعنوان ، ولكن يتم التعرف على جودة البيانات  كخاصية مهمة لجميع أنواع البيانات. يمكن تطبيق مبادئ جودة البيانات على بيانات سلسلة التوريد وبيانات المعاملات وتقريبا كل فئة أخرى من البيانات الموجودة. على سبيل المثال ، جعل بيانات سلسلة التوريد مطابقة لمعيار معين له قيمة بالنسبة للمؤسسة من خلال: 1) تجنب التخزين الزائد لمخزون مشابه ولكنه مختلف قليلا ؛ 2) تجنب المخزون الخاطئ ؛ 3) تحسين فهم مشتريات البائعين للتفاوض على خصومات الحجم ؛ و 4) تجنب التكاليف اللوجستية في تخزين وشحن الأجزاء عبر مؤسسة كبيرة. 

بالنسبة للشركات التي تبذل جهودًا بحثية كبيرة ، يمكن أن تشمل جودة البيانات تطوير بروتوكولات لطرق البحث ، وتقليل أخطاء القياس ، وفحص حدود البيانات ، وجدولة متقاطعة ، والنمذجة ، واكتشاف الحالات الخارجية ، والتحقق من سلامة البيانات ، وما إلى ذلك. 

ملخص[عدل]

هناك عدد من الأطر النظرية لفهم جودة البيانات. يوسع النهج النظري للأنظمة المتأثر بالبراغماتية الأمريكية تعريف جودة البيانات ليشمل جودة المعلومات ، ويؤكد على شمولية الأبعاد الأساسية للدقة على أساس نظرية العلوم (إيفانوف 1972) ، يتكيف أحد إطار عمل يطلق عليه "بيانات العيوب الصفرية" (Hansen ، 1991) مع مبادئ التحكم في العملية الإحصائية مع جودة البيانات. يسعى إطار آخر إلى دمج منظور المنتج (المطابقة للمواصفات) ومنظور الخدمة (تلبية توقعات المستهلكين) (Kahn et al ، 2002). ويعتمد إطار عمل آخر يستند إلى semiotics لتقييم جودة النموذج والمعنى واستخدام البيانات (Price and Shanks ، 2004). يحلل أحد النهج النظري للغاية الطبيعة الأنطولوجية لأنظمة المعلومات لتحديد جودة البيانات بدقة (Wand and Wang ، 1996).

يتضمن كمية كبيرة من أبحاث جودة البيانات التحقيق ووصف فئات مختلفة من السمات (أو الأبعاد) المرغوبة للبيانات.تم تحديد ما يقرب من 200 مصطلح ، وهناك القليل من الاتفاق في طبيعتها (هل هذه المفاهيم الأهداف أو المعايير?) ، تعريفاتها أو تدابيرها (Wang et al., 1993). قد يتعرف مهندسو البرمجيات على هذا كمشكلة مماثلة لـ "ilities".

لدى معهد ماساتشوستس للتكنولوجيا برنامج جودة المعلومات (MITIQ) ، بقيادة البروفيسور ريتشارد وانج ، والذي ينتج عدداً كبيراً من المنشورات ويستضيف مؤتمراً دولياً مهماً في هذا المجال (المؤتمر الدولي لجودة المعلومات ، ICIQ). نشأ هذا البرنامج من العمل الذي قام به هانسن في إطار "بيانات الخلل الصفري" (هانسن ، 1991).

من الناحية العملية ، تعد جودة البيانات مصدر قلق للمهنيين المشاركين في مجموعة واسعة من أنظمة المعلومات ، بدءًا من تخزين البيانات و ذكاء الأعمال، لإدارة علاقات العملاء و إدارة سلسلة التوريد. قدرت إحدى الدراسات الصناعية التكلفة الإجمالية التي يتحملها الاقتصاد الأمريكي لمشاكل جودة البيانات بأكثر من 600مليار دولار أمريكي سنوياً (Eckerson، 2002). يمكن أن تنشأ البيانات غير الصحيحة التي تتضمن معلومات غير صالحة وقديمة من مصادر بيانات مختلفة - من خلال إدخال البيانات أو ترحيل البيانات ومشاريع التحويل.[13]

في عام 2002 ، أصدرت USPS و PricewaterhouseCoopers تقريرًا يفيد بأن 23.6 في المائة من جميع رسائل البريد الأمريكية المرسلة تمت معالجتها بشكل غير صحيح. [14]

أحد أسباب تقادم بيانات الاتصال بسرعة كبيرة في قاعدة البيانات المتوسطة - أكثر من 45 مليون أمريكي يغيرون عناوينهم كل عام. [15]

في الواقع ، تكمن المشكلة في أن الشركات بدأت في تشكيل فريق إدارة البيانات الذي يتمثل دوره الوحيد في الشركة في أن يكون مسؤولاً عن جودة البيانات. في بعض  المنظمات ، تم إنشاء وظيفة حوكمة البيانات هذه كجزء من وظيفة الامتثال التنظيمي الأكبر - اعترافًا بأهمية جودة البيانات / المعلومات للمؤسسات.

لا تنشأ مشاكل جودة البيانات فقط من البيانات غير الصحيحة ؛ البيانات غير المتسقة هي مشكلة أيضًا. يعد القضاء على أنظمة ظل البيانات ومركزية البيانات في المستودع إحدى المبادرات التي يمكن أن تتخذها الشركة لضمان اتساق البيانات.

بدأت الشركات والعلماء والباحثون في المشاركة داخل مجتمعات معالجة البيانات لتحسين جودة بياناتهم المشتركة. [16]

يسير السوق بطريقة ما لتوفير ضمان جودة البيانات. يقوم عدد من البائعين بعمل أدوات لتحليل وإصلاح البيانات ذات الجودة الرديئة في الموقع ، ويمكن لمقدمي الخدمات تنظيف البيانات على أساس العقد ويمكن للمستشارين تقديم المشورة بشأن إصلاح العمليات أو الأنظمة لتجنب مشاكل جودة البيانات في المقام الأول. تقدم معظم أدوات جودة البيانات سلسلة من الأدوات لتحسين البيانات ، والتي قد تتضمن بعض أو كل ما يلي:

  • تصنيف البيانات - التقييم المبدئي للبيانات لفهم حالتها الحالية ، وغالبًا ما تتضمن توزيعات القيمة
  • توحيد البيانات - محرك قواعد العمل الذي يضمن أن البيانات تتوافق مع المعايير
  • التكويد الجغرافي - لبيانات الاسم والعنوان. يصحح البيانات وفقًا للمعايير الجغرافية الأمريكية والعالمية
  • المطابقة أو الارتباط - طريقة لمقارنة البيانات بحيث يمكن محاذاة السجلات المتشابهة ولكن المختلفة قليلاً. قد تستخدم المطابقة "المنطق الضبابي" للعثور على التكرارات في البيانات. غالبًا ما تدرك أن "Bob" و "Bbo" قد يكونان نفس الشخص. قد تكون قادرة على إدارة "الأسرة" ، أو العثور على روابط بين الزوجين في نفس العنوان ، على سبيل المثال. أخيرًا ، غالبًا ما يمكنه إنشاء سجل "أفضل ما في السلالة" ، مع أخذ أفضل المكونات من مصادر بيانات متعددة وإنشاء سجل فائق واحد.
  • المراقبة - تتبع جودة البيانات بمرور الوقت والإبلاغ عن الاختلافات في جودة البيانات. يمكن للبرنامج أيضًا تصحيح الاختلافات تلقائيًا بناءً على قواعد العمل المحددة مسبقًا.
  • الدُفعات والوقت الفعلي - بمجرد تنظيف البيانات في البداية (دفعة) ، غالبًا ما ترغب الشركات في دمج العمليات في تطبيقات المؤسسة للحفاظ على نظافتها.

هناك العديد من المؤلفين المشهورين والخبراء المصنفين بأنفسهم ، وربما يكون لاري إنجليش هو المعلم الأكثر شهرة. بالإضافة إلى ذلك ، تأسست منظمة IQ International - الرابطة الدولية للمعلومات وجودة البيانات في عام 2004 لتوفير نقطة محورية للمهنيين والباحثين في هذا المجال.

ISO 8000 هو معيار دولي لجودة البيانات. [17]

ضمان جودة البيانات[عدل]

ضمان جودة البيانات هو عملية تنميط البيانات لاكتشاف التناقضات والشذوذ الأخرى في البيانات ، بالإضافة إلى تنفيذ أنشطة تنقية البيانات [18] [19] (مثل إزالة القيم المتطرفة ، واستيفاء البيانات المفقودة ) لتحسين جودة البيانات.

يمكن تنفيذ هذه الأنشطة كجزء من تخزين البيانات أو كجزء من إدارة قاعدة البيانات لجزء موجود من برنامج التطبيق . [20]

مراقبة جودة البيانات[عدل]

مراقبة جودة البيانات هي عملية التحكم في استخدام البيانات لتطبيق أو عملية. يتم تنفيذ هذه العملية قبل وبعد عملية ضمان جودة البيانات (QA) ، والتي تتكون من اكتشاف عدم تناسق البيانات وتصحيحها.

قبل:

يقيد المدخلات

بعد عملية ضمان الجودة ، يتم جمع الإحصائيات التالية لتوجيه عملية مراقبة الجودة (QC):

  • شدة التناقض
  • عدم الاكتمال
  • الدقة
  • الإحكام
  • مفقود / غير معروف

تستخدم عملية مراقبة جودة البيانات المعلومات من عملية ضمان الجودة لتقرير استخدام البيانات للتحليل أو في تطبيق أو عملية تجارية. مثال عام: إذا وجدت عملية مراقبة جودة البيانات أن البيانات تحتوي على عدد كبير جدًا من الأخطاء أو التناقضات ، فإنها تمنع استخدام هذه البيانات في العملية المقصودة مما قد يتسبب في حدوث اضطراب. مثال محدد: قد يؤدي توفير قياسات غير صالحة من عدة أجهزة استشعار إلى ميزة الطيار الآلي على متن طائرة إلى تعطلها. وبالتالي ، فإن إنشاء عملية مراقبة الجودة يوفر حماية لاستخدام البيانات. 

الاستخدام الأمثل لجودة البيانات[عدل]

تعد جودة البيانات (DQ) مجالًا متخصصًا مطلوبًا لسلامة إدارة البيانات من خلال تغطية الفجوات في قضايا البيانات. هذه إحدى الوظائف الرئيسية التي تساعد في إدارة البيانات من خلال مراقبة البيانات للعثور على استثناءات لم تكتشفها عمليات إدارة البيانات الحالية. يمكن تحديد فحوصات جودة البيانات على مستوى السمة للتحكم الكامل في خطوات الإصلاح الخاصة بها. 

قد تتداخل فحوصات DQ وقواعد العمل بسهولة إذا لم تكن المنظمة منتبهًا لنطاق DQ الخاص بها. يجب أن تفهم فرق العمل نطاق DQ تمامًا لتجنب التداخل. تكون فحوصات جودة البيانات زائدة عن الحاجة إذا كان منطق الأعمال يغطي نفس الوظيفة ويفي بنفس الغرض مثل DQ. يجب تحديد نطاق DQ للمنظمة في استراتيجية DQ وتنفيذها بشكل جيد. قد تتم ترجمة بعض فحوصات جودة البيانات إلى قواعد عمل بعد تكرار حالات الاستثناءات في الماضي. 

فيما يلي بعض مجالات تدفق البيانات التي قد تحتاج إلى فحوصات DQ الدائمة:

يمكن إجراء فحوصات الدقة والاكتمال DQ على جميع البيانات عند نقطة الدخول لكل سمة إلزامية من كل نظام مصدر. يتم إنشاء قيم قليلة للسمات بعد الإنشاء الأولي للمعاملة ؛ في مثل هذه الحالات ، تصبح إدارة هذه الفحوصات صعبة ويجب إجراؤها فورًا بعد الحدث المحدد لمصدر تلك السمة واستيفاء شروط السمة الأساسية الأخرى للمعاملة.

يمكن التحقق من صحة جميع البيانات التي تحتوي على سمات تشير إلى البيانات المرجعية في المؤسسة مقابل مجموعة القيم الصالحة المحددة جيدًا للبيانات المرجعية لاكتشاف قيم جديدة أو متناقضة من خلال التحقق من الصلاحية DQ. يمكن استخدام النتائج لتحديث البيانات المرجعية المُدارة بموجب إدارة البيانات الرئيسية (MDM) .

قد تخضع جميع البيانات التي يتم الحصول عليها من طرف ثالث إلى الفرق الداخلية للمؤسسة لفحص دقيق (DQ) مقابل بيانات الطرف الثالث. تعتبر نتائج فحص DQ هذه ذات قيمة عند إدارتها على البيانات التي قامت بقفزات متعددة بعد نقطة إدخال تلك البيانات ولكن قبل أن يتم التصريح بهذه البيانات أو تخزينها لذكاء المؤسسة.

يمكن التحقق من صحة جميع أعمدة البيانات التي تشير إلى البيانات الرئيسية للتحقق من التناسق . يكتشف فحص DQ الذي يتم إدارته على البيانات عند نقطة الإدخال بيانات جديدة لعملية MDM ، لكن فحص DQ الذي يتم إدارته بعد نقطة الدخول يكتشف فشل (وليس استثناءات) في الاتساق.

مع تحول البيانات ، يتم التقاط طوابع زمنية متعددة ومواقع تلك الطوابع الزمنية ويمكن مقارنتها مع بعضها البعض ومدى صلاحيتها للتحقق من قيمتها ، وانحلالها ، وأهميتها التشغيلية مقابل اتفاقية مستوى خدمة محددة (اتفاقية مستوى الخدمة). يمكن استخدام فحص التوقيت DQ هذا لتقليل معدل اضمحلال قيمة البيانات وتحسين سياسات الجدول الزمني لحركة البيانات.

عادة ما يتم فصل المنطق المعقد في المنظمة إلى منطق أبسط عبر عمليات متعددة. المعقولية يتحقق DQ من مثل هذا المنطق المعقد الذي يؤدي إلى نتيجة منطقية ضمن نطاق محدد من القيم أو العلاقات المتبادلة الثابتة (قواعد العمل المجمعة) يمكن التحقق من صحتها لاكتشاف العمليات التجارية المعقدة ولكن الحاسمة والقيم المتطرفة للبيانات ، وانحرافها عن BAU (العمل كالمعتاد ) التوقعات ، وقد توفر استثناءات محتملة تؤدي في النهاية إلى مشكلات في البيانات. قد يكون هذا الفحص عبارة عن قاعدة تجميع عامة بسيطة غارقة في جزء كبير من البيانات أو يمكن أن يكون منطقًا معقدًا على مجموعة من سمات المعاملة المتعلقة بالأعمال الأساسية للمؤسسة. يتطلب فحص DQ درجة عالية من المعرفة والفطنة في مجال الأعمال. قد يساعد اكتشاف مسائل المعقولية في إجراء تغييرات في السياسة والاستراتيجية من خلال إدارة الأعمال أو البيانات أو كليهما.

هناك العديد من الأماكن في حركة البيانات حيث قد لا تكون فحوصات DQ مطلوبة. على سبيل المثال ، يعد التحقق من DQ للاكتمال والدقة في الأعمدة غير الفارغة مكررًا للبيانات التي تم الحصول عليها من قاعدة البيانات. وبالمثل ، يجب التحقق من صحة البيانات للتأكد من دقتها فيما يتعلق بالوقت الذي يتم فيه تجميع البيانات عبر مصادر مختلفة. ومع ذلك ، فهذه قاعدة عمل ولا ينبغي أن تكون في نطاق DQ. 

للأسف ، من منظور تطوير البرمجيات ، غالبًا ما يُنظر إلى DQ على أنه شرط غير وظيفي. وعلى هذا النحو ، لا يتم أخذ عمليات فحص / عمليات جودة البيانات الرئيسية في الاعتبار في حل البرنامج النهائي. في مجال الرعاية الصحية ، تُنشئ التقنيات القابلة للارتداء أو شبكات منطقة الجسم كميات كبيرة من البيانات. [21] مستوى التفاصيل المطلوب لضمان جودة البيانات مرتفع للغاية وغالبًا ما يتم التقليل من شأنه. وينطبق هذا أيضًا على الغالبية العظمى من تطبيقات الصحة المحمولة والسجلات الصحية الإلكترونية وغيرها من الحلول البرمجية المتعلقة بالصحة. ومع ذلك ، توجد بعض الأدوات مفتوحة المصدر التي تفحص جودة البيانات. [22] السبب الرئيسي لذلك ، ينبع من التكلفة الإضافية المتضمنة إضافة درجة أعلى من الصرامة داخل بنية البرنامج.

أمن البيانات الصحية والخصوصية[عدل]

يؤدي استخدام الأجهزة المحمولة في مجال الصحة ، أو mHealth ، إلى خلق تحديات جديدة لأمن البيانات الصحية وخصوصيتها ، بطرق تؤثر بشكل مباشر على جودة البيانات. [2] تعد الصحة المحمولة استراتيجية متزايدة الأهمية لتقديم الخدمات الصحية في البلدان منخفضة ومتوسطة الدخل. [23] تُستخدم الهواتف المحمولة والأجهزة اللوحية لجمع البيانات وإعداد التقارير عنها وتحليلها في الوقت الفعلي تقريبًا. ومع ذلك ، تُستخدم هذه الأجهزة المحمولة بشكل شائع في الأنشطة الشخصية أيضًا ، مما يجعلها أكثر عرضة لمخاطر الأمان التي قد تؤدي إلى انتهاكات البيانات. بدون ضمانات أمنية مناسبة ، قد يؤدي هذا الاستخدام الشخصي إلى تعريض جودة البيانات الصحية وأمانها وسريتها للخطر. [24]

جودة البيانات في الصحة العامة[عدل]

أصبحت جودة البيانات محورًا رئيسيًا لبرامج الصحة العامة في السنوات الأخيرة ، خاصة مع زيادة الطلب على المساءلة. [25] يجب أن يستند العمل نحو أهداف طموحة تتعلق بمكافحة الأمراض مثل الإيدز والسل والملاريا إلى أنظمة مراقبة وتقييم قوية تنتج بيانات عالية الجودة تتعلق بتنفيذ البرنامج. [26] تسعى هذه البرامج ومدققو البرامج بشكل متزايد إلى أدوات لتوحيد وتبسيط عملية تحديد جودة البيانات ، [27] والتحقق من جودة البيانات المبلغ عنها ، وتقييم إدارة البيانات الأساسية وأنظمة إعداد التقارير الخاصة بالمؤشرات. [28] ومن الأمثلة على ذلك أداة مراجعة جودة البيانات الخاصة بمنظمة الصحة العالمية و MEASURE Evaluation [29] تعاونت منظمة الصحة العالمية والصندوق العالمي والتحالف العالمي للقاحات والتحصين وتقييم MEASURE لإنتاج نهج منسق لضمان جودة البيانات عبر مختلف الأمراض والبرامج. [30]

جودة البيانات المفتوحة[عدل]

هناك عدد من الأعمال العلمية المكرسة لتحليل جودة البيانات في مصادر البيانات المفتوحة ، مثل Wikipedia و Wikidata و DBpedia وغيرها. في حالة ويكيبيديا ، قد يتعلق تحليل الجودة بالمقال بأكمله [31] يتم تنفيذ نمذجة الجودة هناك عن طريق طرق مختلفة. يستخدم بعضهم خوارزميات التعلم الآلي ، بما في ذلك Random Forest ، [32] Support Vector Machine ، [33] وغيرها. تختلف طرق تقييم جودة البيانات في Wikidata و DBpedia ومصادر LOD الأخرى. [34]

الجمعيات المهنية[عدل]

IQ International - الرابطة الدولية لجودة المعلومات والبيانات [35]
IQ International هي جمعية مهنية غير هادفة للربح ، محايدة للبائعين تأسست في عام 2004 ، مكرسة لبناء مهنة جودة المعلومات والبيانات.

ECCMA (جمعية إدارة رمز التجارة الإلكترونية)[عدل]

جمعية إدارة رمز التجارة الإلكترونية (ECCMA) هي جمعية دولية غير ربحية قائمة على الأعضاء وتلتزم بتحسين جودة البيانات من خلال تنفيذ المعايير الدولية. ECCMA هي الشركة الرائدة حاليًا في مشروع تطوير ISO 8000 و ISO 22745 ، وهما المعياران الدوليان لجودة البيانات وتبادل البيانات الرئيسية للمواد والخدمات ، على التوالي. يوفر ECCMA منصة للتعاون بين الخبراء المتخصصين في جودة البيانات وحوكمة البيانات في جميع أنحاء العالم لبناء وصيانة قواميس قياسية عالمية ومفتوحة تُستخدم لتسمية المعلومات بشكل لا لبس فيه. يسمح وجود قواميس الملصقات هذه بتمرير المعلومات من نظام كمبيوتر إلى آخر دون فقدان المعنى. [36]

أنظر أيضا[عدل]

References[عدل]

  1. ^ Redman، Thomas C. (30 ديسمبر 2013). Data Driven: Profiting from Your Most Important Business Asset. Harvard Business Press. ISBN:978-1-4221-6364-1.
  2. ^ أ ب Fadahunsi، Kayode Philip؛ Akinlua، James Tosin؛ O’Connor، Siobhan؛ Wark، Petra A؛ Gallagher، Joseph؛ Carroll، Christopher؛ Majeed، Azeem؛ O’Donoghue، John (مارس 2019). "Protocol for a systematic review and qualitative synthesis of information quality frameworks in eHealth". BMJ Open. ج. 9 ع. 3: e024722. DOI:10.1136/bmjopen-2018-024722. ISSN:2044-6055. PMID:30842114. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  3. ^ Fadahunsi, Kayode Philip; O'Connor, Siobhan; Akinlua, James Tosin; Wark, Petra A.; Gallagher, Joseph; Carroll, Christopher; Car, Josip; Majeed, Azeem; O'Donoghue, John (17 May 2021). "Information Quality Frameworks for Digital Health Technologies: Systematic Review". Journal of Medical Internet Research (بالإنجليزية). 23 (5): e23479. DOI:10.2196/23479. PMID:33835034. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (help)صيانة الاستشهاد: دوي مجاني غير معلم (link)
  4. ^ Floridi, Luciano (31 Jan 2013). "Information quality" (Bronze Open Access) (بالإنجليزية). United Kingdom: School of Humanities, University of Hertfordshire de Havilland Campus, Hatfield, Hertfordshire AL10 9AB. DOI:10.1007/s13347-013-0101-3. ISSN:2210-5441. Retrieved 2022-12-15. {{استشهاد بدورية محكمة}}: الاستشهاد بدورية محكمة يطلب |دورية محكمة= (help) and الوسيط غير المعروف |trans_title= تم تجاهله يقترح استخدام |عنوان مترجم= (help)
  5. ^ Smallwood, R.F. (2014). Information Governance: Concepts, Strategies, and Best Practices. John Wiley and Sons. ص. 110. ISBN:9781118218303. مؤرشف من الأصل في 2020-07-30. اطلع عليه بتاريخ 2020-04-18. Having a standardized data governance program in place means cleaning up corrupted or duplicated data and providing users with clean, accurate data as a basis for line-of-business software applications and for decision support analytics in business intelligence (BI) applications.
  6. ^ أ ب ت ث ج Fürber, C. (2015). "3. Data Quality". Data Quality Management with Semantic Technologies. Springer. ص. 20–55. ISBN:9783658122249. مؤرشف من الأصل في 2020-07-31. اطلع عليه بتاريخ 2020-04-18.
  7. ^ أ ب Herzog, T.N.; Scheuren, F.J.; Winkler, W.E. (2007). "Chapter 2: What is data quality and why should we care?". Data Quality and Record Linkage Techniques. Springer Science & Business Media. ص. 7–15. ISBN:9780387695020. مؤرشف من الأصل في 2020-07-31. اطلع عليه بتاريخ 2020-04-18.{{استشهاد بكتاب}}: صيانة الاستشهاد: أسماء متعددة: قائمة المؤلفين (link)
  8. ^ أ ب Fleckenstein, M.; Fellows, L. (2018). "Chapter 11: Data Quality". Modern Data Strategy. Springer. ص. 101–120. ISBN:9783319689920. مؤرشف من الأصل في 2020-07-31. اطلع عليه بتاريخ 2020-04-18.{{استشهاد بكتاب}}: صيانة الاستشهاد: أسماء متعددة: قائمة المؤلفين (link)
  9. ^ أ ب Mahanti, R. (2019). "Chapter 1: Data, Data Quality, and Cost of Poor Data Quality". Data Quality: Dimensions, Measurement, Strategy, Management, and Governance. Quality Press. ص. 5–6. ISBN:9780873899772. مؤرشف من الأصل في 2020-11-23. اطلع عليه بتاريخ 2020-04-18.
  10. ^ International Organization for Standardization (سبتمبر 2015). "ISO 9000:2015(en) Quality management systems — Fundamentals and vocabulary". International Organization for Standardization. مؤرشف من الأصل في 2020-05-19. اطلع عليه بتاريخ 2020-04-18.
  11. ^ NIST Big Data Public Working Group, Definitions and Taxonomies Subgroup (أكتوبر 2019). "NIST Big Data Interoperability Framework: Volume 4, Security and Privacy" (PDF). National Institute of Standards and Technology (ط. 3rd). DOI:10.6028/NIST.SP.1500-4r2. مؤرشف (PDF) من الأصل في 2020-05-09. اطلع عليه بتاريخ 2020-04-18. Validity refers to the usefulness, accuracy, and correctness of data for its application. Traditionally, this has been referred to as data quality.
  12. ^ أ ب Bian, Jiang; Lyu, Tianchen; Loiacono, Alexander; Viramontes, Tonatiuh Mendoza; Lipori, Gloria; Guo, Yi; Wu, Yonghui; Prosperi, Mattia; George, Thomas J (9 Dec 2020). "Assessing the practice of data quality evaluation in a national clinical data research network through a systematic scoping review in the era of real-world data". Journal of the American Medical Informatics Association (بالإنجليزية). 27 (12): 1999–2010. DOI:10.1093/jamia/ocaa245. ISSN:1527-974X. PMID:33166397. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (help)
  13. ^ "Liability and Leverage - A Case for Data Quality". Information Management. أغسطس 2006. مؤرشف من الأصل في 2011-01-27. اطلع عليه بتاريخ 2010-06-25.
  14. ^ "Address Management for Mail-Order and Retail". Directions Magazine. مؤرشف من الأصل في 2005-04-28. اطلع عليه بتاريخ 2010-06-25.
  15. ^ "USPS | PostalPro" (PDF). مؤرشف (PDF) من الأصل في 2010-02-15. اطلع عليه بتاريخ 2010-06-25.
  16. ^ E. Curry, A. Freitas, and S. O'Riáin, "The Role of Community-Driven Data Curation for Enterprises", نسخة محفوظة 2012-01-23 على موقع واي باك مشين. in Linking Enterprise Data, D. Wood, Ed. Boston, Mass.: Springer US, 2010, pp. 25-47.
  17. ^ "ISO/TS 8000-1:2011 Data quality -- Part 1: Overview". International Organization for Standardization. مؤرشف من الأصل في 2016-12-21. اطلع عليه بتاريخ 2016-12-08.
  18. ^ "Can you trust the quality of your data?". spotlessdata.com. مؤرشف من الأصل في 2017-02-11.
  19. ^ "What is Data Cleansing? - Experian Data Quality". 13 فبراير 2015. مؤرشف من الأصل في 2017-02-11. اطلع عليه بتاريخ 2017-02-09.
  20. ^ "Lecture 23 Data Quality Concepts Tutorial – Data Warehousing". Watch Free Video Training Online. مؤرشف من الأصل في 2016-12-21. اطلع عليه بتاريخ 2016-12-08.
  21. ^ O'Donoghue, John, and John Herbert. "Data management within mHealth environments: Patient sensors, mobile devices, and databases". Journal of Data and Information Quality (JDIQ) 4.1 (2012): 5.
  22. ^ Huser، Vojtech؛ DeFalco، Frank J؛ Schuemie، Martijn؛ Ryan، Patrick B؛ Shang، Ning؛ Velez، Mark؛ Park، Rae Woong؛ Boyce، Richard D؛ Duke، Jon (30 نوفمبر 2016). "Multisite Evaluation of a Data Quality Tool for Patient-Level Clinical Datasets". eGEMs. ج. 4 ع. 1: 24. DOI:10.13063/2327-9214.1239. PMID:28154833. {{استشهاد بدورية محكمة}}: الوسيط غير المعروف |PMCID= تم تجاهله يقترح استخدام |pmc= (مساعدة)
  23. ^ MEASURE Evaluation. (2017) Improving data quality in mobile community-based health information systems: Guidelines for design and implementation (tr-17-182). Chapel Hill, NC: MEASURE Evaluation, University of North Carolina. Retrieved from https://www.measureevaluation.org/resources/publications/tr-17-182 نسخة محفوظة 2017-08-08 على موقع واي باك مشين.
  24. ^ Wambugu, S. & Villella, C. (2016). mHealth for health information systems in low- and middle-income countries: Challenges and opportunities in data quality, privacy, and security (tr-16-140). Chapel Hill, NC: MEASURE Evaluation, University of North Carolina. Retrieved from https://www.measureevaluation.org/resources/publications/tr-16-140 نسخة محفوظة 2017-08-08 على موقع واي باك مشين.
  25. ^ MEASURE Evaluation. (2016) Data quality for monitoring and evaluation systems (fs-16-170). Chapel Hill, NC: MEASURE Evaluation, University of North Carolina. Retrieved from https://www.measureevaluation.org/resources/publications/fs-16-170-en نسخة محفوظة 2017-08-08 على موقع واي باك مشين.
  26. ^ MEASURE Evaluation. (2016). Routine health information systems: A curriculum on basic concepts and practice - Syllabus (sr-16-135a). Chapel Hill, NC: MEASURE Evaluation, University of North Carolina. Retrieved from https://www.measureevaluation.org/resources/publications/sr-16-135a نسخة محفوظة 2017-08-08 على موقع واي باك مشين.
  27. ^ "Data quality assurance tools". MEASURE Evaluation. مؤرشف من الأصل في 2017-08-08. اطلع عليه بتاريخ 2017-08-08.
  28. ^ "Module 4: RHIS data quality". MEASURE Evaluation. مؤرشف من الأصل في 2017-08-08. اطلع عليه بتاريخ 2017-08-08.
  29. ^ MEASURE Evaluation. "Data quality". MEASURE Evaluation. مؤرشف من الأصل في 2017-08-08. اطلع عليه بتاريخ 2017-08-08.
  30. ^ The World Health Organization (WHO). (2009). Monitoring and evaluation of health systems strengthening. Geneva, Switzerland: WHO. Retrieved from http://www.who.int/healthinfo/HSS_MandE_framework_Nov_2009.pdf نسخة محفوظة 2017-08-28 على موقع واي باك مشين.
  31. ^ Mesgari، Mostafa؛ Chitu، Okoli؛ Mehdi، Mohamad؛ Finn Årup، Nielsen؛ Lanamäki، Arto (2015). ""The Sum of All Human Knowledge": A Systematic Review of Scholarly Research on the Content of Wikipedia" (PDF). Journal of the Association for Information Science and Technology. ج. 66 ع. 2: 219–245. DOI:10.1002/asi.23172. مؤرشف (PDF) من الأصل في 2020-05-10. اطلع عليه بتاريخ 2020-01-21.
  32. ^ Warncke-Wang، Morten؛ Cosley، Dan؛ Riedl، John (2013). Tell me more: An actionable quality model for wikipedia. DOI:10.1145/2491055.2491063. ISBN:9781450318525. {{استشهاد بكتاب}}: |العمل= تُجوهل (مساعدة)
  33. ^ Hasan Dalip، Daniel؛ André Gonçalves، Marcos؛ Cristo، Marco؛ Calado، Pável (2009). "Automatic quality assessment of content created collaboratively by web communities". Proceedings of the 2009 joint international conference on Digital libraries - JCDL '09. ص. 295. DOI:10.1145/1555400.1555449. ISBN:9781605583228.
  34. ^ Färber، Michael؛ Bartscherer، Frederic؛ Menne، Carsten؛ Rettinger، Achim (30 نوفمبر 2017). "Linked data quality of DBpedia, Freebase, OpenCyc, Wikidata, and YAGO". Semantic Web. ج. 9 ع. 1: 77–129. DOI:10.3233/SW-170275. مؤرشف من الأصل في 2018-01-22.
  35. ^ "IQ International - the International Association for Information and Data Quality". IQ International website. مؤرشف من الأصل في 2017-05-10. اطلع عليه بتاريخ 2016-08-05.
  36. ^ "Home". ECCMA. مؤرشف من الأصل في 2018-08-19. اطلع عليه بتاريخ 2018-10-03.

قراءة متعمقة[عدل]

  • Baškarada، S؛ Koronios، A (2014). "A Critical Success Factors Framework for Information Quality Management". Information Systems Management. ج. 31 ع. 4: 1–20. DOI:10.1080/10580530.2014.958023.
  • Baamann, Katharina, "Data Quality Aspects of Revenue Assurance", Article
  • Eckerson, W. (2002) "Data Warehousing Special Report: Data quality and the bottom line", Article
  • Ivanov, K. (1972) "Quality-control of information: On the concept of accuracy of information in data banks and in management information systems". The University of Stockholm and The Royal Institute of Technology. Doctoral dissertation.
  • Hansen, M. (1991) Zero Defect Data, MIT. Masters thesis [1]
  • Kahn, B., Strong, D., Wang, R. (2002) "Information Quality Benchmarks: Product and Service Performance," Communications of the ACM, April 2002. pp. 184–192. Article
  • Price, R. and Shanks, G. (2004) A Semiotic Information Quality Framework, Proc. IFIP International Conference on Decision Support Systems (DSS2004): Decision Support in an Uncertain and Complex World, Prato. Article
  • Redman, T. C. (2008) Data Driven: Profiting From Our Most Important Business Asset
  • Wand, Y. and Wang, R. (1996) "Anchoring Data Quality Dimensions in Ontological Foundations," Communications of the ACM, November 1996. pp. 86–95. Article
  • Wang, R., Kon, H. & Madnick, S. (1993), Data Quality Requirements Analysis and Modelling, Ninth International Conference of Data Engineering, Vienna, Austria. Article
  • Fournel Michel, Accroitre la qualité et la valeur des données de vos clients, éditions Publibook, 2007. (ردمك 978-2-7483-3847-8)ISBN 978-2-7483-3847-8.
  • Daniel F., Casati F., Palpanas T., Chayka O., Cappiello C. (2008) "Enabling Better Decisions through Quality-aware Reports", International Conference on Information Quality (ICIQ), MIT. Article
  • Jack E. Olson (2003), "Data Quality: The Accuracy dimension", Morgan Kaufmann Publishers
  • Woodall P., Oberhofer M., and Borek A. (2014), "A Classification of Data Quality Assessment and Improvement Methods". International Journal of Information Quality 3 (4), 298–321. doi:10.1504/ijiq.2014.068656.
  • Woodall, P., Borek, A., and Parlikad, A. (2013), "Data Quality Assessment: The Hybrid Approach." Information & Management 50 (7), 369–382.

روابط خارجية[عدل]

دورة جودة البيانات من مركز التعلم الصحي العالمي [[تصنيف:علوم المعلومات]] [[تصنيف:جودة البيانات]]