نموذج الانحدار الذاتي والمتوسط المتحرك

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث

نموذج الانحدار الذاتي والمتوسط المتحرك (بالإنجليزية: AutoRegressive Moving Average model)، اختصارا (آرما ARMA)، أو نموذج بوكس جينكنز، هو طريقة للتحليل الإحصائي، تستعمل في نمذجة و وصف و استشراف المتسلسلات الزمنية. تتمثل نمذجة آرما، في كتابة العملية التصادفية المستقرة للمتسلسلة المدروسة على شكل مجموع متعددتي حدود: نموذج ذاتي الانحدار (AR) و نموذج المتوسط المتحرك (MA). النموذج العام للطريقة، تم تقعيده نظريا، في 1951، في أطروحة الإحصائي النيوزلندي بيتر ويتل إختبار الفرضيات في تحليل المتسلسلات الزمنية، قبل أن تعمم في 1971، في كتاب للإحصائيين جورج بوكس و غويليم جينكنز.[1]

يشار لنموذج آرما ب ARMA(p,q)، بحيث p درجة الجزء الذاتي الانحدار و q درجة جزء المتوسط المتحرك.[1]

النموذج الذاتي الانحدار[عدل]

إشارة AR(p) ترمز إلى نموذج ذاتي الانحدار من الدرجة p و يكتب على الشكل التالي:

 X_t = c + \sum_{i=1}^p \varphi_i X_{t-i}+ \varepsilon_t .\,

بحيث:

  • \varphi_1, \ldots, \varphi_p هي وسائط
  • c ثابت
  • المتغير العشوائي \varepsilon_t هو ضجيج أبيض.

هناك إكراهات إضافية تطبق على الوسائط، لضمان استقرار العملية التصادفية، فعلى سبيل المثال، في حالة النموذج AR(1)، إذا كانت |φ1| أكبر من 1، فالعملية لا تكون مستقرة.

في النموذج الذاتي الانحدار، يتم اعتبار المتغير X_t كدالة لقيمه السابقة.

نموذج المتوسطات المتحركة[عدل]

إشارة MA(q) ترمز إلى نموذج المتوسطات المتحركة من الدرجة q و يكتب على الشكل التالي:

 X_t = \mu + \varepsilon_t + \sum_{i=1}^q \theta_i \varepsilon_{t-i}\,

بحيث:

نموذج المتوسط المتحرك يمكن اعتباره مرشحا رقميا ذا استجابة نبضية، أو كدالة لقيم الأخطاء العشوائية السابقة.

نموذج ARMA[عدل]

إشارة ARMA(p,q) ترمز إلى نموذج ب p حدا ذاتي الانحدار و q حدا للمتوسطات المتحركة، و يكتب:

 X_t = c + \varepsilon_t +  \sum_{i=1}^p \varphi_i X_{t-i} + \sum_{i=1}^q \theta_i \varepsilon_{t-i}.\,

النموذج العام لطريقة آرما، الذي نظر له بيتر ويتل في 1951، اعتمد على تقنيات التحليل الرياضي (متسلسلة لورنت و تحليل فورييه) و الاستدلال الإحصائي.[2] إضافة جورج بوكس و غويليم جينكنز، لسنة 1971، تمثلت في استنباطهما لمنهج تكراري (منهج بوكس جينكنز) لحساب و استنتاج وسائط و درجتي النموذج. أثبت منهجهما نجاعة في تحليل متعددات الحدود من الدرجات الدنيا، أي لقيم p و q، أقل من 3.[3]

فرضيات حول متغيرات الخطأ[عدل]

يفترض نموذج آرما بأن المتغيرات \varepsilon_t هي مستقلة و متشابهة التوزيع، أي بأنها مستقلة فيما بينها و تتبع نفس التوزيع، الذي يفترضه النموذج طبيعيا:

\varepsilon_t \sim \mathcal{N}(0,\sigma^2).

أي بمتوسط منعدم و بتباين يساوي σ2

رغم أن هذه الفرضيات (خصوصا استقلال و تشابه توزيع متغيرات الخطأ) حاسمة في تحديد النموذج، إلا أن بعض التطبيقات الحسابية، لا تعتبر تمحيصها حاسما في استعمال نموذج آرما.

كتابة النموذج باستعمال عامل التأخر[عدل]

في الأدبيات الإحصائية المرتبطة بالمتسلسلات الزمنية، عادة ما يستخدم عامل التأخر L (و أحيانا B)، و ذلك لتبسيط القراءة، عبر وضع القارئ في اللحظة t المدروسة. الإضافة الأخرى لطريقة الكتابة هاته، هي محاكاتها لطريقة ترميز متعددات الحدود، و تمكن من الاستفادة من تقنيات التحليل الرياضي المرتبطة بها.

تعريف عامل التأخر — \, L X_t = X_{t-1} لكل \; t > 1\,


حسب هذا الترميز، فإن النموذج AR(p) يكتب:

 \varepsilon_t = \left(1 - \sum_{i=1}^p \varphi_i L^i\right) X_t =  \varphi (L) X_t\, بحيث \varphi تمثل متعددة الحدود : \varphi (L) = 1 - \sum_{i=1}^p \varphi_i L^i.\,

و النموذج MA(q) يصبح:

 X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t = \theta (L) \varepsilon_t , \, بحيث θ تمثل متعددة الحدود  : \theta(L)= 1 + \sum_{i=1}^q \theta_i L^i .\,

أما النموذج ARMA(p,q) فيكتب:

 \left(1 - \sum_{i=1}^p \varphi_i L^i\right) X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t \, ,

أو

 \varphi(L) X_t = \theta(L) \varepsilon_t \,

أو

 \frac{\varphi(L)}{\theta(L)}X_t = \varepsilon_t \, .

بعض الإحصائيين، بما فيهم بوكس و جينكنز[4]، يفضلون ترميز معاملات الجزء الذاتي الانحدار بنفس مظهر جزء المتوسطات المتحركة، و تصبح كتابة النموذج، وفق ذلك كما يلي:

 \left(1 + \sum_{i=1}^p \phi_i L^i\right) X_t = \left(1 + \sum_{i=1}^q \theta_i L^i\right) \varepsilon_t \, .

تركيب النموذج[عدل]

بعد تحديد الدرجتين p و q، يمكن تحديد وسائط النموذج باستعمال طريقة المربعات الدنيا: بالبحث عن قيم المعاملات و الوسائط التي تنقص ما أمكن من قيمة مجموع مربعات البقايا.

يوصى عادة، باختيار أصغر القيم الممكنة ل p و q، و ذلك تبعا لمبدأ التقتير في الاستدلال الإحصائي. عمليا، يمكن استنتاج قيم درجتي نموذج آرما عبر رسم دالة الارتباط الذاتي الجزئي (بالإنجليزية: Partial autocorrelation function) لاستنتاج p و دالة الارتباط الذاتي (بالإنجليزية: َAutocorrelation function) لاستنتاج الدرجة q. بعد تثبيت اختيار درجتي النموذج، تمكن الدالتان المشار إليهما من استنتاج معلومات إضافية حول البقايا و الأخطاء الإحصائية للنموذج.

من الطرق المستعملة لتقرير اختيار درجتي النموذج، ينصح بروكويل و ديفيس، بحساب معيار أكايكي للمعلومة، لمجموعة من أزواج (p,q)، و اختيار الزوج الذي يحقق أضعف قيمة للمعيار. معيار أكايكي مستلهم من نفس مبدأ التقتير، و يرجح كفة النماذج ذوات الدرجات الدنيا، التي تحافظ على قيمة مثلى لدالة الإمكان.[5]

تعريف معيار أكايكي للمعلومة —  \mathit{AIC} = 2k - 2\ln(L) بحيث k هو مجموع وسائط النموذج و L قيمة دالة الإمكان الموافقة للنموذج


تطبيقات للنموذج[عدل]

بنية نموذج آرما مناسبة لدراسة المتسلسلات الزمنية التي لا تتطور فقط حسب اتجاهها العام (و الذي يفسره الجزء AR من النموذج)، و لكن تحت تأثير صدمات خارجية صعبة الإدراك (الجزء MA من النموذج). مثلا، متسلسلات الأسواق المالية، تتأثر باتجاهها العام و أيضا بارتدادات متوسطها، الناتج عن تدخلات الفاعلين في الأسواق، إضافة إلى تأثير ظهور معلومات خارجية (ماكرواقتصادية مثلا) توجه السوق و تشكل صدمة إضافية للمتسلسلة.

امتدادات[عدل]

آرما نموذج عام، يمكنه أن يتخذ أشكالا بديلة، وفق تغيير هذه الفرضية أو تلك. في ما يلي لائحة بامتدادات النموذج الأكثر شيوعا:

  • NARMA: يفترض نموذج آرما وجود ارتباط خطي بين X_t من جهة و القيم السابقة له L^k X_{t} و \varepsilon_t من جهة أخرى. في حالة افتراض وجود ارتباط غير خطي، يسمى النموذج نارما : النموذج الغير خطي للانحدار الذاتي و المتوسط المتحرك (بالإنجليزية: nonlinear autoregressive–moving-average).
  • ARCH: عندما تكون فرضية تساوي تباين الأخطاء الإحصائية \varepsilon_t مستبعدة، النموذج المناسب هو الذي يراعي اختلاف التباين بين الأخطاء الإحصائية، و يسمى نموذج الانحدار الذاتي باختلاف التباين الشرطي (بالإنجليزية: AutoRegressive Conditional Heteroskedasticity). تستعمل زمرة نماذج آرش بكثرة في دراسة المتسلسلات الزمنية للأسواق المالية، التي تتميز بفترات تذبذب حاد، متبوعة بفترات هدوء نسبي.
  • ARIMA:من أهم الفرضيات الضرورية لتطبيق نماذج آرما في صيغتها الأساسية، استقرار العملية التصادفية. هذا الامتداد يمكن من تجاوز هذا الإكراه عبر تطبيق تكامل، من درجة معينة، على المتسلسلة حتى تصبح مستقرة، لتكون قابلة لاستيعاب نموذج آرما. يسمى بنموذج الانحدار الذاتي المتكامل و المتوسط المتحرك (بالإنجليزية: Autoregressive Integrated Moving Average)
  • ARFIMA: إذا كانت درجة التكامل المطبقة في ARIMA عددا كسريا، يتحول إلى نموذج الانحدار الذاتي المتكامل كسريا و المتوسط المتحرك (بالإنجليزية: Autoregressive Fractionally Integrated Moving Average)
  • SARIMA: إذا كانت المتسلسلة دورية أو فصلية، النمذجة المثلى تكون وفق نموذج الانحدار الذاتي و المتوسط المتحرك الفصلي (بالإنجليزية: seasonal ARIMA).

حزمات آرما في البرمجيات الإحصائية[عدل]

البرنامج موارد معرفية
آر
ماثماتيكا
ماتلاب

مراجع[عدل]

  1. ^ أ ب Analyse des séries chronologiques de Box-Jenkins. John Petroff
  2. ^ Whittle, P. (1951). Hypothesis Testing in Time Series Analysis. Almquist and Wicksell. Whittle, P. (1963). Prediction and Regulation. English Universities Press. ردمك 0816611475.
  3. ^ Hannan, E. J.; Deistler, Manfred (1988). Statistical theory of linear systems. Wiley series in probability and mathematical statistics. New York: John Wiley and Sons.
  4. ^ Box, George; Jenkins, Gwilym M.; Reinsel, Gregory C. (1994). Time Series Analysis: Forecasting and Control (Third ed.). Prentice-Hall. ردمك 0130607746.
  5. ^ Brockwell, P. J.; Davis, R. A. (2009). Time Series: Theory and Methods (2nd ed.). New York: Springer. p. 273. ردمك 9781441903198.