تحليل الانحدار

من ويكيبيديا، الموسوعة الحرة
اذهب إلى: تصفح، ‏ ابحث

تحليل الانحدار أو تحليل الارتباط أو تحليل الانكفاء (بالإنكليزية: regression analysis) هو كل طريقة إحصائية يتم فيها التنبؤ بمتوسط متغير عشوائي أو عدة متغيرات عشوائية اعتمادا على قيم وقياسات متغيرات عشوائية أخرى، له عدة أنواع مثل: الانحدار الخطي، والانحدار اللوجستي، وانحدار بواسون، والتعليم المراقب والانحدار موزون الوحدة.

تحليل الانحدار هو أكثر من عملية ملائمة منحنى (أي اختيار المنحنى الأكثر ملائمة لمجموعة نقاط بيانية معطاة) فهو يتضمن ملائمة نموذج باستخدام مكونات حتمية واعتباطية. المكونات الحتمية تدعى المتنبئات أما المكونات الاعتباطية فتدعى الخطأ.

الشكل الأبسط لنموذج الانحدار يحوي متغير تابع (غير مستقل) (يدعى أيضا متغير الخرج، أو المتغير الداخلي أو المتغير ع) إضافة إلى متغير مستقل (يدعى العامل، أو المتغير الخارجي، أو المتغير-س).

من الأمثلة النموذجية على تحليل الانحدار: اعتماد ضغط الدم Y على عمر الشخص X، أو اعتماد الوزن لحيوانات التجربة Y على معدل التغذية اليومي X. هذا الارتباط والتابعية بين X وY هي ما ندعوه بالانحدار أو الارتباط فنقول ارتباط Y ب X.

ويلاحظ من ذلك أن نموذج الانحدار يعتمد دائماً على علاقة السببية بمعنى ان يكون التغير في المتغير المستقل مسبب رئيسي للتغير في المتغير التابع.

ونظرية تحليل الانحدار تعتمد على النظرية الاقتصادية بين متغيرين أي أنها تفترض ثبات العوامل الأخرى.

الانحدار الخطي[عدل]

مثال لانحدار خطي.

في الانحدار الخطي، تكون مواصفات هذا النموذج بشرط أن المتغير المستقل، y_i هو توافيق خطية للوسيط. مثلاً، في الانحدار الخطي البسيط ولعمل نموذج  n من النقاط البيانية يوجد متغير:  x_i ، ووسيطين، \beta_0 و\beta_1:

الخط المستقيم: y_i=\beta_0 +\beta_1 x_i +\varepsilon_i,\quad i=1,\dots,n.\!

في الانحدار الخطي المتعدد، توجد عدة متغيرات مستقلة أو دوال من المتغيرات المستقلة. مثال ذلك، إضافة عنصر في xi2 للانحدار السابق يعطي:

قطع مكافئ: y_i=\beta_0 +\beta_1 x_i +\beta_2 x_i^2+\varepsilon_i,\ i=1,\dots,n.\!

ما زال هذا انحداراً خطياً، بالرغم من أن التعبير على الطرف الأيمن هو دالة تربيعية في المتغير المستقلx_i، لكنه لايزال خطياً في الوسائط \beta_0, \beta_1 و\beta_2.

في كلا الحالتين، \varepsilon_i ليست حد خطأ وi تدل على ملاحظة معينة. لو كان لدينا عينة عشوائية من التعداد السكاني، يمكننا تقدير وسائط السكان وإيجاد نموذج الانحدار الخطي للعينة:

 y_i = \widehat{\beta}_0 + \widehat{\beta}_1 x_i + e_i.

الحد  e_i يمثل الراسب،  e_i = y_i - \widehat{y}_i . أحد طرق التقدير تتمثل في أقل التربيعات الاعتيادية، SSE:

SSE=\sum_{i=1}^N e_i^2. \,

تبسيط هذه الدالة ينجم عنه مجموعة من معادلات اعتيادية، يتم حلها لإيجاد تقديرات الوسيط، \widehat{\beta}_0, \widehat{\beta}_1.

في حالة الانحدار الخطي البسيط، تكون صيغ تقديرات أقل التربيعات:

\widehat{\beta_1}=\frac{\sum(x_i-\bar{x})(y_i-\bar{y})}{\sum(x_i-\bar{x})^2}\text{ and }\hat{\beta_0}=\bar{y}-\widehat{\beta_1}\bar{x}

حيث \bar{x} المتوسط الحسابي (لقيم x و\bar{y} متوسط قيم y.

على افتراض أن حد الخطأ السكاني ذو تباين ثابت، تعطى تقديرات التباين بالعلاقة

 \hat{\sigma}^2_\varepsilon = \frac{SSE}{N-2}.\,

ويطلق عليها خطأ مربع المتوسط (MSE) للانحدار. تعطى الأخطاء المعيارية لتقديرات الوسيط بالعلاقة

\hat\sigma_{\beta_0}=\hat\sigma_{\varepsilon} \sqrt{\frac{1}{N} + \frac{\bar{x}^2}{\sum(x_i-\bar x)^2}}
\hat\sigma_{\beta_1}=\hat\sigma_{\varepsilon} \sqrt{\frac{1}{\sum(x_i-\bar x)^2}}.

انظر أيضا[عدل]

Nuvola apps kchart.png هذه بذرة مقالة عن علم الإحصاء \ نظرية الاحتمالات بحاجة للتوسيع. شارك في تحريرها.