تحلیل رگرسیون (قسمت دوم)

تحلیل رگرسیون (قسمت دوم)

کلیات رگرسیون خطی ساده

یکی از پرکاربردترین روش های آماری در علوم مختلف، اجرای انواع روش های رگرسیون برای تعیین رابطه ی بین یک متغیر وابسته با یک یا چند متغیر مستقل می باشد . متغیر وابسته ، پاسخ و متغیرهای مستقل ، متغیرهای توضیحی نیز نامیده می شوند. اجرای یک مدل رگرسیونی با تعریف مدل رگرسیون امکان پذیر است. مدل رگرسیون ساده با متغیر وابسته یY وp-1  متغیر مستقل X1,X2,…,Xp-1 به صورت زیر تعریف می شود:

  Y_i =beta_0 + beta_1  x_1 + beta_2  x_2 + ... +  beta_p_1  x_(p-1) + epsilon_i  i = 1, 2, …, n

به عنوان مثال فرض کنید یک محقق قصد دارد اثر دو متغیر سن و وزن را بر فشارخون اندازه گیری نماید. برای این مطالعه مقادیر سن و وزن برای n=500 نفر اندازه گیری می شود. در این مطالعه سن و وزن متغیرهای مستقل یا پیشگو و متغیر فشارخون متغیر وابسته می باشد.

معادله ی (۱) را می توان به فرم ماتریسی زیر نیز تعریف کرد:

۱

ماتریسX مقادیر مشاهده شده ی p-1  متغیر را برای n نفر نشان می دهد. بردارY نیز مقادیر مشاهده  شده ی متغیر وابسته برای نمونه ای به حجم n می باشد. در یک مدل رگرسیونی  ها پارامترهای مدل بوده و به کمک روش های مختلفی مانند روش حداقل مربعات و روش درستنمایی ماکزیمم برآورد می شوند.   epsilon_i   ها نیز جملات خطا نامیده می شوند و دارای توزیع نرمال با میانگین صفر و واریانس sigma^2   هستند.

۲

معادله ی رگرسیون با تعریف ماتریس متغیرهای توضیحی و بردارهای متغیر پاسخ ، پارامترهای مدل و جملات خطا به صورت زیر تعریف می شود :

 Y_(n*1) =X_(n*p) + beta_(p*1)+ epsilon_(n*1)

برآورد ضرایب رگرسیون :

به کمک روش حداقل مربعات مقادیر بردار  با می نیمم کردن معادله

 Q = sum{i=1}{n}{(Y_i = beta_0 - beta_1 X_(1,1) - ... - beta_(p-1) X_(i,p-1))}

حاصل می شود. برآورد بردار beta_(p*1)  را با b_(p*1)  نشان داده و با توجه به فرم ماتریسی تعریف شده در معادله (۲) به صورت زیر محاسبه می شود:

درباره نویسنده

مطالب مرتبط

نظر بدهید