تحلیل رگرسیون (قسمت دوم)

تحلیل رگرسیون (قسمت دوم)

کلیات رگرسیون خطی ساده

یکی از پرکاربردترین روش های آماری در علوم مختلف، اجرای انواع روش های رگرسیون برای تعیین رابطه ی بین یک متغیر وابسته با یک یا چند متغیر مستقل می باشد . متغیر وابسته ، پاسخ و متغیرهای مستقل ، متغیرهای توضیحی نیز نامیده می شوند. اجرای یک مدل رگرسیونی با تعریف مدل رگرسیون امکان پذیر است. مدل رگرسیون ساده با متغیر وابسته یY وp-1  متغیر مستقل X1,X2,…,Xp-1 به صورت زیر تعریف می شود:

  [pmath]Y_i =beta_0 + beta_1  x_1 + beta_2  x_2 + … +  beta_p_1  x_(p-1) + epsilon_i [/pmath] i = 1, 2, …, n

به عنوان مثال فرض کنید یک محقق قصد دارد اثر دو متغیر سن و وزن را بر فشارخون اندازه گیری نماید. برای این مطالعه مقادیر سن و وزن برای n=500 نفر اندازه گیری می شود. در این مطالعه سن و وزن متغیرهای مستقل یا پیشگو و متغیر فشارخون متغیر وابسته می باشد.

معادله ی (۱) را می توان به فرم ماتریسی زیر نیز تعریف کرد:

۱

ماتریسX مقادیر مشاهده شده ی p-1  متغیر را برای n نفر نشان می دهد. بردارY نیز مقادیر مشاهده  شده ی متغیر وابسته برای نمونه ای به حجم n می باشد. در یک مدل رگرسیونی  ها پارامترهای مدل بوده و به کمک روش های مختلفی مانند روش حداقل مربعات و روش درستنمایی ماکزیمم برآورد می شوند.   [pmath] epsilon_i [/pmath]  ها نیز جملات خطا نامیده می شوند و دارای توزیع نرمال با میانگین صفر و واریانس [pmath] sigma^2 [/pmath]   هستند.

۲

معادله ی رگرسیون با تعریف ماتریس متغیرهای توضیحی و بردارهای متغیر پاسخ ، پارامترهای مدل و جملات خطا به صورت زیر تعریف می شود :

 [pmath]Y_(n*1) =X_(n*p) + beta_(p*1)+ epsilon_(n*1) [/pmath]

برآورد ضرایب رگرسیون :

به کمک روش حداقل مربعات مقادیر بردار  با می نیمم کردن معادله

 [pmath]Q = sum{i=1}{n}{(Y_i = beta_0 – beta_1 X_(1,1) – … – beta_(p-1) X_(i,p-1))} [/pmath]

حاصل می شود. برآورد بردار [pmath]beta_(p*1) [/pmath]  را با [pmath]b_(p*1) [/pmath]  نشان داده و با توجه به فرم ماتریسی تعریف شده در معادله (۲) به صورت زیر محاسبه می شود:

درباره نویسنده

مطالب مرتبط

نظر بدهید