مختصری درباره داده های تابلویی

مختصری درباره داده های تابلویی

مختصری درباره داده های تابلویی:

انواع داده ­هایی که عموماً برای تحلیل­های تجربی به کار برده می­شوند، در سه گروه مورد بحث و بررسی قرار می­گیرند:

  1. داده­ های سری زمانی
  2. داده ­های مقطعی
  3. داده ­های تلفیقی سری زمانی و مقطعی

در داده­ های سری زمانی مقادیر یک یا چند متغیر را طی یک دوره زمانی مشاهده می ­کنیم (برای مثال GDP طی چند فصل یا چند سال). در داده ­های مقطعی، مقادیر یک یا چند متغیر برای چند واحد یا مورد نمونه­ای در یک زمان یکسان جمع­­آوری می­شود (برای مثال نرخ­های جرم و جنایت برای  سی استان ایران  در در یک سال معین).

داده های تابلویی ترکیبی از داده­های مقطعی و سری زمانی می­ باشد، یعنی اطلاعات مربوط به داده­ های مقطعی در طول زمان مشاهده می­شود. بدین­ صورت که چنین داده­ هایی دارای دو بعد می باشند که یک بعد آن مربوط به واحدهای مختلف در هر مقطع زمانی خاص است و بعد دیگر آن مربوط به زمان می­ باشد. در مجموع، داده های تابلویی دارای مزایای فراوانی نسبت به داده­های مقطعی یا سری زمانی هستند که برخی از مهمترین آنها عبارتند از:

داده ­های مقطعی و سری زمانی صرف، ناهمسانی­های فردی را لحاظ نمی­ کنند، لذا ممکن است که تخمین تورش ­داری به دست دهند، در حالی که در روش پانل می­توان با لحاظ کردن متغیرهای مخصوص انفرادی[۴] این ناهمسانی­ها را لحاظ کرد.

 داده ­های تابلویی دارای اطلاعات بیشتر، تغییرپذیری بیشتر، همخطی کمتر، درجه آزادی بالاتر و کارایی بالاتر نسبت به سری زمانی و داده ­های مقطعی می­ باشند. به خصوص اینکه یکی از روشهای کاهش همخطی، ترکیب داده ­های مقطعی و زمانی به صورت داده­های تابلویی می­باشد.

با مجموعه داده ­های تابلویی، می­ توان اثراتی را شناسائی و اندازه ­گیری کرد که در داده­های مقطعی محض یا سری زمانی خالص قابل شناسایی نیست. گاهی استدلال می­شود داده ­های مقطعی، رفتارهای بلندمدت را نشان می ­دهند، در حالی که در داده ­های سری زمانی بر اثرات کوتاه­ مدت تاکید می­شود. با ترکیب این دو خصوصیت در داده ­های تابلویی، که خصوصیت متمایز پانل دیتاست، ساختار عمومی ­تر و پویاتری را می­ توان تصریح و برآورد کرد(اشرف­زاده و مهرگان، ۱۳۸۷، ص ۴۱).

داده­ های تابلویی که بر حسب بنگاه­ها، خانوارها و افراد جمع آوری می­شوند، ممکن است دقیق­تر از داده ­های مشابه اندازه ­گیری شده در سطح کلان باشند. بنابراین، تورشی که ممکن است در داده ­های کلان حاصل شود، در داده­های تابلویی حداقل می­گردد (Baltagi ,2005, P.4-7).

داده­ های پانلی از طریق فراهم کردن تعداد داده­های زیاد، تورش را پائین می­آورد(Gujarati, 2004, p.638).

مطالعه مشاهدات به صورت داده­های پانلی، وضعیت بهتری برای مطالعه و بررسی پویایی تغییرات نسبت به سری زمانی و مقطعی داراست.

مزایای این روش در مقایسه با روش های سری زمانی و مقطعی عبارتند از:

الف: به محقق این امکان را می دهد که ارتباط بین متغیرها و حتی واحدهای انفرادی و به عبارتی مقاطع در طول زمان در نظر گرفته و به بررسی آنها بپردازد.

ب: این روش توانایی کنترل اثرات انفرادی مقاطع که قابل مشاهده نمی باشد را داراست. (بالتاجی ۲۰۰۵) زیرا در روش حداقل مربعات معمولی یعنی زمانی که داده ها به صورت سری زمانی، مقطعی ترکیب شده  باشد،یعنی در رابطه زیر  ui برابر با  ۱α در نظر گرفته شده و در نتیجه اثرات انفرادی مقاطع یکسان فرض شده و نتایج دچار اریب ناهمگنی ناشی از یکسان بودن این اثرات می گردد. (بالتاجی ۲۰۰۵). در روش داده‌های تابلویی برای رفع این مشکل، محدودیت یکسان بودن اثرات انفرادی حذف می شود.

تفاوت مدل های common effect، Random effect و fixed effect از نظر جزء ثابت و جزء اختلال

به طور کلی، یک مدل رگرسیونی در قالب مدل داده های تابلویی به شکل زیر می‌باشد:‌

Yit=α۱+β۱X1it۲X2it+…+βkXkit+wit              i=1,2,…..  

Wit=ui+vt+eit                                                            t=1,2,…

دراینجا i مقاطع و t زمان را نشان می دهد . ui دارای میانگین صفر و واریانس ثابت می‌باشد.ui الزاما متغیر تصادفی نمی باشد. اگرui  عددی ثابت، همچون α۱، برای تمام مقاطع باشد، مدل اثرات مشترک یا رگرسیون تلفیقی بوده، و اگر عددی ثابت اما متفاوت برای مقاطع، همچون  αiباشد، اثرات ثابت خواهد بود و در غیر این صورت، زمانی که  ui  تصادفی باقی بماند، به آن اثرات تصادفی اطلاق می شود. eit نیز جزء اختلال است.

ارتباط مدل های state- space و random effect 

 مدل های دیگری نیز وجود دارد که در آن تفاوت در ثابت یا تصادفی بودن ضرایب زاویه در مقاطع می باشد. همچون مدل های فضای حالت، که این نوع مدل ها نسبت به مدل های فوق الذکر کاربردهای کمتری دارد.

آزمون های آماری تشخیص مدل های common effect، Random effect و fixed effect از یکدیگر

آزمون f (تشخیص بین مدل اثرات مشترک و اثرات ثابت یا تصادفی) و آزمون هاسمن (تشخیص بین اثرات ثابت و تصادفی)

آزمون f فرضیه H0 مبنی بر یکسان بودن عرض از مبداها برای تمامی مقاطع را آزمون می کند.

درصورتی که F محاسبه شده از F جدول بزرگتر باشد فرضیه H0 رد می شود. در صورت پذیرش فرض نامساوی بودن عرض از مبداها، لازم است به منظور تعیین روش براورد اثرات ثابت یا تصادفی از آزمون هاسمن استفاده شود. آزمون هاسمن فرضیهH0 مبنی بر برابری برآوردکننده های اثرات ثابت و تصادفی را آزمون می کند. پذیرش فرضیه H0 به معنی ناهمبستگی بین جملات اختلال و متغیرهای توضیحی است که در این صورت مدل اثرات تصادفی براوردهای کارایی را ارائه خواهد داد.

همچنین بخوانید: داده های تابلویی در Eviews

درباره نویسنده

مطالب مرتبط

2 نظر

  1. ‍پینگ بک: برف

  2. ‍پینگ بک: آموزش تخمین مدل های پانل دیتا با کمک نرم افزار ایویوز ( Eviews ) - ویکونومی

نظر بدهید