انجام شبیه سازی با r ns2 متلب کلودسیم توزیع نرمال سازی داده ها مونت کارلو رگرسیون در نرم افزار r

 

انجام شبیه سازی با r ns2 متلب کلودسیم توزیع نرمال سازی داده ها مونت کارلو رگرسیون در نرم افزار r

 

انجام پایان نامه پروپوزال سمینار مقاله تحقیق و پروژه های دانشجویی برق کامپیوتر عمران مکانیک مهندسی صنایع شیمی

 

انجام پایان نامه پروپوزال سمینار مقاله تحقیق و پروژه های دانشجویی مدیریت حسابداری روانشناسی حقوق اقتصاد

 

چرا R برای محاسبات آماری و گرافیک استفاده می شود؟

انجام شبیه سازی با r

 

R منبع باز و رایگان است!

R برای دانلود تحت شرایط مجوز GNU رایگان است. شما می توانید به منبع نگاه کنید ببینید چه اتفاقی می افتد تحت هود، اکثر بسته های R تحت یک مجوز در دسترس هستند، بنابراین شما می توانید از آنها استفاده کنید، حتی در برنامه های تجاری بدون نیاز به تماس با وکیل خود.

R محبوب است و محبوبیت آن در حال افزایش است.

IEEE لیستی از محبوب ترین زبان های برنامه نویسی را هر ساله منتشر می کند. R در رتبه پنجم سال ۲۰۱۶ قرار دارد و از سال ۶th در سال ۲۰۱۵٫ این یک معامله بزرگ برای یک زبان خاص خاص مانند R است که محبوب تر از یک زبان عمومی هدف مانند C # است. این نه تنها نشان می دهد افزایش علاقه به R به عنوان یک برنامه نویسی زبان، اما همچنین از زمینه های مانند علوم داده ها و آموزش ماشین که در آن R معمولا استفاده می شود.

R در تمام سیستم عامل ها اجرا می شود

شما می توانید توزیع R را برای همه سیستم عامل های محبوب – ویندوز، لینوکس و مک پیدا کنید.

انجام شبیه سازی با r کد R که در یک پلتفرم می نویسید، به راحتی می توانید بدون هیچ مشکلی به یک دیگر منتقل کنید. سازگاری متقابل پلتفرم یکی از ویژگی های مهم در دنیای رایانه های امروز است – حتی مایکروسافت پس از به دست آوردن مزایای تکنولوژی که در تمام سیستم ها اجرا می شود، پلاتفرم دات نت در تمامی سیستم عامل ها در دسترس است.

یادگیری R شانس گرفتن را کار افزایش می دهد

بر اساس گزارش تحقیقات حقوق علمی داده ها توسط O’Reilly Media در سال ۲۰۱۴، دانشمندان داده ها با میانگین ۹۸،۰۰۰ دلار در سراسر جهان پرداخت می شوند. این رقم در ایالات متحده بالاتر است – حدود ۱۴۴،۰۰۰ دلار است. البته، دانستن اینکه چگونه برای نوشتن برنامه های R به سرعت کار شما را از دست نخواهید داد، یک دانشمند اطلاعاتی باید ابزارهای زیادی برای انجام کار خود داشته باشد. حتی اگر شما برای یک موقعیت توسعه دهنده نرم افزار درخواست، تجربه برنامه نویسی R می تواند شما را از جمعیت جدا شود.

R توسط بزرگترین غول های تکنولوژی استفاده می شود

پذیرش توسط غول های فن آوری همیشه نشانه ای از پتانسیل زبان برنامه نویسی است. شرکت های امروز تصمیمات خود را در مورد هوی و هوس نمی کنند. هر تصمیم اصلی باید توسط تحلیل بتن از داده ها پشتیبانی شود.

انجام شبیه سازی با r استفاده شرکتها از R

R ترکیبی مناسب از سادگی و قدرت است و شرکت ها در سراسر جهان از آن برای استفاده از تصمیمات محاسبه استفاده می کنند. در اینجا چند راهکار استراتژیک صنعت استفاده از R و کمک به R ecosystem است.

درخواست شرکت / مشارکت
توییتر نظارت بر تجربه کاربر
فورد تجزیه و تحلیل رسانه های اجتماعی برای حمایت از تصمیم طراحی برای اتومبیل خود
نیویورک تایمز Infographics، روزنامه نگاری داده
مایکروسافت پس از به دست آوردن انقلاب تجزیه و تحلیل در سال ۲۰۱۵، مایکروسافت را باز کرد
گروه تحلیل داده های حقوق بشر تأثیر جنگ را اندازه گیری می کند
گوگل راهنمای راهنمای سبک R را برای جامعه کاربر R در داخل گوگل ایجاد کرده است

انجام شبیه سازی با r در حالی که با استفاده از R، شما می توانید مطمئن باشید که شما بر روی شانه غول ایستاده.
آیا R برنامه نویسی زبان آسان برای یادگیری است؟

این سوال جواب دادنش سخت است. بسیاری از محققان R را به عنوان زبان اول خود برای رفع نیازهای تجزیه و تحلیل اطلاعات خود می آموزند.

این قدرت برنامه ریزی R است، آن را به اندازه کافی ساده به یاد می گیرید که شما بروید. همه چیزهایی که نیاز دارید، داده ها و قصد روشن برای رسیدن نتیجه بر اساس تجزیه و تحلیل در آن داده ها است.

در حقیقت، R در بالای زبان برنامه نویسی S ساخته شده است که در ابتدا به عنوان یک زبان برنامه نویسی در نظر گرفته شده بود که می توانست دانش آموزان را در حین بازی با داده ها یاد بگیرد.

با این حال، برنامه نویسان که از پس زمینه پایتون، پی اچ پی یا جاوا هستند ممکن است در ابتدا گیج کننده و گیج کننده باشند. نحو که R استفاده می کند کمی متفاوت از دیگر زبان های برنامه نویسی رایج است.

در حالی که R دارای تمام قابلیت های یک زبان برنامه نویسی است، شما در هنگام نوشتن کد در زبان R، خود را در حال نوشتن بسیاری از شرایط و یا حلقه ها نخواهید دید. ساختارهای برنامه نویسی دیگر مانند بردارها، لیست ها، فریم ها، جداول داده ها، ماتریس ها و غیره وجود دارد که به شما امکان انجام تحولات داده ها را بصورت فله ای می دهد.
برنامه های R برنامه نویسی در دنیای واقعی

علم اطلاعات

نظریه کسب و کار هاروارد دانشمند داده را “جنس ترين كار قرن ۲۱” ناميد. Glassdoor این نام را “بهترین کار سال” برای سال ۲۰۱۶ نامیده است. با ظهور دستگاه های IoT که ترابایت و ترابایت داده ها را می توان برای تصمیم گیری بهتر استفاده کرد، علم اطلاعات زمینه ای است که راه دیگری برای رفتن ندارد. به سادگی توضیح داده شد، یک دانشمند اطلاعاتی یک آمارگیر با دارایی اضافی است: مهارت های برنامه نویسی کامپیوتر. زبانهای برنامه نویسی مانند R یک ابرقدرت دانشمند داده است که به آنها امکان می دهد داده ها را در زمان واقعی جمع آوری کنند، تجزیه و تحلیل آماری و پیش بینی را انجام دهند، تجسم ها را ایجاد کنند و نتایج ذیل را به ذینفعان مرتبط کنند.

اکثر دوره های علوم داده شامل R در برنامه درسی خود هستند، زیرا ابزار مورد علاقه دانشمند داده است.

محاسبات آماری

R محبوب ترین زبان برنامه نویسی در میان آمارگیران است. در واقع، ابتدا توسط آمارگیران برای آمارگیران ساخته شد. این یک مخزن بسته غنی با بیش از ۹۱۰۰ بسته با هر عملکرد آماری که شما می توانید تصور کنید. R سابق است

هیچ راهی برای یادگیری برنامه ریزی با استفاده از زبان برنامه نویسی R وجود ندارد. بسته به سبک یادگیری شما می توانید بین هر یک از منابع موجود در اینترنت را انتخاب کنید.

یادگیری R از DataMentor

در DataMentor، ما یک تن از منابع را برای کمک به شما در شروع یادگیری R ایجاد کرده ایم. شما می توانید از آموزش های ما برای شروع با استفاده از آمار با استفاده از R. ما پوشش را چگونه

دانلود نرم افزار برای اجرای اسکریپت R

کد R را بنویسید
درک نحو R
انجام عملیات آماری اساسی
یادگیری مفاهیم R پیشرفته

 

انجام شبیه سازی با r ns2 omnet ads arena آرنا متلب کلودسیم کامسول پایتون هایسیس تحلیل انجام پروژه های آماری شبیه سازی MCMC با نرم افزار r spss arena ns2

 

شبیه سازی مونت کارلو در بسیاری از مطالعات آماری و اقتصادسنجی توسط بسیاری از محققان متداول است. بنابراین ، ما در این کارگاه ابزار اصلی ساخت یک مطالعه شبیه سازی مونت کارلو با استفاده از R را ارائه می دهیم و مفاهیم اساسی در مورد چگونگی ایجاد کدهای R خود را به روشی آسان به محققان می دهیم. علاوه بر این ، این کارگاه یک مثال تجربی ساده در اقتصاد سنجی به عنوان یک کاربرد ارائه می دهد. سرانجام ، راهنمای ساده برای ایجاد هر نوع شبیه سازی R-کد تولید شده است. و ما بسته های اصلی R را برای ایجاد و دستیابی به یک مطالعه شبیه سازی مونت کارلو بررسی می کنیم.

مطالب کارگاه
۱٫ آشنایی با شبیه سازی مونت کارلو
۲٫ تعریف و مزایای روشهای مونت کارلو
۳٫ روش روشهای مونت کارلو در ادبیات.
۴- چرا R؟
۵- یک برنامه کاربردی: مدل رگرسیون خطی ساده با مشکل همبستگی.
۶٫ بسته های R موجود برای شبیه سازی.

۱٫ آشنایی با شبیه سازی مونت کارلو
 جنتل (۲۰۰۳) روش های مونت کارلو را تعریف کرد ، به طور کلی ، آزمایش های متشکل از اعداد تصادفی برای ارزیابی عبارات ریاضی است.
 برای استفاده از روش مونت کارول ، تحلیلگر یک مدل ریاضی را ایجاد می کند که یک سیستم واقعی را شبیه سازی می کند.
 تعداد زیادی نمونه گیری تصادفی از مدل با استفاده از تعداد زیادی نمونه تصادفی از نتایج حاصل از مدل اعمال می شود.
 برای هر نمونه ، داده های تصادفی در هر متغیر ورودی تولید می شوند. محاسبات از طریق مدل اجرا شده و نتایج تصادفی را در هر متغیر خروجی اجرا می کنند.
 از آنجا که هر ورودی تصادفی است ، نتایج تصادفی است.

۲٫ تعریف و مزایای روشهای مونت کارلو
Gentle (2003) روش های مونت کارلو را تعریف کرد ، به طور کلی ، آزمایش هایی است که از اعداد تصادفی برای ارزیابی عبارات ریاضی تشکیل شده است.
ما می توانیم مزایای عمومی (اهداف) روش های مونت کارلو را در نکات زیر خلاصه کنیم:
when هنگامی که نظریه آماری ضعیف برای یک برآوردگر وجود داشته باشد ، استنتاج کنید
quality کیفیت یک روش استنباط را ارزیابی کنید
the استحکام استنتاج پارامتری را در تخلفات فرض ارزیابی کنید
 مقایسه ویژگی های برآوردگر

۳٫ روش روشهای مونت کارلو در ادبیات
مونی (۱۹۹۷) پنج مرحله برای انجام یک مطالعه شبیه سازی مونت کارلو را ارائه می دهد:
مرحله ۱: شبه جمعیت را به صورت نمادین مشخص کنید به گونه ای که می توان از طریق نوشتن کد برای تولید نمونه ها از یک روش خاص برای تولید نمونه استفاده کرد.
مرحله دوم: نمونه ای از شبه جمعیت به روش هایی که موضوع علاقه را نشان می دهد
مرحله سوم: θ را در یک نمونه شبه محاسبه کرده و آن را در یک بردار ذخیره کنید

مرحله ۴: مراحل ۲ و ۳ بار تکرار کنید که تعداد آزمایش ها در آن باشد
مرحله ۵: توزیع فرکانس نسبی مقادیر حاصل را که تخمین مونت کارلو از توزیع نمونه برداری در شرایطی است که توسط شبه جمعیت و روشهای نمونه برداری ساخته شده است ، بسازید.
 برای کسب اطلاعات بیشتر در مورد روش های مونت کارلو ، می توانید منابع زیر را مرور کنید: Thomopoulos (2012)، Gentle et al. (2012) ، و رابرت و کازلا (۲۰۱۳).

۴- چرا R؟
توصیه می کنیم از R در MCS برای مزایای زیر استفاده کنید:
زبان آماری رایگان.
source منبع آزاد.
 به روز.
 سریع
 برخورد با بسیاری از نرم افزارهای دیگر.
انجام شبیه سازی با r برای اصول اولیه R ، به Crawley (2012) و Abonazel (2014b) مراجعه کنید.

۵٫ یک رگرسیون خطی ApplicationSimple: مدل با مشکل همبستگی
 در این بخش الگوریتم مطالعه شبیه سازی مونت کارلو را از طریق برنامه ای در چارچوب رگرسیون توضیح می دهیم.
 این الگوریتم (در پنج مرحله) تهیه شده توسط Abonazel (2018).
this ما از این الگوریتم برای مقایسه بین برآوردگرهای OLS و GLS در مدل رگرسیون خطی ساده استفاده می کنیم وقتی خطاها با خود مختار مرتبه اول (AR (1)) در ارتباط هستند.
 در هر مرحله ، ما کد R را برای ایجاد آن ثابت کردیم.
 در این کارگاه تصور می کنیم که خواننده با اصول برنامه نویسی R آشنا باشد. اگر از این موضوع راضی نیستید ، می توانید منابع زیر را مرور کنید: رابرت و کازلا (۲۰۰۹) ، کراولی (۲۰۱۲) و ابونازل (۲۰۱۴b).

  انجام شبیه سازی با r ns2 omnet ads arena آرنا متلب کلودسیم کامسول پایتون هایسیس تحلیل انجام پروژه های آماری شبیه سازی MCMC با نرم افزار r spss arena ns2                                                                                                    

انجام شبیه سازی با r علت روي آوردن پژوهشگران عرصه مدلسازي تصادفات از توزيع پواسن به توزيع دوجمله اي منفي، كاستي توزيع پواسن در برابري ميانگين و واريانس توزيع است. رابطه ميان ميانگين و واريانس در توزيع دوجمله اي منفي مانند است. بنابراين واريانس توزيع دوجمله اي منفي همواره بزرگتر از ميانگين آن است. از اين رو براي داده ها با واريانس بزرگتر از ميانگين، اين توزيع مناسب است.  پارامترپراكندگي است. براي داده هاي تصادفات با پراكندگي كم، استفاده از توزيع پواسن براي مدلسازي نتايج قابل قبولي بدست مي دهد اما اگر پراكندگي داده ها زياد باشد، واريانس داده ها بيشتر از ميانگين آنها خواهد شدو بايد از توزيع دوجمله اي منفي براي مدل سازي داده هاي تصادفات استفاده نمود.

در مدل رگرسيون دوجمله اي منفي، علاوه برضرايب رگرسيون، بايد پارامتر پركندگي را نيز برآورد نمود. بايد مثبت باشد. ازاين رو به جاي آن، رابرآورد مي كنيم كه مي تواند هر مقداري را اختيار كند.

تابع درستنمايي توزيع دوجمله اي منفي براي مشاهده- ام از رابطه زير بدست مي آيد:

و از آنجا لگاريتم درستنمايي براي مشاهده- ام داراي رابطه زير خواهد بود:

براي برآوردو مانند مدل رگرسيون پواسن از روش تكرارنيوتن- رافسون استفاده مي كنيم اما اين بار، تكرار پيچيده تر و زمان برتر است. براي اينكار برنامه تكرار مربوطه را به نرم افزار SAS داده و پارامترهاي مجهول را بدست مي آوريم. نخست،() قرارمي دهيم يا همان حالت رگرسيون پواسن. سپس از رابطه تكرار زير ضرايب رگرسيون را برآورد مي كنيم :                                                                                                                                                 

  مقادير وبرآوردشده در مرحله يكي مانده به آخر،مطلوب ماست.، عكس پارامتر پراكندگي و، ضرايب رگرسيون مدل مي باشد.

ارزيابي معناداري متغيرهاي ناوابسته مدل رگرسيون دوجمله اي منفي نيز مانند مدل پواسن است.

برنامه ورودي مدل رگرسيون دوجمله اي منفي براي تصادفات با زيان مالي( nap) مانند زير است:

proc nlmixed data=ehsanp;

parms b0=0 b1=0 b2=0 b3=0 b4=0 b5=0 b6=0 b7=0;

mu=exp(b0+b1*vp+b2*vh+b3*vl+b4*s+b5*nl+b6*nc+b7*na);

ll=lgamma(nap+1/alpha)-lgamma(nap+1)-lgamma(1/alpha)                                                                                                                                         +nap*log(alpha*mu)-(nap+1/alpha)*log(1+mu*alpha);

model nap~general(ll);

predict mu out= p;

run;  

خروجي برنامه نيز مانند زير است:

Fit Statistics

-۲ Log Likelihood                 ۵۳۶۸٫۸

Parameter Estimates     

Parameter  Estimate Standard Error  DF    t Value  Pr > |t|         

b0         -۰٫۸۱۰۸     ۰٫۲۷۸۲      ۹۳۶    -۲٫۹۱     ۰٫۰۰۳۷        

b1          ۰٫۰۰۰۳۹۱   ۰٫۰۰۰۰۷۴    ۹۳۶     ۵٫۲۹     <.0001    

b2         -۰٫۰۰۰۰۱    ۰٫۰۰۰۱۱۲    ۹۳۶    -۰٫۱۰     ۰٫۹۱۹۵       

b3          ۰٫۰۰۰۶۵۴   ۰٫۰۰۰۱۳۸    ۹۳۶     ۴٫۷۳     <.0001       

b4          ۰٫۰۱۰۵۱    ۰٫۰۰۲۳۱۲    ۹۳۶     ۴٫۵۵     <.0001    

b5          ۰٫۲۳۶۴     ۰٫۰۶۸۵۵     ۹۳۶     ۳٫۴۵     ۰٫۰۰۰۶             

b6          ۰٫۳۷۵۳     ۰٫۰۵۳۸۳     ۹۳۶     ۶٫۹۷     <.0001          

b7          ۰٫۱۸۱۰     ۰٫۰۲۷۲۱     ۹۳۶     ۶٫۶۵     <.0001          alpha       ۱٫۰۸۳۷     ۰٫۰۶۳۶۰     ۹۳۶    ۱۷٫۰۴     <.0001                

انجام شبیه سازی با r برنامه ورودي مدل رگرسيون دوجمله اي منفي در نرم افزار r براي تصادفات با زيان جاني( nas) مانند زير است:

proc nlmixed data=ehsans;

parms b0=0 b1=0 b2=0 b3=0 b4=0 b5=0 b6=0 b7=0;

mu=exp(b0+b1*vp+b2*vh+b3*vl+b4*s+b5*nl+b6*nc+b7*na);

ll=lgamma(nas+1/alpha)-lgamma(nas+1)-lgamma(1/alpha) +nas*log(alpha*mu)-(nas+1/alpha)*log(1+mu*alpha);

model nas~general(ll);

predict mu out= p;

run;

خروجي نرم افزار r نيز مانند زير است:

Fit Statistics

-۲ Log Likelihood                 ۲۳۲۸٫۵

Parameter Estimates

Parameter  Estimate  Standard Error  DF   t Value  Pr > |t|         

b0         -۰٫۹۲۱۲    ۰٫۳۳۲۲        ۹۳۶    -۲٫۷۷     ۰٫۰۰۵۷        

b1         -۰٫۰۰۰۱۱   ۰٫۰۰۰۰۸۵      ۹۳۶    -۱٫۳۳     ۰٫۱۸۴۵    

b2         -۰٫۰۰۰۱۷   ۰٫۰۰۰۱۴۳      ۹۳۶    -۱٫۱۷     ۰٫۲۴۱۷       

b3          ۰٫۰۰۱۰۱۲  ۰٫۰۰۰۱۶۰      ۹۳۶     ۶٫۳۳     <.0001       

b4          ۰٫۰۰۴۴۰۵  ۰٫۰۰۳۱۳۶      ۹۳۶     ۱٫۴۰     ۰٫۱۶۰۴     

b5         -۰٫۰۹۶۶۵   ۰٫۰۷۹۲۷       ۹۳۶    -۱٫۲۲     ۰٫۲۲۳۱    

b6          ۰٫۵۰۱۸    ۰٫۰۵۵۶۰       ۹۳۶     ۹٫۰۲     <.0001    

b7          ۰٫۰۹۶۴۳   ۰٫۰۳۱۹۸       ۹۳۶     ۳٫۰۲     ۰٫۰۰۲۶    

alpha       ۰٫۷۸۶۳    ۰٫۱۰۶۴        ۹۳۶     ۷٫۳۹     <.0001    

 

انجام شبیه سازی با r در گردآوري داده هاي تصادفات، هنگامي كه با داده هاي صفر پرشمار روبرو مي شويم، از توزيع پرصفر (ZIP وZINB) براي تحليل داده ها استفاده مي كنيم. فرض اساسي در توزيع پرصفر آن است كه اجزاي راه مانند تقاطع ها و بخش هاي راه دو حالت دارند:

  • حالت داده تصادف واقعاً صفر يا حالت ذاتاًايمن. هرچند برخي آنرا حالت ايمن مجازي تعريف كرده اند تا مجبور به دفاع از ادعاي ايمني كامل آن بخش از راه نشوند.
  • حالت داده غيرصفر. دراين حالت ممكن است دربرخي دوره هاي زماني داده هاي صفر هم گزارش شوند، اين حالت داراي يك توزيع آماري بويژه توزيع پواسن(‌ZIP) يا دوجمله اي منفي(‌ZINB)است.

در حالت نخست تنها داده هاي صفر داريم و در حالت دوم شمارتصادفات مانند داده هايي با توزيع پواسن يا دوجمله اي منفي مي باشد. حالت اول با احتمال  و حالت دوم با احتمال  روي مي دهد.

داده هاي تصادفات معمولاً داده هايي دوسطحه است كه يك سطح آن اغلب بخش معيني از راه و سطح ديگر مي تواند دوره زماني معيني از سال باشد. اگر ، شمار تصادفات رخ داده در بخش- ام راه در دوره زماني- ام از سال، داراي توزيع پرصفر پواسن(ZIP) باشد تابع جرم احتمال آن مانند زير است                                  

در مدل رگرسيونZIP، ميانگين توزيع پواسن،باتابع پيوندي لگاريتم طبيعي به رگرسيوني ازبردار متغيرهاي ناوابسته و احتمال فرآيندصفر، با تابع پيوندي لاجيت به رگرسيوني از بردار متغيرهاي ناوابسته پيوند داده مي شود:  و. كه درآن و بردارهاي ضرايب رگرسيون است.

از سوي ديگر، اگر داده هاي تصادفات علاوه بر مشكل صفرهاي زياد، دچار پراكندگي زياد نيز باشند مانند آنچه در مدل هاي رگرسيون دوجمله اي منفي داشتيم، از مدل رگرسيون پرصفر دوجمله اي منفي (ZINB) براي مدل سازي استفاده مي كنيم. يك متغير شمارشي با توزيع پرصفر دوجمله اي منفي داراي تابع جرم احتمال زير است:     

مدل هاي رگرسيون پواسن و دوجمله اي منفي پرصفر تركيبي از مدل هاي پواسن و دوجمله اي منفي با مدلي است كه داده هاي صفر را مدل مي كند. تابع لگاريتم درستنمايي كه براي برآورد ضرايب رگرسيونو تشكيل مي شود بايد هردو مدل را درنظر داشته باشد. براي داده هاي غير صفر، تابع لگاريتم درستنمايي همان تابع لگاريتم درستنمايي مدل هاي رگرسيون پواسن و دوجمله اي منفي است، اما براي داده هاي صفر، چنانكه از تابع احتمال مدل هاي پرصفر پيداست اين تابع مانند  تعريف مي شودكه در آن، مقدار تابع احتمال پواسن يا دوجمله اي منفي در صفر است. معمولاً براي سادگي برآورد، براي بردار  همان متغيرهاي ناوابسته بردار  درنظر گرفته مي شود. بدين ترتيب روابط پيوندي ميانگين توزيع،و، احتمال فرآيندي كه تنها داده هاي صفر توليد مي كند مانند و  خواهد بود.                                                                                                                                                                                                                                                                                                                                                                                                          انجام شبیه سازی با r براي آزمودن مناسب بودن استفاده از مدل پر صفر به جاي مدل هاي رگرسيون پواسن يا دوجمله اي منفي، ازآزمون وانگ استفاده مي كنيم. بطوري كه اگر،j=1,2  احتمال شمار تصادفات و داشته باشيم:، بطوري كه، تابع چگالي احتمال مدل پر صفر و تابع چگالي احتمال مدل پواسن يادوجمله اي منفي است.آماره وانگ داراي بستگي زيراست:

اگر كمتر از ۱٫۹۶ باشد يعني داراي بازه اطمينان %۹۵ براي آزمون t باشد، آزمون هيچ نتيجه اي بدست نمي دهد. اما اگر مقدار بزرگتر از ۱٫۹۶ باشد مدل رگرسيون پرصفر بهتر است، درحالي كه اگر مقدار كوچكتر از۱٫۹۶- باشد استفاده از مدل رگرسيون پواسن يا دوجمله اي منفي بهتر خواهد بود.

انجام شبیه سازی با r ns2 omnet ads arena آرنا متلب کلودسیم کامسول پایتون هایسیس تحلیل انجام پروژه های آماری شبیه سازی MCMC با نرم افزار r spss arena ns2

ما می توانیم مدل خود را با استفاده از کنترل های شبیه سازی (فاکتورها) را بسازیم. کد R:

مرحله دوم: ساختن مدل # —- مرحله ۱: فرض کنید مقادیر واقعی وکتور پارامترهای β: True.Beta <- c (1،۱) # —- مرحله ۲: انتخاب کنید اندازه نمونه n: n = 5 # —- مرحله ۳: تولید تصادفی وکتور خطا u: sigma.epsilon = sqrt (1) rho = 0.50 epsilon = rnorm (n، ۰، sigma.epsilon) u = c (0) u [1] = epsilon [1] / ((1 – (rho) ^ 2) ^ 0.5) for (i in 2: n) u [i] = rho * u [i – 1] + epsilon [i] # —- مرحله ۴: مقادیر ثابت ماتریس متغیرهای مستقل X را ایجاد کنید: X = cbind (1 ، runif (n ، -۱،۱)) # —- مرحله ۵: مقادیر را تولید کنید متغیر وابسته Y: Y = X٪ *٪ True.Beta + u

مرحله سوم: درمان (با استفاده از عملکرد تخمین cerate): تخمین <- عملکرد (Y = Y ، X = X) {# —- مرحله ۱: محاسبه گرهای OLS و GLS ## 1 — – برآوردگر OLS: Beta.hat.ols = حل (t (X)٪ *٪ X)٪ *٪ t (X)٪ *٪ Y ## 2 —- برآوردگر GLS: n = طول (Y)؛ rho.hat = (t (u [-n])٪ *٪ u [-1]) / sum (u [-1] ^ 2) dim (rho.hat) = NULL if (rho.hat> 1) rho .hat = 0.99؛ if (rho.hat <0) rho.hat = 0.005 # —————— epsilon.hat = NA؛ epsilon.hat [1] = تو [۱] * (۱ – (rho.hat) ^ 2) ^ 0.5 epsilon.hat [2: n] = u [-1] – rho.hat * u [-n] sigma2 .epsilon.hat = جمع (epsilon.hat ^ 2) / (n – 2) کم (sigma2.epsilon.hat) = NULL # —————— v < – ماتریس (NA ، nrow = n ، ncol = n) برای (i در ۱: n) برای (j در ۱: n) v [i، j] = (rho.hat) ^ abs (i – j) امگا < – (sigma2.epsilon.hat / (1 – (rho.hat) ^ 2)) * v Beta.hat.gls = حل (t (X)٪ *٪ حل (امگا)٪ *٪ X)٪ *٪ ( t (X)٪ *٪ حل (امگا)٪ *٪ Y) # —- مرحله ۲: معیار های شبیه سازی (تعصب و واریانس) را محاسبه کنید. bias.ols = Beta.hat.ols – True.Beta؛ bias.gls = Beta.hat.gls – True.Beta var.Beta.hat.gls = قطر (حل (T (X)٪ *٪ حل (امگا)٪ *٪ X)) var.Beta.hat.ols = diag (حل (t (X)٪ *٪ X)٪ *٪ t (X)٪ *٪ امگا٪ *٪ X٪ *٪ ​​حل (t (X)٪ *٪ X)) BV = cbind (bias.ols ، bias.gls ، var.Beta.hat.ols ، var.Beta.hat.gls) نام های خانوادگی (BV) = c (“Beta0” ، “Beta1”)؛ بازگشت colnames (BV) = c (“Bias OLS” ، “Bias GLS” ، “Var OLS” ، “Var GLS”) (BV) return