# مدل‌سازی رگرسیونی به روش تی لاسو بیزی

نوع مقاله : مقاله پژوهشی

نویسندگان

گروه آمار، دانشگاه پیام نور، صندوق پستی 19395-4697 ، تهران، ایران

چکیده

انتخاب مدل بهینه یکی از بحث‌های مهم در مدل‌های رگرسیونی است. هدف روش‌های انتخاب مدل بهینه در مدل‌های رگرسیونی این است که متغیرهای توضیحی مهم و متغیرهای قابل اغماض را تعیین نموده و رابطه‌ی بین متغیر پاسخ و متغیرهای توضیحی را به‌طور ساده‌تر بیان کند. با توجه به محدودیت‌های فرآیندهای کلاسیک انتخاب متغیر از قبیل انتخاب گام به گام، می‌توان از روش‌های رگرسیون تاوانیده استفاده کرد. یکی از مدل‌های رگرسیون تاوانیده، رگرسیون لاسو است که در آن فرض می‌شود خطاها از توزیع نرمال پیروی می‌کنند. برای تحلیل آماری مجموعه داده‌ها در حضور مشاهدات دورافتاده، می‌توان به جای توزیع نرمال از توزیع t-استیودنت برای خطا استفاده کرد. در این مقاله، روش انتخاب متغیری تحت عنوان مدل رگرسیون تی لاسو بیزی برای تحلیل داده‌ها در حضور مشاهدات دورافتاده، پیشنهاد می‌دهیم. مدل رگرسیون تی لاسو بیزی با دو نمایش متفاوت از تابع چگالی پیشین لاپلاس برای ضرایب مدل رگرسیونی مورد بررسی قرار می‌گیرد، به این صورت که ابتدا تابع چگالی لاپلاس به صورت توزیع آمیخته-مقیاس نرمال و سپس به صورت توزیع آمیخته‌-مقیاس یکنواخت نمایش داده می‌شود. سپس با استفاده از روش‌های شبیه‌سازی و تحلیل داده‌های‌ واقعی، ارجحیت روش رگرسیون تی لاسو بیزی با نمایش تابع چگالی لاپلاس به صورت آمیخته‌-مقیاس یکنواخت نسبت به نمایش آمیخته-مقیاس نرمال نشان داده می‌شود.

کلیدواژه‌ها

موضوعات

عنوان مقاله [English]

### Regression Modeling Via T-Lasso Bayesian Method

نویسندگان [English]

• Ali Shadrokh
• Zahra Khadembashiri
• Masoud Yarmohammadi
Department of Statistics, Payame Noor University, P.O.Box 19395-4697, Tehran, Iran
چکیده [English]

Choosing the optimal model is one of the important issues in regression models. The purpose of optimal model selection methods in regression models is to determine important explanatory variables and negligible variables and to express the relationship between response variable and explanatory variables more simply. Due to the limitations of classical variable selection processes such as stepwise selection, penalized regression methods can be used. One of the penalized regression models is Lasso regression in which the errors are assumed to follow a normal distribution. For statistical analysis of the data set in the presence of outlier observations, the student’s t distribution for error can be used and robust estimators can be provided. In this article, a variable selection method called Bayesian T-Lasso regression model is proposed based on Lasso Bayesian regression model in the presence of outlier observations in the data. The Bayesian T-Lasso regression model is presented with two different representations of the Laplace density function for the regression model coefficients, At the first the Laplace density function is represented as a scale mixture of normal distribution and then a scale mixture of uniform distribution. We demonstrate the utility of our Bayesian T-Lasso regression using simulation methods and real data analysis.

کلیدواژه‌ها [English]

• Bayesian Lasso Regression
• Penalized regression
• Scale Mixture of uniform
• Gibbs Sampling Algorithm
• variable selection

### سابقه مقاله

• تاریخ دریافت: 30 شهریور 1399
• تاریخ بازنگری: 11 دی 1399
• تاریخ پذیرش: 02 بهمن 1399