انتخاب متغیر در مدل‌های آمیخته متناهی تعمیم‌یافته نیم‌پارامتری

نوع مقاله : اصیل

نویسندگان

1 گروه آمار، دانشگاه علامه طباطبایی

2 گروه آمار، واحد مشهد، دانشگاه آزاد اسلامی

3 گروه ریاضی کاربردی، دانشگاه علم و صنعت ایران

چکیده

هدف این مقاله به‌دست آوردن بهترین متغیرهای کمکی تاثیرگذار بر متغیر پاسخ در مدل‌های نیم‌پارامتری تحت شرایطی است که تابع تاوانیده نیز در مساله وجود دارد. لازم به ذکر است که ترکیبی از پارامترها به عنوان ضرایب متغیرهای موجود در هر مدل ارایه شده که برخی از آنها به صورت خطی و بعضی دیگر به صورت تابعک بر متغیر پاسخ تاثیرگذارند. لاجرم روش نیم‌پارامتری به عنوان یک راه حل بهینه در حل مساله مدنظر قرار گرفته است. لذا در این مقاله مساله انتخاب متغیر را در مدل‌های تعمیم‌یافته نیم‌پارامتری آمیخته متناهی مورد بررسی قرار خواهیم داد. این مساله خود شامل انتخاب مدل در مولفه ناپارامتری مدل و انتخاب متغیر در بخش پارامتری می‌شود. بنابراین با انتخاب مدل‌های مجزایی برای هر مولفه ناپارامتری هر زیر مدل مواجه خواهیم بود. به منظور غلبه بر این بار محاسباتی بالا، کلاسی از رویه‌های انتخاب متغیر را برای مدل‌های تعمیم‌یافته نیم‌پارامتری آمیخته متناهی معرفی خواهیم کرد. نشان خواهیم داد رویکرد جدید برای انتخاب متغیر، سازگار است. همچنین به کمک شبیه‌سازی نشان خواهیم داد روش پیشنهادی از کارایی مناسبی برخوردار بوده و روش‌های موجود را بهبود می‌بخشد و علاوه بر این به توان محاسباتی کمتری نیاز دارد.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

variable selection of generalized semi-parametric mixture models

نویسندگان [English]

  • Farzad Eskandari 1
  • Ehsan Ormoz 2
  • Rahman Farnoosh 3
1 Department of Statistics, Allameh Tabataba’i University
2 Department of Statistics, Mashhad branch, Islamic Azad University
3 School of Mathematics, Iran University of Science and Technology
چکیده [English]

Purpose of this paper is identifying best covariates of a semi-parametric model in the presence of penalized coefficients. It should be noted that in each model, coefficients of the existing variables is considered as a combination of parameters where some of them affect the response variable linearly and some of them functionally. So, semi-parametric method was considered as an optimum solution.
In this paper we concerned with variable selection in finite mixture of generalized semi-parametric models. This task consists of model selection for nonparametric component and variable selection for parametric part. Thus we encounter with separate model selection for each nonparametric component of each sub model. To overcome to this computational burden, we introduce a class of variable selection procedures for finite mixture of generalized semi-parametric models. It is shown that the new method is consistent for variable selection. Simulations show that the performance of proposed method is good and improve pervious works in this area and also requires much less computing power than existing methods.

کلیدواژه‌ها [English]

  • variable selection
  • semi-parametric model
  • Finite mixture model
  • penalized Likelihood
[1] Breiman, L. (1996), Heuristics of instability and stabilization in model selection, The Annals of Statistics, 24, 2350–2383.
 
[2] Fan, J. and Li, R. (2001), Variable selection via nonconcave penalized likelihood and its oracle properties, J. Amer. Statist. Assoc., 96, 1348-1360.
[3] Ma, S., Song, Q. and Wang, L. (2013), Simultaneous variable selection and estimation in semiparametric modeling of longitudinal/clustered data, Bernoulli, 19, 252-274.
[4] Tibshirani, R. (1996), Regression shrinkage and selection viathe lasso, J. Royal. Statist. Soc., Series B., 58, 267-288.
[5] Fan, J. and Li, R. (2002), Variable selection for cox's proportional hazards model and frailty model, Ann. Statist., 30, 74-99.