رگرسیون نیمه پارامتری فازی بر اساس خوشه‌بندی فازی

نویسندگان

1 گروه آمار، دانشگاه بیرجند

2 استادیار گروه آمار دانشگاه بیرجند

چکیده

تحلیل خوشه­ای از مهم‌ترین روش­های طبقه­بندی محسوب می‌شود. در تحلیل خوشه­بندی تلاش می‌شود تا مشاهدات واقع در هر خوشه بیشترین تشابه را از نظر متغیرهای موردنظر باهم داشته باشند. به‌طورکلی روش­های خوشه­بندی به دو دسته قطعی و فازی تقسیم می­شوند. در روش­های متداول خوشه­بندی، هر مشاهده تنها در یک خوشه قرار می­گیرد، اما در خوشه‌بندی فازی، یک مشاهده هم‌زمان در دو یا چند خوشه جای می­گیرد. در سال 1966، یانگ و کو یک روش خوشه­بندی فازی را ارائه کردند. روش آن­ها، تعمیمی از روش متداول خوشه­بندی میانگین معمولی برای حالتی است که داده­ها به‌صورت فازی مشاهده شده­اند. یک مدل رگرسیون فازی، برای رابطه­ی بین متغیرهای مستقل و متغیر وابسته به­کار می­رود؛ اما در برخی از موارد پراکندگی و ناهمگنی برخی از مشاهدات باعث می­شود که یک معادله رگرسیونی نتواند به داده­ها برازش خوبی داشته باشد. برای رفع این مشکل یانگ و کو داده­ ها را خوشه­ بندی نموده و برای هر خوشه یک معادله رگرسیونی بر اساس داده­های فازی، برازش نموده است. در این مقاله، ابتدا معادله رگرسیون نیمه پارامتری که توسط حسامیان و همکاران ]۸[ معرفی شده را بیان نموده و سپس با استفاده از آن نویسندگان برای اولین بار از این معادله در خوشه‌بندی با داده­های فازی استفاده نموده­اند. لازم به ذکر است که نتایج حاصل از این روش با روش یانگ و کو بر اساس معیارهای نیکویی برازش پیشنهادی، مقایسه می­کنیم.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Fuzzy Semi-Parametric Partially Cluster-Wise Regression Analysis

نویسندگان [English]

  • Masoumeh Asadollahi 1
  • Mohammad Ghasem Akbari 2
1 Department of Statistics, University of Birjand, Birjand, Iran
چکیده [English]

Cluster analysis is one of the most important methods in classification in which the observations of each cluster has maximum similarity in terms of some desirable variables. In general the clustering methods are divided into two parts, crisp and fuzzy. In usual clustering methods an observation is in only one cluster whereas in fuzzy clustering it may fall into two or more clusters simultaneously. Yang and Ko (1996) introduced a fuzzy clustering method. Their method is an extension of the usual k-means clustering method as they assumed that the observations are fuzzy. A fuzzy regression model is used for studying the relationship between the explanatory variables and dependent variable. In some situations when some observations are dispersed and are heterogeneous, the regression model may not have a goodness of fit for data. To solve this problem Yang and Ko classified data and then based on fuzzy observations fitted a regression model to each cluster. In this paper we first explain the semi-parametric regression model introduced by Hesamian et al. [2017] and then use their model to perform our clustering method for fuzzy observations. Finally, based on some suggested goodness of fit criterions. We compare our results with those of Yang and Ko.

کلیدواژه‌ها [English]

  • Fuzzy number
  • α-pessimistic
  • Fuzzy clustering
  • One-stage generalized regression
  • Semi-parametric regression
]1[ خالقی گزیک، سارا (1393). مدل­های رگرسیون خطی بر اساس خوشه­بندی فازی، پایان­نامه کارشناسی ارشد آمار، دانشکده علوم ریاضی و آمار، دانشگاه بیرجند.
]2[ طاهری، سید محمود (1375). آشنایی با نظریه مجموعه­های فازی، انتشارات جهاد دانشگاهی دانشگاه فردوسی مشهد.
 
[3] Arefi, M. (2016). Clustering regression based on interval-valued fuzzy outputs and interval-valued fuzzy parameters. Journal of Intelligent and Fuzzy Systems, 30, 1339–1351.
 [4] Bellman, R. Kalaba, R. and Zadeh, L.A. (1966). Abstraction and pattern classification, Journal of Mathematical Analysis and Applications, 13, 1-7.
 
[5] Bezdek, J.C. (1981). Pattern recognition with Fuzzy Objective Function Algorithms, Plenum Press, New York.
[6] Cannon, R. Dave, J. and Bezdek, J.C. (1986). Efficient implementation of the fuzzy c-means clustering algorithms, IEEE Transactions on Pattern Analysis and Machine Intelligence, 8, 248-255.
[7] Dunn, J.C. (1974). A fuzzy relative of the ISODATA process and its use in detecting compact well-separated clusters, Journal of Cybernetics, 3, 32-57.
[8] Hesamian, G. Akbari, M.G. and Asadollahi, M. (2017). Fuzzy semi-parametric partially linear model with fuzzy inputs and fuzzy outputs, Expert Systems with Applications, 71, 230-239.
 
[9] Liu, B. (2013). Uncertainty Theory, 4th ed., Springer, Berlin.
[10] Robinson, P. (1988). Root-N-Consistent Semi-parametric Regression, Econometrics, 56, 931–954.
[11] Ruspini, E. (1969). A new approach to clustering, Information and Control, 15, 22-32.
[12] Schnatter, S.F. (1992). On statistical inference for fuzzy data with applications to descriptive statistics, Fuzzy Sets and Systems, 50, 143-165.
 
[13] Taheri, S.M. and Kelkinnama, M. (2012). Fuzzy linear regression based on least absolute deviations, Iranian Journal of Fuzzy Systems, 9, 121-140.
[14] Yang, M.S. (1993). A survey of fuzzy clustering, Math. Computer Modeling, 18, 1-16.
 [15] Yang, M.S. (1993). On a class of fuzzy classification maximum likelihood procedures, Fuzzy Sets and Systems, 57, 365-375.
[16] Yang, M.S. and Ko, C.H. (1996). On a class if fuzzy c-numbers clustering procedures for fuzzy data, Fuzzy Sets and Systems, 84, 49-60.
 
[17] Yang M.S. and Ko C.H. (1997). On cluster-wise fuzzy regression analysis, IEEE Transactions onSystems, Man, and Cybernetics-Part B: Cybernetics, 27, 1-13.
[18] Zadeh, L.A. (1956). Fuzzy sets, Information and Control, 8, 338-353.