تشخیص ویژگی‌های متمایزکنندۀ جنس .Rubus L در ایران با استفاده از الگوریتم‌های انتخاب ویژگی

نویسندگان

1 دانش آموخته کارشناسی ارشد گروه کامپیوتر، دانشکده علوم پایه و فنی مهندسی، دانشگاه گنبد کاووس، ایران

2 دانش آموخته کارشناسی ارشد گروه الکترونیک- دانشکده علوم-دانشگاه گنبد کاووس

3 دانش آموخته کارشناسی ارشد گروه بیولوژی-دانشکده علوم-دانشگاه گنبد کاووس

4 دانشگاه گنبد کاووس

چکیده

جنس Rubus L. متعلق به تیرۀ Rosaceae و زیرتیرۀ Rosoideae شامل حدود 750 گونه در دنیاست. این جنس در بیشتر نواحی جهان پراکنش دارد و در فلور ایران، تعداد 8 گونه و 5 هیبرید (دورگه) از آن گزارش شده است. جنس تمشک یکی از پر چالش‌ترین تاکسون‌ها بین گیاهان گل‌دار محسوب می‌شود. وجود عواملی ازجمله پلی‌پلوئیدی، آپومیکسی و دورگه‌گیری فراوان در این جنس باعث بروز مشکلاتی در تشخیص آن ازنظر ریخت‌شناسی شده است. جمع‌آوری داده‌های کمّی و کیفی برای تشخیص گونه‌ها و روش‌های جمع‌آوری مؤلفه‌های ریخت‌شناسی بسیار زمان‌بر و پر‌هزینه‌اند؛ بنابراین، همواره به‌کارگیری روش‌های متفاوت برای کاهش زمان و هزینه‌ها مطرح بوده است. روش‌های داده‌کاوی در زمینه‌های متعددی مانند مطالعه‌های آناتومی، ریخت‌شناسی و غیره به کار گرفته می‌شوند. الگوریتم‌های انتخاب ویژگی یکی از روش‌های داده‌کاوی‌اند که برای تشخیص ویژگی‌های متمایزکننده بین گونه‌ها استفاده می‌شوند. در مقالۀ حاضر، تعداد ویژگی‌های بررسی‌شده با به‌کارگیری روش یادشده از 46 به
21 ویژگی با دقت 89/91 درصد کاهش یافت (در مدل CfsSubsetEval). مدل‌های مختلف ارزیابی‌شده در پژوهش حاضر نشان دادند با استفاده از مدل Info GainAttributeEval می‌توان با داشتن تنها 6 ویژگی به دقت یکسانی با به‌کارگیری 46 ویژگی در تشخیص و تمایز گونه‌های جنس تمشک رسید. همچنین در مقالۀ حاضر، روش‌های متداول ازجمله روش تجزیه به مؤلفه‌های اصلی (Principal Component Analysis یا PCA) با الگوریتم‌های انتخاب ویژگی مقایسه شدند.

کلیدواژه‌ها


عنوان مقاله [English]

Detection of Distinguishing Features of the Genus Rubus L. in Iran using Feature Selection Algorithms

نویسندگان [English]

  • Mohammad Javad Sheikhzadeh 1
  • Hamed Kuhestani 2
  • razeh kasalkeh 3
  • Ali Sattarian 4
1 Department of Computer, Faculty of Basic Science and Engineering, Gonbad Kavous University
2 , science faculty,gonbad university
3 Biology department, faculty of science ,Gonbad university
4 university
چکیده [English]

The genus Rubus L. (Rosaceae, Rosoideae) includes 750 species. This genus is presented from Low-Tropical to Sem-Polar regions. Eight species and five hybridization varieties were reported in the flora of Iran. Rubus is one of the most challenging genera in flowering plants. Due to polyploids, apomixis and hybridization in the genus mentioned bring challenges in Rubus identification based on morphological characters. Collecting quantitative and qualitative data in plant studies is very time-consuming and costly. Therefore, the use of different methods to reduce time and cost has always been considered. Data mining has been applied for many purposes, e.g., morphology studies, anatomy feature studies, etc. Feature selection algorithms are one of the methods in data mining, which is promoted for taxonomical feature research. In the current study, the feature selection algorithms were tested and feature characters were decreased from 46 to 21 features (in CfsSubsetEval model with the accuracy of %91.89. Many models were evaluated in this study and the results showed that it was possible to identify and distinguish Rubus genus having only six features instead of the 46 using InfoGainAttributeEval model. Also, in this article, common methods, such as Principal Component Analysis, were compared with feature selection algorithms.

کلیدواژه‌ها [English]

  • Evaluation Model
  • Morphology
  • analysis
  • Data Mining
منابع
Aalders, L. E. and Hall, I. V. (1966) A Cytotaxaonomic survey of the native blackberries of Nova Scotia. Canadian Journal of Genetics and Cytology 8: 528-532.
Ballington, J. R., Luteyn, M. M., Thompson, K., Romoleroux, K. and Castillo, R. (1993) Rubus and Vacciniaceous germplasm resources in the Andes of Ecuador. Plant Genetic Resources Newsletter 93: 9-15.
Bramer, M. (2007) Principles of data mining. Vol. 180. Springer, London.
Carletta, J. (1996) Assessing agreement on classification tasks: The kappa statistic. Computational Linguistics 22: 249-254.
Dash, M. and Liu, H. (1997) Feature selection for classification. Intelligent Data Analysis 1: 131-156.
Diaz, F. and Jones, R. (2004) Using temporal profiles of queries for precision prediction. In: Proceedings of the 27th Annual International ACM SIGIR conference on research and development in information retrieval, Sheffield, United Kingdom.
Focke, W. O. (1910) Species Ruborum monographiae generic Rubi Prodromus. Bibliotheca Botanica 17: 1-120.
Focke, W. O. (1911) Species Ruborum monographiae generic Rubi Prodromus. Bibliotheca Botanica 17: 121-223.
Focke, W. O. (1914) Species Ruborum monographiae generic Rubi Prodromus. Bibliotheca Botanica 17: 1-274.
Gu, Y., Zhao, C. M., Jin, W. and Li, W. L. (1993) Rubus resources in Fujan and Hunan provinces. Acta Horticulturae 345: 117-125.
Gustafsson, A. (1942) The origin and properties of the European blackberry flora. Hereditas28: 249-277.
Hummer, K. E. (1996) Rubus diversity. Horticulture Science 31: 182-183.
Kasalkheh, R., Jorjani, E., Sabori, H., Sattarian, A. and Habibi, M. (2015) Biosystematic study of Rubus L. (Rosaceae) in North of Iran. MSc thesis, Gonbad Kavous University, Gonbad Kavous, Iran (in persian).
Kantardzic, M. (2003) Data mining: Concepts, models, methods, and algorithms. John Wiley & Sons, Inc., New York.
Khatamsaz, M. (1992) Flora of Iran (Rosacea). Research Institute of Forests and Rangelands, Tehran (in persian).
Lu, L. T. (1983) A study on the genus Rubus of china. Actaphyto taxonomic sinica 21: 13-25.
The University of Waikato (NZ). Retrieved from http://weka.sourceforge.net/doc.dev/weka/ attributeSelection/AttributeEvaluator.html On: 11 February 2017.
Richards, A. J., Kirschner, J., Stepanek, J. and Marhold, K. (1996) Apomixis and taxonomy: an introduction. Folia Geobotanica phytotaxonomica 31: 281-282.
Robertson, K. R. (1974) The genera of Rosaceae in the southe astern United States. Journal of the Arnold Arboretum 55: 352-360.
Thompson, M. M. (1995) Chromosome number of Rubus species at the National Clonal Germplasm Repository. Hort Science 30: 1447-1452.
Weber, H. E. (1995) Rubus L. In: Illustrierte flora von mitteleuropa (Ed. Hegi, G.) 4(2A): 284-595. Blackwell Wissenschafts-Verlag, Berlin.
Weber H.E. (1995): Rubus L. In:Hegi G. (ed.),Illustrierte Flora von Mitteleuropa IV/2A, Ed. 3, Blackwell Wissenschafts-Verlag, Berlin, pp. 284–595.
Zhao, Z., Morstatter, F., Sharma, S., Alelyani, S., Anand, A. and Liu, H. (2010) Advancing feature selection research- ASU feature selection repository. Technical Report, School of Computing, Informatics, and Decision Systems Engineering. Arizona State University, Tempe.