تحلیل داده های بیماران دیابتی در راستای خوشه بندی و تجویز دارو براساس الگوریتم پیشنهادی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 دانشجوی دکتری ، گروه مدیریت فناوری اطلاعات، واحد علوم و تحقیقات دانشگاه آزاد اسلامی، تهران، ایران

2 گروه مدیریت فناوری اطلاعات ، واحد علوم و تحقیقات دانشگاه آزاد اسلامی ، تهران ، ایران

3 گروه مدیریت فناوری اطلاعات ، واحد علوم وتحقیقات دانشگاه آزاد اسلامی ، تهران ،ایران

4 دانشیار ، گروه مدیریت صنعتی، واحد تهران مرکزی دانشگاه آزاد اسلامی، تهران، ایران

5 گروه مدیریت، دانشگاه تربیت مدرس، تهران، ایران

چکیده

مقدمه: دیابت یک اختلال سوخت و سازی در بدن است که توانایی تولید هورمون انسولین در بدن از بین می‌رود . هدف کلی از انجام پژوهش حاضر کشف دانش نهفته در داده­­های بیماران دیابتی است، که می­تواند به پزشکان در خوشه­بندی بیماران جدید و تجویز داروی مناسب مطابق هر خوشه کمک نماید.
روش کار: در این مقاله از الگوریتم MR-VDBSCAN استفاده شده است. پیاده­سازی این الگوریتم در بستر هدوپ مبتنی بر چارچوب نگاشت-کاهش می­باشد. ایده اصلی تحقیق استفاده از چگالی محلی برای یافتن چگالی هر نقطه است. این استراتژی می‎تواند مانع از اتصال خوشه‎ها ‎با چگالی­های متفاوت شود.
نتایج: الگوریتم موردنظر بر روی دیتا ست انتخاب شده، تست و ارزیابی و نتایج نشان از دقت بالا و کارایی و مقیاس­پذیری آن دارد. نتایج بدست آمده با نتایج اجرای خوشه­بندی k-Means مقایسه شد، الگوریتم MR-VDBSCAN در مقایسه با آن از سرعت اجرای بالاتر و دقت تشخیص بهتری برخوردار هست و همچنین توانایی تشخیص خوشه­ها با چگالی متفاوت برتری این الگوریتم نسبت به الگوریتم­ مورد مقایسه است. نتایج نشان می­دهد که الگوریتم MR-VDBSCAN می‎تواند عملکرد بهتر را از سایر الگوریتم­ها  فراهم کند.
نتیجه ­گیری: نتایج نشان می­دهد که که الگوریتم MR-VDBSCAN نسبت به الگوریتم K-means  خوشه-بندی بهتری را انجام می­دهد و می­تواند بیماران را در زیرگروه‎هایی قرار دهد که پزشکان را در تجویز یاری نماید. نتیجه پیش­بینی شده برای تشخیص اینکه کدوم گروه سنی و جنسیت بیشتر تحت تاثیر دیابت قرار دارند، استفاده می­شود.

کلیدواژه‌ها


عنوان مقاله [English]

Analysis of Diabetic Patients' Data for Clustering and Prescription Drug Based on Proposed Algorithm

نویسندگان [English]

  • Safanaz Heydari 1
  • Reza Radfar 2
  • Mahmood Alborzi 3
  • Mohammad Ali Afshar Kazemi 4
  • Ali Rajabzadeh Ghatari 5
1 PhD student, Department of Information Technology Management, Islamic Azad University Science and Research Branch, Tehran, Iran
2 Department of Information Technology Management, Science and Research Branch, Islamic Azad University, Tehran, Iran
3 Department of Information Technology Managemen tScience and Research Branch, Islamic Azad University,Tehran,Iran
4 Associate Professor, Department of Industrial Management, Central Tehran Branch, Islamic Azad University, Tehran, Iran
5 Department of management, Tarbiat Modares University, Tehran, Iran
چکیده [English]

Introduction Diabetes is a metabolic disorder in the body that is impaired by the ability to produce insulin hormone. The main purpose of the present study is to discover the hidden knowledge in the data of diabetic patients, which can assist clinicians in clustering new patients and prescribing appropriate medication according to each cluster.
Methods: In this paper, we use MR-VDBSCAN algorithm. The implementation of this algorithm is based on the map-reduce framework of Hadoop. The main idea of the research is to use local density to find the density of each point. This strategy can prevent clusters from joining at different densities.
Results: The algorithm is based on the selected dataset, tested and evaluated, and the results show high accuracy and efficiency. The results were compared with the results of k-Means clustering, The MR-VDBSCAN algorithm has a higher execution speed than that of the algorithm and has the ability to detect clusters with different density of superiority of this algorithm than the comparable algorithm. The results show that the MR-VDBSCAN algorithm can provide better performance than other algorithms. In particular, the similarity of the proposed algorithm is 97% for the diabetes set.
Conclusion: The results show that the MR-VDBSCAN algorithm performs better clustering than the K-means algorithm and can place patients into subgroups that assist physicians in prescribing.

کلیدواژه‌ها [English]

  • Data mining
  • clustering
  • Hadoop
  • Map-Reduce
  • Big data
  • diabetic