استفاده از خوشهبندی BIRCH و الگوریتم بهینهسازی واکنش شیمیایی جهت کشف تقلب در حوزه سلامت
محورهای موضوعی : مهندسی برق و کامپیوتر
مجید عبدالرزاق نژاد
1
*
,
مهدی خرد
2
1 - دانشگاه بزرگمهر قائنات
2 - دانشگاه قم
کلید واژه: الگوریتم بهینهسازی واکنش شیمیاییحوزه سلامتخوشهبندی BIRCHکشف تقلب,
چکیده مقاله :
حوزه سلامت به علت وسعت عملکرد مالی و همچنین وسعت کاربرد آن، یکی از سیستمهای ایدهآل برای تقلب است و با وجود راهکارهای مختلف در این زمینه، شناسایی دادههای تقلب هنوز یکی از چالشها برای ارائهدهندگان خدمات سلامت میباشد. در این مقاله برای اولین بار الگوریتم BIRCH به عنوان یک الگوریتم خوشهبندی سلسلهمراتبی با الگوریتم بهینهسازی واکنش شیمیایی (CRO) ترکیب شده است. الگوریتم BIRCH با پیچیدگی زمانی خطی قابلیت کار با حجم بالای دادهها و شناسایی دادههای پرت را دارد و CRO یکی از الگوریتمهای فراابتکاری جدید الهامگرفته از واکنش شیمیایی در دنیای واقعی است که با یک جمعیت پویا از مولکولها توسط چهار عملگر برخورد به دیواره، تجزیه، برخورد بین مولکولی و ترکیب فضای جستجو را مورد کاوش قرار میدهند. الگوریتم خوشهبندی بهبودیافته BIRCH-CRO با حذف فرایند خوشهبندی سراسری داخلی نسخه کلاسیک BIRCH و تعیین بهینه پارامترهای اصلی آن باعث بهبود سرعت و دقت تشخیص دادههای تقلب در حوزه سلامت نسبت به سایر الگوریتمهای بدون نظارت ارائهشده در این حوزه گردیده است. همچنین الگوریتم پیشنهادی توانایی کار با دادههای آنلاین و حجم بالا را دارد و با توجه به نتایج به دست آمده، عملکرد مناسبی را فراهم میکند.
With regard to the scale of the financial transactions and the extent of the healthcare industry, it is one of the ideal systems for fraud. Therefore, suitable identifying fraud data is still one of the challenges facing the healthcare providers, although there are several fraud detection algorithms. In the paper, the BIRCH clustering algorithm, as one hierarchical clustering algorithm, is hybridized with a chemical reaction optimization algorithm (CRO). The BIRCH with linear time complexity is able for clustering large scale data and identifying their noises and the CRO, as one of new meta-heuristic algorithm inspired by the chemical reactions in the real world, explores the search space with a dynamic population size based on four reactions such as on-wall ineffective collision, decomposition, inter-molecular ineffective collision and synthesis. Due to the improved BIRCH-CRO removes the internal clustering process of the classic BIRCH and determines the optimal values of its main parameters, it causes that the computational time decreases and accuracy and precision of detecting fraud data increase since its experimental results is compared with the exist unsupervised algorithms. Also, the proposed fraud detection algorithm has the ability to perform on online data and large scale data, and given the obtained results, it provides a proper performance.