﻿<?xml version="1.0" encoding="utf-8"?>
<ArticleSet>
  <ARTICLE>
    <Journal>
      <PublisherName>مرکز منطقه ای اطلاع رسانی علوم و فناوری</PublisherName>
      <JournalTitle>فصلنامه مهندسی برق و مهندسی کامپيوتر ايران</JournalTitle>
      <ISSN>16823745</ISSN>
      <Volume>23</Volume>
      <Issue>3</Issue>
      <PubDate PubStatus="epublish">
        <Year>2026</Year>
        <Month>1</Month>
        <Day>6</Day>
      </PubDate>
    </Journal>
    <ArticleTitle>Breast Cancer Detection Using a Dataset Balancing Approach</ArticleTitle>
    <VernacularTitle>تشخیص سرطان سینه با رویکرد متوازن‌سازی مجموعه داده‌ها</VernacularTitle>
    <FirstPage>179</FirstPage>
    <LastPage>190</LastPage>
    <ELocationID EIdType="doi" />
    <Language>fa</Language>
    <AuthorList>
      <Author>
        <FirstName> زینب</FirstName>
        <LastName> عباسی</LastName>
        <Affiliation>مرکز آموزش عالی محلات</Affiliation>
      </Author>
    </AuthorList>
    <History PubStatus="received">
      <Year>2025</Year>
      <Month>3</Month>
      <Day>16</Day>
    </History>
    <Abstract>&lt;p&gt;Imbalanced datasets are one of the major challenges in the automatic diagnosis of diseases. The imbalance in data classes leads to failures in diagnosis, which can be particularly dangerous for diseases such as breast cancer. In this study, a modified version of the ReliefF algorithm, which is a feature selection algorithm, is proposed. The modifications have been made to select and balance instances effectively. The proposed algorithm balances the number of instances in breast cancer datasets to improve diagnosis. In this algorithm, instances are weighted and ranked. After ranking them, the dataset is balanced using the proposed oversampling method based on the instance weights. This algorithm has been applied to two breast cancer datasets: Wisconsin Breast Cancer Dataset (WBCD) and Wisconsin Diagnostic Breast Cancer Dataset (WDBCD). The balanced dataset was then classified using various classification algorithms. The classification results show that performance evaluation metrics have improved compared to the classification of the original data. The best results obtained in&amp;nbsp; WBCD dataset are Accuracy = 98.04%, G-Mean = 98.00% and in WDBCD dataset are Accuracy = 98.31%, G-Mean = 98.35%. The obtained results indicate the effectiveness of the proposed algorithm in breast cancer diagnosis.&lt;/p&gt;</Abstract>
    <OtherAbstract Language="FA">&lt;p&gt;یکی از چالش&amp;zwnj;های بزرگ در تشخیص خودکار بیماری&amp;zwnj;ها، وجود مجموعه داده&amp;zwnj;های نامتوازن است. عدم توازن در کلاس&amp;zwnj;های داده، باعث شکست در تشخیص صحیح بیماری توسط سیستم&amp;zwnj;های تشخیصی می&amp;zwnj;شود. این پژوهش الگوریتم جدیدی برای انتخاب و متوازن سازی نمونه&amp;zwnj;ها پیشنهاد داده که بر پایه الگوریتم ReliefF، یک الگوریتم انتخاب ویژگی، است. در الگوریتم پیشنهادی، ابتدا نمونه&amp;zwnj;ها بر اساس شاخص مشابهت با نمونه&amp;zwnj;های همکلاسی و کلاس مخالف، وزن&amp;zwnj;دهی می&amp;zwnj;شوند. پس از رتبه&amp;zwnj;بندی نمونه&amp;zwnj;ها بر اساس وزن&amp;zwnj; آن&amp;zwnj;ها، مجموعه داده&amp;zwnj; با استفاده از روش نمونه&amp;zwnj;برداری فزاینده&amp;shy;متوازن می&amp;zwnj;شود. الگوریتم ارائه شده توانایی کار با مجموعه داده&amp;zwnj;های چند کلاسه و انواع داده&amp;shy;های رشته&amp;zwnj;ای و عددی و وجود مقادیر مفقود را دارد. علاوه بر این، به دلیل امکان انجام محاسبات به طور موازی برای هر نمونه، سربار محاسباتی کمتری نسبت به سایر الگوریتم&amp;zwnj;های متوازن&amp;zwnj;سازی &amp;nbsp;دارد. این الگوریتم &amp;zwnj;می&amp;zwnj;تواند داده&amp;zwnj;ها را به طور کامل متوازن کرده و نمونه&amp;zwnj;های با اهمیت را تکثیر کند. الگوریتم پیشنهادی روی سه مجموعه سرطان سینه ویسکانسین (WBCD)، مجموعه تشخیصی سرطان سینه ویسکانسین (WDBCD) و مجموعه سرطان سینه SEER اجرا شده است و سپس مجموعه&amp;zwnj;های متوازن شده با الگوریتم&amp;shy;های مختلف طبقه&amp;zwnj;بندی شدند. نتایج طبقه&amp;zwnj;بندی نشان&amp;shy;دهنده کارایی روش پیشنهادی و افزایش صحت تشخیص بیماری هستند.&lt;/p&gt;</OtherAbstract>
    <ObjectList>
      <Object Type="Keyword">
        <Param Name="Value">داده‌های نامتوازن، نمونه‌برداری فزاینده، oversampling، تشخیص خودکار بیماری.</Param>
      </Object>
    </ObjectList>
    <ArchiveCopySource DocType="Pdf">http://ijece.org/fa/Article/Download/49704</ArchiveCopySource>
  </ARTICLE>
</ArticleSet>