﻿<?xml version="1.0" encoding="utf-8"?>
<ArticleSet>
  <ARTICLE>
    <Journal>
      <PublisherName>مرکز منطقه ای اطلاع رسانی علوم و فناوری</PublisherName>
      <JournalTitle>فصلنامه مهندسی برق و مهندسی کامپيوتر ايران</JournalTitle>
      <ISSN>16823745</ISSN>
      <Volume>18</Volume>
      <Issue>4</Issue>
      <PubDate PubStatus="epublish">
        <Year>2021</Year>
        <Month>9</Month>
        <Day>4</Day>
      </PubDate>
    </Journal>
    <ArticleTitle>A Feature Selection Algorithm in Online Stream Dataset Based on Multivariate Mutual Information</ArticleTitle>
    <VernacularTitle>یک الگوریتم انتخاب ویژگی برخط در جریان داده‌ها با استفاده از اطلاعات متقابل چندمتغیره</VernacularTitle>
    <FirstPage>327</FirstPage>
    <LastPage>336</LastPage>
    <ELocationID EIdType="doi" />
    <Language>fa</Language>
    <AuthorList>
      <Author>
        <FirstName>مریم</FirstName>
        <LastName>رحمانی نیا</LastName>
        <Affiliation>گروه مهندسی کامپیوتر</Affiliation>
      </Author>
      <Author>
        <FirstName>پرهام</FirstName>
        <LastName>مرادی</LastName>
        <Affiliation>گروه مهندسی کامپیوتر</Affiliation>
      </Author>
    </AuthorList>
    <History PubStatus="received">
      <Year>2020</Year>
      <Month>1</Month>
      <Day>17</Day>
    </History>
    <Abstract>Today, in many real-world applications, such as social networks, we are faced with data streams which new data is appeared every moment. Since the efficiency of most data mining algorithms decreases with increasing data dimensions, analysis of the data has become one of the most important issues recently. Online stream feature selection is an effective approach which aims at removing those of redundant features and keeping relevant ones, leads to reduce the size of the data and improve the accuracy of the online data mining methods. There are several critical issues for online stream feature selection methods including: unavailability of the entire feature set before starting the algorithm, scalability, stability, classification accuracy, and size of selected feature set. So far, existing methods have only been able to address a few numbers of these issues simultaneously. To this end, in this paper, we present an online feature selection method called MMIOSFS that provides a better tradeoff between these challenges using Mutual Information. In the proposed method, first the feature set is mapped to a new feature using joint Random variables technique, then the mutual information of new feature with the class label is computed as the degree of relationship between the features set. The efficiency of the proposed method was compared to several online feature selection algorithms based on different categories. The results show that the proposed method usually achieves better tradeoff between the mentioned challenges.</Abstract>
    <OtherAbstract Language="FA">امروزه در بسیاری از مسایل دنیای واقعی همچون شبکه‌های اجتماعی، با جریان داده مواجه هستیم که در هر لحظه داده جدیدی به مجموعه داده‌های موجود اضافه می‌شود. از آنجا که کارایی بیشتر الگوریتم‌های داده‌کاوی با افزایش ابعاد داده‌ها کاهش می‌یابد، تحلیل این جریان داده‌ها در سال‌های اخیر به یکی از مسایل مهم در داده‌کاوی تبدیل شده است. روش‌های انتخاب ویژگی در جریان داده‌های برخط، روش‌های کارآمدی هستند که با حذف ویژگی‌های افزونه و نامربوط باعث کاهش ابعاد کلان داده‌ها و در نتیجه بهبود کارایی الگوریتم‌ها می‌شوند. از چالش‌های اساسی در رابطه با الگوریتم‌های انتخاب ویژگی برخط، در دسترس نبودن همه داده‌ها قبل از شروع الگوریتم، مقیاس‌پذیری، دقت ویژگی‌های انتخاب‌شده و اندازه زیرمجموعه انتخابی را می‌توان نام برد. تا کنون الگوریتم‌های انتخاب ویژگی موجود تنها توانسته‌اند بخش محدودی از این چالش‌ها را به صورت هم‌زمان مرتفع کنند. به همین منظور در این مقاله یک راهکار انتخاب ویژگی برخط به نام MMIOSFS با استفاده از اطلاعات متقابل ارائه داده‌ایم که حد واسط بهتری را میان چالش‌های ذکرشده به دست می‌آورد. در روش پیشنهادی در ابتدا مجموعه ویژگی‌ها با استفاده از تکنیک متغیرهای تصادفی توأم به یک ویژگی نگاشت و سپس اطلاعات متقابل ویژگی جدید با برچسب به عنوان میزان ارتباط مجموعه ویژگی‌های اولیه در نظر گرفته می‌شود. کارایی روش پیشنهادی با چند الگوریتم انتخاب ویژگی برخط با استفاده از دسته‌بندهای مختلف مورد ارزیابی قرار گرفته و نتایج به دست آمده نشان می‌دهد الگوریتم پیشنهادی معمولاً حد واسط بهتری میان چالش‌ها به دست می‌آورد.</OtherAbstract>
    <ObjectList>
      <Object Type="Keyword">
        <Param Name="Value">انتخاب ویژگیداده‌های آموزشی برخطاطلاعات متقابلمتغیر تصادفی مشترک</Param>
      </Object>
    </ObjectList>
    <ArchiveCopySource DocType="Pdf">http://ijece.org/en/Article/Download/28768</ArchiveCopySource>
  </ARTICLE>
</ArticleSet>