• شماره های پیشین

    • فهرست مقالات classification

      • دسترسی آزاد مقاله

        1 - کاهش فضاي جستجو در بازشناسي اثر انگشت به کمک تصوير بلوک جهتي
        صادق هل‌فروش حسن قاسمیان یزدی
        نخستين مرحله در هر فرايند شناسايي خودکار اثر انگشت، دسته‌بندي است. فرايند دسته‌بندي، با کوچک‌کردن فضاي جستجو، زمان و هزينه را کاهش مي‌دهد. روشهاي معمول دسته‌بندي، مبتني بر کلاس‌هاي قابل رؤيت اثر انگشت است. نظر به تعداد کم اين کلاس‌ها و عدم توزيع يکنواخت تصاوير اثر انگشت چکیده کامل
        نخستين مرحله در هر فرايند شناسايي خودکار اثر انگشت، دسته‌بندي است. فرايند دسته‌بندي، با کوچک‌کردن فضاي جستجو، زمان و هزينه را کاهش مي‌دهد. روشهاي معمول دسته‌بندي، مبتني بر کلاس‌هاي قابل رؤيت اثر انگشت است. نظر به تعداد کم اين کلاس‌ها و عدم توزيع يکنواخت تصاوير اثر انگشت در اين کلاس‌ها، دسته‌بندي پيوسته اثر انگشت مورد توجه قرار گرفته است. در دسته‌بندي پيوسته، يک تابع شباهت تعريف مي‌شود و براي شباهت تصاوير موجود در پايگاه داده و اثر انگشت ورودي، با توجه به تابع تعريف‌شده، درجه‌اي اختصاص مي‌يابد. مرحله تطابق اثر انگشت ورودي با تصاوير موجود در پايگاه داده، از تصويري از پايگاه داده آغاز مي‌شود که بيشترين شباهت را با ورودي داشته باشد. در اين مقاله يک روش براي اندازه‌گيري شباهت و دسته‌بندي پيوسته اثر انگشت مبتني بر تصوير بلوک جهتي، ارائه شده است. روش ارائه‌شده نسبت به انتقال و چرخش اثر انگشت مقاوم بوده و نيازي به وجود و آشکارسازي نقطه مرجع ندارد. پياده‌سازي روش مذکور بر روي پايگاه داده 2000FVC، دقت قابل ملاحظه روش را در کاهش فضاي جستجو در مقايسه با ساير روشها نشان مي‌دهد. پرونده مقاله
      • دسترسی آزاد مقاله

        2 - ارائه روشی برای خواندن خودکار نقشه چاپی فرش و مقایسه آن با روش خوشه‌یابی C - میانگین
        احمد ايزدي‌پور احسان‌اله کبیر
        خواندن خودکار نقشه چاپی فرش به دو مرحله تقسیم می‌شود: آشکارسازی خطوط نقشه، شامل خطوط باريک و خطوط ضخيم؛ کاهش رنگ پيکسل‌های تصوير به رنگ‌های پالت. برای شناسایی خطوط نقشه الگوریتمی پیشنهاد شده است. در این الگوریتم ابتدا فاصله خطوط باریک محاسبه می‌شود. پس از شناسایی اولین چکیده کامل
        خواندن خودکار نقشه چاپی فرش به دو مرحله تقسیم می‌شود: آشکارسازی خطوط نقشه، شامل خطوط باريک و خطوط ضخيم؛ کاهش رنگ پيکسل‌های تصوير به رنگ‌های پالت. برای شناسایی خطوط نقشه الگوریتمی پیشنهاد شده است. در این الگوریتم ابتدا فاصله خطوط باریک محاسبه می‌شود. پس از شناسایی اولین خط باریک، خطوط باریک بعدی به‌ترتیب رسم می‌شوند. برای شناسایی اولین خط ضخیم از الگوریتم شانه‌گذاری استفاده شده است. مشکل عمده در شناسایی خطوط، خطای نمونه‌برداری ناشی از اسکنر است. این خطا غیر قابل اجتناب است. برای اصلاح این خطا در مراحل مختلف شناسایی و ترسیم خطوط راه حل‌هایی پیشنهاد شده است. پس از شناسایی خطوط، کاهش رنگ انجام می‌شود. هدف اين است که رنگ پيکسل‌های درون چهارخانه‌های نقشه - که از تلاقی خطوط باريک حاصل می‌شوند - به رنگ‌هاي پالت، نگاشت شوند. سه روش برای کاهش رنگ ارائه شده است. در روش اول کاربر برای هر رنگ نقشه، دو پيکسل انتخاب می‌کند. پالت رنگ، با پردازش مناسب بر روی رنگ‌های انتخابی کاربر به‌دست می‌آيد. برای تعيين رنگ يک چهارخانه، رنگ پيکسل‌های ميانی آن بر اساس اين پالت نگاشت می‌شود و فراوان‌ترين رنگ به‌دست می‌آيد. سپس چهارخانه مربوطه با اين رنگ پر می‌شود. اين الگوريتم کاهش رنگ به همراه يک مرحله پس‌پردازش روی چند تصوير نمونه اعمال شد. ميزان خطا برای تصاوير پایگاه داده از 07/0 درصد تا 5/0 درصد بود. به‌منظور بررسی امکان کاهش دخالت کاربر از روش C - میانگین به دو صورت استفاده شده است. مراکز خوشه‌های اولیه یک بار با دخالت کاربر و بار دیگر به‌طور تصادفی تعیین می‌شوند. نتایج این سه روش مورد مقایسه و بحث قرار می‌گیرد. پرونده مقاله
      • دسترسی آزاد مقاله

        3 - آموزش شبکه عصبی MLP در طبقه‌بندی داده‌ها با استفاده از روش GSA
        مریم ده‌باشیان سیدحمید ظهیری
        تاکنون شیوه‌های مختلفی برای طبقه‌بندی داده ارائه شده است اما در این میان شبکه‌های عصبی مخاطبان بیشتری را به خود جذب کرده‌اند. مهم‌ترین مسئله در این نوع از طبقه‌بندی‌کننده‌ها انتخاب روشی مناسب برای آموزش شبکه‌های عصبی است. متداول‌ترین روش آموزشی شبکه‌های عصبی روش پس‌انتش چکیده کامل
        تاکنون شیوه‌های مختلفی برای طبقه‌بندی داده ارائه شده است اما در این میان شبکه‌های عصبی مخاطبان بیشتری را به خود جذب کرده‌اند. مهم‌ترین مسئله در این نوع از طبقه‌بندی‌کننده‌ها انتخاب روشی مناسب برای آموزش شبکه‌های عصبی است. متداول‌ترین روش آموزشی شبکه‌های عصبی روش پس‌انتشار خطا است که همگرايي کُند و توقف در نقاط بهينه محلي از مهم‌ترین نقاط ضعف آن محسوب می‌شود. رویکرد جدید محققین استفاده از الگوریتم‌های ابتکاری در فرایند آموزش شبکه‌های عصبی است. در این مقاله پیشنهاد استفاده از روش آموزشی نوینی به نام الگوریتم جستجوي گرانشي (GSA) در آموزش شبکه‌های عصبی به‌منظور طبقه‌بندی داده‌ها ارائه می‌شود. روش GSA آخرين و جديدترين نسخه از انواع روش‌هاي بهينه‌سازي هوش جمعي است که با الهام از مفاهيم جرم و نيروي جاذبه و با شبيه‌سازي قوانين مرتبط با آن ارائه شده است. در این مقاله با استفاده از روش GSA یک شبکه عصبی MLP جهت طبقه‌بندی پنج مجموعه داده مرجع آموزش داده می‌شود. همچنین کارایی روش پیشنهادی در آموزش و آزمایش شبکه عصبی با دو روش آموزشی پس‌انتشار خطا و بهینه‌سازی گروه ذرات مقایسه می‌شود. نتایج نهایی نشان می‌دهند در اکثر موارد روش GSA قابلیت چشمگیری در طبقه‌بندی صحیح داده‌ها دارد. به‌علاوه در آزمایشات انجام‌گرفته ویژگی منحصر به‌فردی از روش GSA پدیدار شد و آن پایداری نسبتاً عالی در طبقه‌بندی صحیح داده‌ها در تمام موارد بود. از نقطه نظر معیار زمانی نیز روش GSA نسبت به روش PSO در زمان کمتری به پاسخ مناسب دست می‌یابد. پرونده مقاله
      • دسترسی آزاد مقاله

        4 - طبقه‌بند تک‌کلاسه گرانش‌گرای مبتنی بر ماشین بردار پشتیبان
        سیدحسین غفاریان هادی صدوقی یزدی یونس الله‌یاری
        در این مقاله یک طبقه‌بند تک‌کلاسه مبتنی بر مرز با الهام از طبقه‌بند توصیف‌گر داده مبتنی بر بردار پشتیبان (SVDD) ارائه شده است. در طبقه‌بند SVDD حتی زمانی که نمونه‌های پرت به بیرون از مرز رانده می‌شوند، باز هم این نمونه‌ها بر مرز طبقه‌بند اثر می‌گذارند و این مسئله باعث ا چکیده کامل
        در این مقاله یک طبقه‌بند تک‌کلاسه مبتنی بر مرز با الهام از طبقه‌بند توصیف‌گر داده مبتنی بر بردار پشتیبان (SVDD) ارائه شده است. در طبقه‌بند SVDD حتی زمانی که نمونه‌های پرت به بیرون از مرز رانده می‌شوند، باز هم این نمونه‌ها بر مرز طبقه‌بند اثر می‌گذارند و این مسئله باعث افزایش خطای طبقه‌بند می‌شود. در طبقه‌بند پیشنهادی به گرانش نمونه‌های آموزش اهمیت داده می‌شود و همچنین همه نمونه‌ها در تعیین مرز طبقه‌بند دخالت دارند. بر این مبنا دو طبقه‌بند که در یکی دانش در مورد نمونه‌های پرت نیز در نظر گرفته می‌شود، پیشنهاد شده است. مسئله بهینه‌سازی مطرح در طبقه‌بند پیشنهادی علاوه بر این که تحدب را حفظ می کند، در حوزه کرنل نیز به سهولت قابل استفاده است. پس از معرفی طبقه‌بند پیشنهادی و حل مسئله بهینه‌سازی آن، چگونگی تغییرات مرز طبقه‌بند پیشنهادی در مقابل تغییرات پارامترهای مدل بررسی می‌شود. نتایج آزمایش‌ها در مقایسه با دو طبقه‌بند SVDD و Density Induced SVDD نشان می‌دهد که روش پیشنهادی در کاهش اثر نمونه‌های پرت موفق بوده است. پرونده مقاله
      • دسترسی آزاد مقاله

        5 - ارائه یک شکل جدید از الگوهای باینری محلی به منظور طبقه‌بندی بافت تصویر
        مرضیه پاکدل فرشاد فرشاد تاجری‌پور
        طبقه‌بندی بافت‌ تصویر نقش بسیار مهمی در بینایی ماشین و پردازش تصویر دارد. اولین و مهم‌ترین مرحله در طبقه‌بندی بافت تصویر، استخراج ویژگی از تصویر می‌باشد. تاکنون روش‌های بسیار زیادی برای استخراج ویژگی از تصاویر بافتی ارائه شده‌اند اما از میان روش‌های موجود الگوهای باینری چکیده کامل
        طبقه‌بندی بافت‌ تصویر نقش بسیار مهمی در بینایی ماشین و پردازش تصویر دارد. اولین و مهم‌ترین مرحله در طبقه‌بندی بافت تصویر، استخراج ویژگی از تصویر می‌باشد. تاکنون روش‌های بسیار زیادی برای استخراج ویژگی از تصاویر بافتی ارائه شده‌اند اما از میان روش‌های موجود الگوهای باینری محلی، در شکل اصلی و بهبودیافته خود، به دلیل سادگی در پیاده‌سازی و استخراج ویژگی‌های مناسب با دقت طبقه‌بندی بالا، مورد توجه بسیاری از متخصصان این زمینه قرار گرفته است. شکل اصلی الگوهای باینری محلی هرچند از نظر پیاده‌سازی بسیار ساده است، اما زمانی که شعاع همسایگی افزایش یابد پیچیدگی محاسباتی بالایی دارد. شکل بهبودیافته الگوهای باینری محلی نیز به الگوهای همگن برچسب‌های متمایز و به تمام الگوهای غیر همگن یک برچسب یکسان انتساب می‌دهد و این امر، طبقه‌بندی تصاویری که دارای درصد بالایی از الگوهای غیر همگن می‌باشند را با مشکل مواجه می‌سازد. در این مقاله، یک شکل جدید از الگوهای باینری محلی ارائه شده است که پیچیدگی محاسباتی آن نسبت به شکل اصلی الگوهای باینری محلی کمتر و دقت طبقه‌بندی آن نیز از شکل اصلی و بهبودیافته الگوهای باینری محلی بیشتر می‌باشد. روش ارائه‌شده در این مقاله نه تنها تصاویر با الگوهای همگن را به خوبی طبقه‌بندی می‌کند، بلکه در مورد تصاویری که دارای حجم بسیار بالایی از الگوهای غیر همگن می‌باشند نیز به خوبی عمل می‌کند. همچنین می‌توان با تغییر در بازه‌های شدت روشنایی، محلی یا سراسری‌بودن ویژگی‌ها را کنترل کرد. دقت طبقه‌بندی برای تمام تصاویر بافتی موجود در پایگاه داده Brodatz و Outex، کارایی روش ارائه‌شده را نشان می‌دهد. پرونده مقاله
      • دسترسی آزاد مقاله

        6 - روشی مطمئن برای مقابله با مشکلات طبقه‌بندی اثر انگشت
        فائزه ميرزايي حسين  ابراهيم‌پور کومله محسن بيگلري
        اثر انگشت بیومتریکی است که به دلیل ویژگی‌های منحصر به فردش، بیشترین کاربرد را در سیستم‌های تشخیص و تعیین هویت داشته است. در سیستم‌های تعیین هویت، تصویر ورودی با تمام تصاویر ثبت‌شده در پایگاه مقایسه می‌گردد و در صورتی که پایگاه داده حجیم باشد، عمل مقایسه بسیار زمان‌بر خو چکیده کامل
        اثر انگشت بیومتریکی است که به دلیل ویژگی‌های منحصر به فردش، بیشترین کاربرد را در سیستم‌های تشخیص و تعیین هویت داشته است. در سیستم‌های تعیین هویت، تصویر ورودی با تمام تصاویر ثبت‌شده در پایگاه مقایسه می‌گردد و در صورتی که پایگاه داده حجیم باشد، عمل مقایسه بسیار زمان‌بر خواهد بود. برای نمونه می‌توان به پایگاه‌های داده موجود در FBI اشاره نمود. یکی از راه حل‌های تأییدشده برای افزایش سرعت، طبقه‌بندی تصاویر است. در طبقه‌بندی مطلق، به هر اثر انگشت تنها یک کلاس تخصیص می‌یابد. دلایل مختلفی چون نویز یا عدم وجود همه نقاط یکتا در محدوده تصویر، تعیین یک کلاس مطلق برای همه تصاویر را دچار مشکل می‌کند. در این مقاله، روشی جدید بر پایه طبقه‌بندی احتمالی ارائه شده که برای هر تصویر ورودی، مجموعه‌ای از کلاس‌ها مشخص می‌شود که هر یک دارای یک احتمال می‌باشند. در مرحله انطباق، کلاس‌ها به ترتیب اولویتشان جستجو می‌شوند. آزمایشات صورت‌گرفته بر روی پایگاه داده شناخته‌شده 2002 FVC، تأثیر استفاده از طبقه‌بندی احتمالی را به روشنی نشان داده است. با در نظر گرفتن کلاس‌های دوم و سوم تعیین‌شده توسط روش پیشنهادی، دقت شناسایی سیستم تقریباً 18% افزایش یافته است، در صورتی که سرعت آن، 2 تا 3 برابر بیشتر از طبقه‌بندی مطلق می‌باشد. پرونده مقاله
      • دسترسی آزاد مقاله

        7 - تفکیک‌پذیری مجموعه نقاط دورنگ با مثلث قائم‌الزاویه
        زهرا مصلحی علیرضا باقری
        تفکیک‌پذیری نقاط رنگی با اشکال هندسی یکی از مسایل مطرح در هندسه محاسباتی است که کاربردهایی از جمله در یادگیری ماشین و شناسایی الگو دارد. در این مسأله دو سری نقطه P و Q به ترتیب به رنگ‌های قرمز و آبی و به اندازه n در صفحه داده شده است. حال لازم است یک شکل هندسی مشخص را ب چکیده کامل
        تفکیک‌پذیری نقاط رنگی با اشکال هندسی یکی از مسایل مطرح در هندسه محاسباتی است که کاربردهایی از جمله در یادگیری ماشین و شناسایی الگو دارد. در این مسأله دو سری نقطه P و Q به ترتیب به رنگ‌های قرمز و آبی و به اندازه n در صفحه داده شده است. حال لازم است یک شکل هندسی مشخص را به گونه‌ای در صفحه قرار دهیم که کلیه نقاط آبی را در برگرفته و شامل هیچ نقطه قرمزی نباشد. در کارهای پیشین الگوریتم‌هایی برای تفکیک‌پذیری نقاط با گوه و مستطیل ارائه گردیده ولی تا به حال الگوریتمی برای تفکیک‌پذیری نقاط با یک مثلث و همچنین مثلثی که یک زاویه آن مشخص باشد (مثلاً قائم‌الزاویه) ارائه نشده است. در این مقاله الگوریتمی جدید و کارا برای تفکیک‌پذیری نقاط رنگی با مثلث قائم‌الزاویه ارائه می‌کنیم که قادر خواهد بود با استفاده از راهکار خط جاورب چرخشی، معرفی رخدادها و پردازش آنها در زمان کارای O(nlogn) کلیه مثلث‌های قائم‌الزاویه تفکیک‌کننده را گزارش کند. پرونده مقاله
      • دسترسی آزاد مقاله

        8 - ارائه روشی جدید از نگاشت توسعه‌یافته الگوی دودویی محلی جهت طبقه‌بندی تصاویر بافتی
        محمدحسین شکور فرشاد فرشاد تاجری‌پور
        طبقه‌بندی بافت از جمله شاخه‌های مهم پردازش تصویر است و مهم‌ترین نکته در طبقه‌بندی بافت‌ها، استخراج ویژگی‌های تصویر بافتی است. یکی از مهم‌ترین و ساده‌ترین روش‌ها، روش مبتنی بر الگوی دودویی محلی است که به دلیل سادگی در پیاده‌سازی و استخراج ویژگی‌های مناسب با دقت طبقه‌بندی چکیده کامل
        طبقه‌بندی بافت از جمله شاخه‌های مهم پردازش تصویر است و مهم‌ترین نکته در طبقه‌بندی بافت‌ها، استخراج ویژگی‌های تصویر بافتی است. یکی از مهم‌ترین و ساده‌ترین روش‌ها، روش مبتنی بر الگوی دودویی محلی است که به دلیل سادگی در پیاده‌سازی و استخراج ویژگی‌های مناسب با دقت طبقه‌بندی بالا، مورد توجه قرار گرفته است. در اغلب روش‌های الگوی دودویی محلی بیشتر به الگوهای محلی همگن توجه شده و همه اطلاعات قسمت‌های ناهمگن تصویر صرفاً به عنوان یک ویژگی استخراج می‌شود. در این مقاله، یک شکل جدید از نگاشت الگوهای دودویی محلی ارائه شده که از اطلاعات الگوهای ناهمگن به شکل مناسب استفاده می‌کند. یعنی بر خلاف اغلب روش‌های قبلی، در اینجا از الگوهای محلی ناهمگن ویژگی‌های بیشتری استخراج می‌شود و در نتیجه دقت طبقه‌بندی بالاتر می‌رود. ضمن این که کلیه نکات مثبت روش‌های موجود مانند غیر حساس بودن به چرخش و تغییرات روشنایی را دارد. روش ارائه‌شده با استخراج ویژگی‌های بیشتر از الگوهای ناهمگن به دقت بالاتری از طبقه‌بندی نسبت به روش‌های مشهور و مهم دست یافته است. پیاده‌سازی روش ارائه‌شده روی پایگاه بافتی Outex این بهبود را نشان می‌دهد. پرونده مقاله
      • دسترسی آزاد مقاله

        9 - ارائه یک الگوریتم آبشاری برای بهبود سرعت و دقت یک سیستم شناسایی نوع و مدل خودرو
        محسن بيگلري
        در دهه اخیر، مطالعات بسیاری بر روی طبقه‌بندی دانه‌ریز اشیا صورت گرفته است. در این نوع طبقه‌بندی گروه کلی شیء مشخص بوده و هدف تعیین زیرگروه دقیق آن است و شناسایی نوع و مدل وسیله نقلیه (VMMR) نیز در این حوزه قرار می‌گیرد. این مسئله به دلیل وجود تعداد کلاس‌های زیاد، تفاوت چکیده کامل
        در دهه اخیر، مطالعات بسیاری بر روی طبقه‌بندی دانه‌ریز اشیا صورت گرفته است. در این نوع طبقه‌بندی گروه کلی شیء مشخص بوده و هدف تعیین زیرگروه دقیق آن است و شناسایی نوع و مدل وسیله نقلیه (VMMR) نیز در این حوزه قرار می‌گیرد. این مسئله به دلیل وجود تعداد کلاس‌های زیاد، تفاوت درون کلاسی بسیار و تفاوت بین کلاسی کم از مسایل طبقه‌بندی دشوار به شمار می‌رود. علاوه بر این معمولاً سرعت سیستم‌های شناسایی اشیا با افزایش دقت، کاهش می‌یابد و چنان که می‌بینیم یکی از چالش‌های مهم در شبکه‌های عصبی عمیق به عنوان یک ابزار قدرتمند بینایی ماشین، سرعت پردازش است. در این مقاله ابتدا روشی مبتنی بر بخش برای شناسایی نوع و مدل خودرو مختصراً معرفی می‌گردد و سپس یک الگوریتم آبشاری برای بهبود توأمان سرعت و دقت این سیستم ارائه می‌شود. الگوریتم آبشاری پیشنهادی، طبقه‌بندهای موجود در سیستم را به صورت ترتیبی به تصویر ورودی اعمال کرده تا از حجم پردازش بکاهد. چند معیار مناسب برای رسیدن به یک ترتیب کارا از طبقه‌بندها معرفی شده و در نهایت ترکیبی از آنها در الگوریتم پیشنهادی به کار گرفته شده است. نتیجه آزمایشات انجام‌شده بر روی مجموعه داده کاملاً متفاوت BVMMR و CompCars، نشان از دقت بالای سیستم شناسایی نوع و مدل خودرو دارد. پس از اعمال الگوریتم آبشاری به سیستم مورد بحث، سرعت پردازش تا 80% افزایش یافته است در حالی که دقت سیستم تنها کاهش جزئی داشته است. پرونده مقاله
      • دسترسی آزاد مقاله

        10 - ارائه یک الگوریتم آبشاری برای بهبود سرعت و دقت یک سیستم شناسایی نوع و مدل خودرو
        محسن بيگلري سیدعلی سلیمانی حمید حسن‌پور
        در دهه اخیر، مطالعات بسیاری بر روی طبقه‌بندی دانه‌ریز اشیا صورت گرفته است. در این نوع طبقه‌بندی گروه کلی شیء مشخص بوده و هدف تعیین زیرگروه دقیق آن است و شناسایی نوع و مدل وسیله نقلیه (VMMR) نیز در این حوزه قرار می‌گیرد. این مسئله به دلیل وجود تعداد کلاس‌های زیاد، تفاوت چکیده کامل
        در دهه اخیر، مطالعات بسیاری بر روی طبقه‌بندی دانه‌ریز اشیا صورت گرفته است. در این نوع طبقه‌بندی گروه کلی شیء مشخص بوده و هدف تعیین زیرگروه دقیق آن است و شناسایی نوع و مدل وسیله نقلیه (VMMR) نیز در این حوزه قرار می‌گیرد. این مسئله به دلیل وجود تعداد کلاس‌های زیاد، تفاوت درون کلاسی بسیار و تفاوت بین کلاسی کم از مسایل طبقه‌بندی دشوار به شمار می‌رود. علاوه بر این معمولاً سرعت سیستم‌های شناسایی اشیا با افزایش دقت، کاهش می‌یابد و چنان که می‌بینیم یکی از چالش‌های مهم در شبکه‌های عصبی عمیق به عنوان یک ابزار قدرتمند بینایی ماشین، سرعت پردازش است. در این مقاله ابتدا روشی مبتنی بر بخش برای شناسایی نوع و مدل خودرو مختصراً معرفی می‌گردد و سپس یک الگوریتم آبشاری برای بهبود توأمان سرعت و دقت این سیستم ارائه می‌شود. الگوریتم آبشاری پیشنهادی، طبقه‌بندهای موجود در سیستم را به صورت ترتیبی به تصویر ورودی اعمال کرده تا از حجم پردازش بکاهد. چند معیار مناسب برای رسیدن به یک ترتیب کارا از طبقه‌بندها معرفی شده و در نهایت ترکیبی از آنها در الگوریتم پیشنهادی به کار گرفته شده است. نتیجه آزمایشات انجام‌شده بر روی مجموعه داده کاملاً متفاوت BVMMR و CompCars، نشان از دقت بالای سیستم شناسایی نوع و مدل خودرو دارد. پس از اعمال الگوریتم آبشاری به سیستم مورد بحث، سرعت پردازش تا 80% افزایش یافته است در حالی که دقت سیستم تنها کاهش جزئی داشته است. پرونده مقاله
      • دسترسی آزاد مقاله

        11 - الگوريتم وفقي دسته‌بندي ترافيک پخش زنده IPTV در شبکه EPON
        محسن احمدزاده محمد بهدادفر محمدرضا نوری فرد
        در اين مقاله‌، الگوريتمي با قابليت تنظيم وفقي براي دسته‌بندي بسته‌‌هاي IPTV با هدف کاهش نرخ از دست دادن بسته در شبکه غير فعال نوري در بستر اترنت ارائه شده است. این الگوریتم به وسیله دسته‌بندی مناسب بسته‌های ورودی به OLT، عملکرد تخصیص پهنای باند با روش WRR را بهبود می‌بخ چکیده کامل
        در اين مقاله‌، الگوريتمي با قابليت تنظيم وفقي براي دسته‌بندي بسته‌‌هاي IPTV با هدف کاهش نرخ از دست دادن بسته در شبکه غير فعال نوري در بستر اترنت ارائه شده است. این الگوریتم به وسیله دسته‌بندی مناسب بسته‌های ورودی به OLT، عملکرد تخصیص پهنای باند با روش WRR را بهبود می‌بخشد. بر اساس نتايج شبيه‌سازي‌هاي صورت‌گرفته توسط شبيه‌ساز NS، نرخ از دست دادن بسته در روش پيشنهادي نسبت به روش‌هاي پيشين در بهترین حالت 65% کاهش يافته است. پرونده مقاله
      • دسترسی آزاد مقاله

        12 - کاهش ابعاد ویژگی مبتنی بر تئوری راف با استفاده از الگوریتم رقابت لیگ فوتبال
        مجید عبدالرزاق نژاد علی ادیبیان
        افزایش حجم پایگاه داده‌ها، مسئله کاهش ویژگی را ایجاد و پراهمیت می‌سازد. از این رو در علم داده‌کاوی، یکی از زیربخش‌های مهم، مسئله کاهش ابعاد (انتخاب ویژگی) می‌باشد که در آن زیرمجموعه‌ای از ویژگی‌هایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب می‌شوند چکیده کامل
        افزایش حجم پایگاه داده‌ها، مسئله کاهش ویژگی را ایجاد و پراهمیت می‌سازد. از این رو در علم داده‌کاوی، یکی از زیربخش‌های مهم، مسئله کاهش ابعاد (انتخاب ویژگی) می‌باشد که در آن زیرمجموعه‌ای از ویژگی‌هایی که بیشترین تأثیر را بر روی الگوهای پنهان داده اصلی دارند انتخاب می‌شوند. در سال‌های اخیر، تئوری مجموعه راف به عنوان یکی از ابزارهای موثر و کارآمد در کاهش ویژگی مورد توجه محققان قرار گرفته است. در این مقاله الگوریتم رقابت لیگ فوتبال برای اولین بار به منظور حل این مسئله مورد استفاده قرار گرفته شده است. توانایی فرار از بهین‌های موضعی، امکان بهره‌گیری از اطلاعات بازیکنان توزیع‌شده در فضای جستجو، همگرایی سریع به جواب‌های بهین و پارامترهای کم این الگوریتم، انگیزه این انتخاب بود. علاوه بر این نوآوری، ارائه تغییراتی همچون بهره‌گیری از مجموع توان بازیکنان ثابت و ذخیره در محاسبه توان هر تیم، در نظر گرفتن ترکیب ساختارهای پیوسته و گسسته برای هر بازیکن، ارائه یک مکانیزم ابتکاری گسسته‌سازی جدید، ارائه تحلیل هیدرولیک متناسب با مسئله تحقیق برای فرایند برازش هر بازیکن، ارائه اصلاح در عملگرهای تقلید و تهییج بر اساس چالش‌های نسخه اصلی را می‌توان به عنوان ایده‌های پیشنهادی به منظور اصلاح و سازگاری این الگوریتم برای مسئله کاهش ویژگی برشمرد. ایده‌های پیشنهادشده بر روی سه سطح داده در ابعاد کوچک، متوسط و بزرگ به همراه چهار الگوریتم فراابتکاری مشهور ژنتیک و بهینه‌سازی ازدحام ذارت، سیستم ایمنی مصنوعی و لیگ قهرمانان پیاده‌سازی گردیده و مقایسه نتایج به دست آمده نشان از مزیت‌های رقابتی قابل توجه الگوریتم رقابت لیگ فوتبال با سایر الگوریتم‌ها دارد. پرونده مقاله
      • دسترسی آزاد مقاله

        13 - طبقه‌بندی بااحتیاط داده‌های ابرمستطیلی، ابردایروی و ابربیضوی با حداکثر حاشیه متقارن نسبت به لبه داده‌ها
        یحیی فرقانی میثاق سادات حجازی هادی صدوقی یزدی
        مدل طبقه‌بندی مقاوم، یک مدل غیر استاندارد برای یادگیری طبقه‌بند بر اساس یک مجموعه داده توأم با عدم قطعیت است. به هر مدل طبقه‌بندی که در مجموعه جواب‌های ممکن آن، جواب بی‌معنی وجود داشته باشد، مدل بی‌احتیاط گفته می‌شود. جواب بهینه یک مدل طبقه‌بندی مقاوم بی‌احتیاط به ‌ازای چکیده کامل
        مدل طبقه‌بندی مقاوم، یک مدل غیر استاندارد برای یادگیری طبقه‌بند بر اساس یک مجموعه داده توأم با عدم قطعیت است. به هر مدل طبقه‌بندی که در مجموعه جواب‌های ممکن آن، جواب بی‌معنی وجود داشته باشد، مدل بی‌احتیاط گفته می‌شود. جواب بهینه یک مدل طبقه‌بندی مقاوم بی‌احتیاط به ‌ازای یک مجموعه داده آموزشی، ممکن است ابرصفحه نباشد که در این صورت امکان طبقه‌بندی داده‌ها در مرحله آزمون میسر نخواهد بود. در این مقاله مدل‌های طبقه‌بند مقاوم بی‌احتیاط معرفی و مشکلات آنها بررسی شده و سپس با تغییر تابع ضرر در طبقه‌بند مقاوم، مدل طبقه‌بندی مقاوم بااحتیاط برای ممانعت از بی‌احتیاطی معرفی می‌شود. مدل بااحتیاط پیشنهادی، استاندارد شده و راهکارهایی برای کاهش زمان آموزش و زمان آزمون آن ارائه می‌گردد. در آزمایشات از مدل طبقه‌بند مقاوم بااحتیاط پیشنهادی در مقایسه با چند مدل مقاوم بی‌احتیاط، برای طبقه‌بندی مجموعه داده‌های آموزشی ناقص و مجموعه داده‌های آموزشی قطعی کامل استفاده شد. نتایج به دست آمده نشان داد که در مجموعه داده‌های ناقص، مدل پیشنهادی زمان آموزش و زمان آزمون و نرخ خطای کمتری نسبت به مدل‌های بی‌احتیاط داشت. همچنین در مجموعه داده‌های کامل قطعی، مدل پیشنهادی زمان آموزش و زمان آزمون کمتری نسبت به مدل‌های بی‌احتیاط داشت. نتایج به دست آمده کارایی افزودن احتیاط به طبقه‌بند مقاوم را تأیید نمود. پرونده مقاله
      • دسترسی آزاد مقاله

        14 - یک روش ترافیک‌آگاه برای دسته‌بندی بسته‌ها با هدف کاهش تعداد دفعات دسترسی به حافظه
        سعید اسدروز محمد نصیری مهدی عباسی حاتم عبدلی
        دسته‌بندی بسته‌ها نقش بسزایی در بهبود عملکرد تجهیزات شبکه‌ای از جمله مسیریاب‌ها، دیواره‌های آتش و سیستم‌های تشخیص نفوذ ایفا می‌کند. الگوریتم‌های دسته‌بندی بسته عموماً مبتنی بر ساختار داده‌ای ایستا هستند که الگوی رفتاری ترافیک ورودی را در بهینه‌سازی ساختار جستجو در نظر ن چکیده کامل
        دسته‌بندی بسته‌ها نقش بسزایی در بهبود عملکرد تجهیزات شبکه‌ای از جمله مسیریاب‌ها، دیواره‌های آتش و سیستم‌های تشخیص نفوذ ایفا می‌کند. الگوریتم‌های دسته‌بندی بسته عموماً مبتنی بر ساختار داده‌ای ایستا هستند که الگوی رفتاری ترافیک ورودی را در بهینه‌سازی ساختار جستجو در نظر نمی‌گیرند. در این پژوهش، ویژگی‌های آماری ترافیک ورودی در نظر گرفته شده و از ساختمان داده‌های کمکی ترافیک‌آگاه در کنار ساختارهای اصلی استفاده شده است. از آنجا که حجم غالب ترافیک اینترنت، مربوط به جریان‌های بلندمدت است، برای مدت‌زمانی نه چندان کوتاه، اکثر مطابقت‌های قوانین در زیردرخت‌های مشخصی از درخت جستجو قرار دارند. برای بهره‌گیری از این ویژگی، در این پژوهش از ساختار داده درخت AVL برای نگهداری قوانین دسته‌بند و از حدهای بالا و پایین مجموعه قوانین به عنوان گره‌های درخت جستجو استفاده شده است. ارزیابی‌ها نشان می‌دهد که با افزایش چولگی بسته‌های آزمون، تعداد دفعات دسترسی به حافظه الگوریتم دسته‌بندی ترافیک‌آگاه نسبت به الگوریتم دسته‌بندی پایه کاهش قابل توجهی دارد. بر اساس ارزیابی‌ها، دسته‌بندی بسته ترافیک‌آگاه با استفاده از قوانین پرتکرار می‌تواند میانگین کل تعداد دفعات دسترسی به حافظه و در نتیجه زمان جستجو را بیش از 40 درصد کاهش دهد. پرونده مقاله
      • دسترسی آزاد مقاله

        15 - اصلاح معماری شبکه عصبی کانولوشنال جهت طبقه‌بندی تصاویر آغشته به نویز ضربه
        محمد مومنی مهدی آقاصرام علی محمد لطیف راضیه شیخ پور
        نویز ضربه موجب اختلال در فرایند طبقه‌بندی تصاویر توسط شبکه عصبی کانولوشنال می‌گردد. پیش‌پردازش جهت حذف نویز ضربه هزینه‌بر است و تصاویر تخریب‌شده به دلیل عدم بهبود کافی، اثر مخرب در مراحل آموزش و اعتبارسنجی این شبکه دارند. در این مقاله با اصلاح معماری شبکه عصبی کانولوشنا چکیده کامل
        نویز ضربه موجب اختلال در فرایند طبقه‌بندی تصاویر توسط شبکه عصبی کانولوشنال می‌گردد. پیش‌پردازش جهت حذف نویز ضربه هزینه‌بر است و تصاویر تخریب‌شده به دلیل عدم بهبود کافی، اثر مخرب در مراحل آموزش و اعتبارسنجی این شبکه دارند. در این مقاله با اصلاح معماری شبکه عصبی کانولوشنال، یک مدل مقاوم در برابر نویز ضربه معرفی می‌شود. روش پیشنهادی، طبقه‌بندی تصاویر نویزی را بدون نیاز به هیچ گونه پیش‌پردازش انجام می‌دهد. لایه تشخیص نویز ضربه در بدنه شبکه عصبی کانولوشنال تعبیه می‌شود و از پردازش مقادیر نویزی جلوگیری می‌کند. برای آموزش مدل پیشنهادی از پایگاه داده 2012- ILSVRC استفاده شده است. نتایج شبیه‌سازی نشان می‌دهد که جلوگیری از تأثیرگذاری نویز ضربه در فرایند آموزش و طبقه‌بندی شبکه عصبی کانولوشنال، دقت و سرعت آموزش شبکه را افزایش می‌دهد. روش پیشنهادی با خطای 24/0 در طبقه‌بندی تصاویر آغشته به نویز ضربه با چگالی 10% بهتر از سایر روش‌های مورد مقایسه می‌باشد. مرتبه زمانی (1)O در اصلاح CNN جهت مقاومت در برابر نویز نشان‌دهنده برتری روش پیشنهادی است. پرونده مقاله
      • دسترسی آزاد مقاله

        16 - ارائه یک الگوریتم مناسب برای یادگیری جریانی بر اساس الگوریتم ماشین‌های بردار پشتیبان دوقلوی مربعات حداقلی فازی
        جواد سلیمی سرتختی سلمان گلی
        الگوریتم ماشین بردار پشتیبان یکی از الگوریتم‌های مشهور و با کارایی بالا در یادگیری ماشین و کاربردهای مختلف است. از این الگوریتم تا کنون نسخه‌های متعددی ارائه شده که آخرین نسخه آن ماشین‌های بردار پشتیبان دوقلوی مربعات حداقلی فازی می‌باشد. اغلب کاربردها در دنیای امروز دار چکیده کامل
        الگوریتم ماشین بردار پشتیبان یکی از الگوریتم‌های مشهور و با کارایی بالا در یادگیری ماشین و کاربردهای مختلف است. از این الگوریتم تا کنون نسخه‌های متعددی ارائه شده که آخرین نسخه آن ماشین‌های بردار پشتیبان دوقلوی مربعات حداقلی فازی می‌باشد. اغلب کاربردها در دنیای امروز دارای حجم انبوهی از اطلاعات هستند. از سویی دیگر یکی از جنبه‌های مهم داده‌های حجیم، جریانی‌بودن آنها می‌باشد که باعث شده است بسیاری از الگوریتم‌های سنتی، کارایی لازم را در مواجهه با آن نداشته باشند. در این مقاله برای نخستین بار نسخه افزایشی الگوریتم ماشین‌های بردار پشتیبان دوقلوی مربعات حداقلی فازی، در دو حالت برخط و شبه برخط ارائه شده است. برای بررسی صحت و دقت الگوریتم ارائه‌شده دو کاربرد آن مورد ارزیابی قرار گرفته است. در یک کاربرد، این الگوریتم بر روی 6 دیتاست مخزن UCI اجرا شده که در مقایسه با سایر الگوریتم‌ها از کارایی بالاتری برخوردار است. حتی این کارایی در مقایسه با نسخه‌های غیر افزایشی نیز کاملاً قابل تشخیص است که در آزمایش‌ها به آن پرداخته شده است. در کاربرد دوم، این الگوریتم در مبحث اینترنت اشیا و به طور خاص در داده‌های مربوط به فعالیت روزانه به کار گرفته شده است. طبق نتایج آزمایشگاهی، الگوریتم ارائه‌شده بهترین کارایی را در مقایسه با سایر الگوریتم‌های افزایشی دارد. پرونده مقاله
      • دسترسی آزاد مقاله

        17 - راهکاری مبتنی بر ساخت درخت دودویی تقریبی برای سرعت‌بخشیدن به جستجوی نزدیک‌ترین همسایگی در داده‌های حجیم
        حسین کلاته نگین دانشپور
        با توجه به سرعت روزافزون تولید اطلاعات و نیاز تبدیل اطلاعات به دانش، روش‌های یادگیری ماشین قدیمی دیگر پاسخگو نیستند. هنگام استفاده از طبقه‌بندی‌ها با روش‌های یادگیری ماشین قدیمی، به ویژه استفاده از طبقه‌بندی‌های ذاتاً تنبل مانند روش k- نزدیک‌ترین همسایگی (KNN)، عملیات ط چکیده کامل
        با توجه به سرعت روزافزون تولید اطلاعات و نیاز تبدیل اطلاعات به دانش، روش‌های یادگیری ماشین قدیمی دیگر پاسخگو نیستند. هنگام استفاده از طبقه‌بندی‌ها با روش‌های یادگیری ماشین قدیمی، به ویژه استفاده از طبقه‌بندی‌های ذاتاً تنبل مانند روش k- نزدیک‌ترین همسایگی (KNN)، عملیات طبقه‌بندی داده‌های حجیم بسیار کند است. نزدیک‌ترین همسایگی به دلیل سادگی و دقت عملی که ارائه می‌دهد یک روش محبوب در زمینه طبقه‌بندی داده‌ها می‌باشد. روش پیشنهادی مبتنی بر مرتب‌سازی بردارهای ویژگی داده‌های آموزشی در یک درخت جستجوی دودویی است تا طبقه‌بندی داده‌های بزرگ را با استفاده از روش نزدیک‌ترین همسایگی تسریع بخشد. این کار با استفاده از یافتن تقریبی دو دورترین داده محلی در هر گره درخت انجام می‌شود. این دو داده به عنوان معیار برای تقسیم داده‌های موجود در گره فعلی بین دو گروه، مورد استفاده قرار می‌گیرند. مجموعه داده‌های موجود در هر گره بر اساس شباهت آنها به این دو داده، به فرزند چپ یا راست گره فعلی تخصیص داده می‌شوند. نتایج آزمایش‌های متعدد انجام‌شده بر روی مجموعه داده‌های مختلف از مخزن UCI، میزان دقت خوب با توجه به زمان اجرای کم روش پیشنهادی را نشان می‌دهد. پرونده مقاله
      • دسترسی آزاد مقاله

        18 - تشخیص دستگاه‌ قطعه ‏های موسیقی سنتی ایرانی بر‌ مبنای استخراج توالی نت‌ها و استفاده از شبکه‌های LSTM
        سینا غضنفری پور مرتضی  خادمی عباس ابراهیمی مقدم
        دسته‌بندی دستگاه قطعات موسیقی سنتی ایرانی توسط کامپیوتر برای علاقه‌مندان موسیقی دستگاهی ایرانی، موضوعی بسیار جالب ولی پیچیده و چالش‌برانگیز است. این مسئله اولاً به دلیل کاربردهای فراوان آن در زمینه‌هایی مانند آهنگ‌سازی و آموزش موسیقی و ثانیاً به خاطر نیاز افراد عادی به چکیده کامل
        دسته‌بندی دستگاه قطعات موسیقی سنتی ایرانی توسط کامپیوتر برای علاقه‌مندان موسیقی دستگاهی ایرانی، موضوعی بسیار جالب ولی پیچیده و چالش‌برانگیز است. این مسئله اولاً به دلیل کاربردهای فراوان آن در زمینه‌هایی مانند آهنگ‌سازی و آموزش موسیقی و ثانیاً به خاطر نیاز افراد عادی به کامپیوتر برای تشخیص دستگاه از اهمیت بالایی برخوردار است. در این مقاله روشی برای تشخیص دستگاه و زیردستگاه یک قطعه موسیقی ایرانی بر پایه استخراج نت‌های متوالی، دسته‌بندی سلسله‌مراتبی و استفاده از شبکه‌های LSTM ارائه شده است. در این روش، قطعه موسیقی در مرحله اول به یکی از سه دسته کلی، دسته‌بندی می‌شود. دسته اول صرفاً شامل دستگاه ماهور، دسته دوم شامل دستگاه‏های شور و نوا و دسته سوم شامل دستگاه‌های همایون، سه‌گاه و چهارگاه است. سپس برای هر دسته بسته به نوع آن، تعداد متفاوت دسته‌بندهای دیگر اعمال می‌شود تا این که یکی از 6 دستگاه و یکی از 11 زیردستگاه‌ موسیقی سنتی ایرانی مشخص گردد. این تحقیق به هیچ سبک نوازندگی و ساز خاصی محدود نشده و تحت تأثیر سرعت و تکنیک‌های نوازندگی قرار نمی‌گیرد. قطعات برچسب‌گذاری شده در پایگاه‌ داده "اَرگ" که برای این تحقیق به وجود آمده است، به صورت تکنوازی هستند؛ اگرچه تعداد اندکی از آنها‌ از هم‌نوایی سازهای کوبه‌ای (مانند تنبک) نیز در کنار سازهای ملودی بهره‏مند می‌باشند. نتایج نشان می‌دهند که تشخیص 6 دستگاه اصلی و 11 زیردستگاه به ترتیب با دقت میانگین 5/74% و 35/66% انجام گرفته که نسبت به تحقیقات کم‌شمار مشابه، نتایج بهتری دارد. پرونده مقاله
      • دسترسی آزاد مقاله

        19 - طبقه‌بندی خودآموز نیمه‌نظارتی مبتنی بر ساخت همسایگی
        منا عمادی جعفر  تنها محمد ابراهیم شیری مهدی حسین زاده اقدم
        به‌کارگیری داده‌های بدون برچسب در خودآموزی نیمه‌نظارتی می‌تواند به طور قابل توجهی دقت طبقه‌بند نظارت‌شده را بهبود بخشد، اما در برخی موارد ممکن است دقت طبقه‌بندی را به مقدار چشم‌گیری کاهش دهد. یکی از دلایل چنین تنزلی، برچسب‌گذاری اشتباه به داده‌های بدون برچسب می‌باشد. در چکیده کامل
        به‌کارگیری داده‌های بدون برچسب در خودآموزی نیمه‌نظارتی می‌تواند به طور قابل توجهی دقت طبقه‌بند نظارت‌شده را بهبود بخشد، اما در برخی موارد ممکن است دقت طبقه‌بندی را به مقدار چشم‌گیری کاهش دهد. یکی از دلایل چنین تنزلی، برچسب‌گذاری اشتباه به داده‌های بدون برچسب می‌باشد. در این مقاله، روشی را برای برچسب‌گذاری با قابلیت اطمینان بالا به داده‌های بدون برچسب پیشنهاد می‌کنیم. طبقه‌بند پایه در الگوریتم پیشنهادی، ماشین بردار پشتیبان است. در این روش، برچسب‌گذاری فقط به مجموعه‌ای از داده‌های بدون برچسب که از مقدار مشخصی به مرز تصمیم نزدیک‌تر هستند انجام می‌شود. به این داده‌ها، داده‌های دارای اطلاعات می‌گویند. اضافه‌شدن داده‌های دارای اطلاعات به مجموعه آموزشی در صورتی که برچسب آنها به درستی پیش‌بینی شود در دستیابی به مرز تصمیم بهینه تأثیر به‌سزایی دارد. برای کشف ساختار برچسب‌زنی در فضای داده از الگوریتم اپسیلون- همسایگی (DBSCAN) استفاده شده است. آزمایش‌های مقایسه‌ای روی مجموعه داده‌های UCI نشان می‌دهند که روش پیشنهادی برای دستیابی به دقت بیشتر طبقه‌بند نیمه‌نظارتی خودآموز به نسبت برخی از کار‌های قبلی عملکرد بهتری دارد. پرونده مقاله
      • دسترسی آزاد مقاله

        20 - انتخاب ویژگی چندبرچسبه با استفاده از راهکار ترکیبی مبتنی بر الگوریتم بهینه‌سازی ازدحام ذرات
        آذر رفیعی پرهام مرادی عبدالباقی قادرزاده
        طبقه‌بندی چندبرچسبی یکی از مسائل مهم در یادگیری ماشین است که کارایی الگوریتم‌های این طبقه‌بندی با افزایش ابعاد مسأله به شدت کاهش می‌یابد. انتخاب ویژگی، یکی از راهکارهای اصلی برای کاهش ابعاد در مسائل چندبرچسبی است. انتخاب ویژگی چندبرچسبی یک راهکار NP Hard است و تا کنون چکیده کامل
        طبقه‌بندی چندبرچسبی یکی از مسائل مهم در یادگیری ماشین است که کارایی الگوریتم‌های این طبقه‌بندی با افزایش ابعاد مسأله به شدت کاهش می‌یابد. انتخاب ویژگی، یکی از راهکارهای اصلی برای کاهش ابعاد در مسائل چندبرچسبی است. انتخاب ویژگی چندبرچسبی یک راهکار NP Hard است و تا کنون تعدادی راهکار مبتنی بر هوش جمعی و الگوریتم‌های تکاملی برای آن ارائه شده است. افزایش ابعاد مسأله منجر به افزایش فضای جستجو و به تبع، کاهش کارایی و همچنین کاهش سرعت همگرایی این الگوریتم‌ها می‌شود. در این مقاله یک راهکار هوش جمعی ترکیبی مبتنی الگوریتم دودویی بهینه‌سازی ازدحام ذرات و استراتژی جستجوی محلی برای انتخاب ویژگی چندبرچسبی ارائه شده است. برای افزایش سرعت همگرایی، در استراتژی جستجوی محلی، ویژگی‌ها بر اساس میزان افزونه‌بودن و میزان ارتباط با خروجی مسأله به دو دسته تقسیم‌بندی می‌شوند. دسته اول را ویژگی‌هایی تشکیل می‌دهند که شباهت زیادی به کلاس مسأله و شباهت کمتری به سایر ویژگی‌ها دارند و دسته دوم هم ویژگی‌های افزونه و کمتر مرتبط است. بر این اساس، یک اپراتور محلی به الگوریتم بهینه‌سازی ازدحام ذرات اضافه شده که منجر به کاهش ویژگی‌های غیر مرتبط و افزونه هر جواب می‌شود. اعمال این اپراتور منجر به افزایش سرعت همگرایی الگوریتم پیشنهادی در مقایسه با سایر الگوریتم‌های ارائه‌شده در این زمینه می‌شود. عملکرد روش پیشنهادی با شناخته‌شده‌ترین روش‌های انتخاب ویژگی، بر روی مجموعه داده‌های مختلف مقایسه گردیده است. نتایج آزمایش‌ها نشان دادند که روش پیشنهادی از نظر دقت، دارای عملکردی مناسب است. پرونده مقاله
      • دسترسی آزاد مقاله

        21 - ترکیب تکنیک‌های انتخاب نمونه و داده‌افزایي برای حل مسئله طبقه‌بندی مجموعه داده‌های نامتوازن
        پرستو محقق سميرا نوفرستی مهری رجائی
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌ب چکیده کامل
        در عصر کلان‌داده‌ها، تکنیک‌های تجزیه و تحلیل خودکار مانند داده‌کاوی به‌طور گسترده‌ای برای تصمیم‌گیری به‌کار گرفته شده و بسیار مؤثر واقع شده‌اند. از جمله تکنیک‌های داده‌کاوی می‌توان به طبقه‌بندی اشاره کرد که یک روش رایج برای تصمیم‌گیری و پیش‌بینی است. الگوریتم‌های طبقه‌بندی به‌طور معمول بر روی مجموعه داده‌های متوازن به‌خوبی عمل می‌کنند. با وجود این، یکی از مشکلاتی که الگوریتم‌های طبقه‌بندی با آن مواجه هستند، پیش‌بینی صحیح برچسب نمونه‌های جدید بر اساس یادگیری بر روی مجموعه داده‌های نامتوازن است. در این نوع از مجموعه داده‌ها، توزیع ناهمگونی که داده‌ها در کلاس‌های مختلف دارند باعث نادیده گرفته‌شدن نمونه‌های کلاس با تعداد نمونه کمتر در یادگیری طبقه‌بند می‌شوند؛ در حالی که این کلاس در برخی مسائل پیش‌بینی دارای اهمیت بیشتری است. به‌منظور مقابله با مشکل مذکور در این مقاله، روشی کارا برای متعادل‌سازی مجموعه داده‌های نامتوازن ارائه می‌شود که با متعادل‌نمودن تعداد نمونه‌های کلاس‌های مختلف در مجموعه داده‌ای نامتوازن، پیش‌بینی صحیح برچسب کلاس نمونه‌های جدید توسط الگوریتم یادگیری ماشین را بهبود می‌بخشد. بر اساس ارزیابی‌های صورت‌گرفته، روش پیشنهادی بر اساس دو معیار رایج در ارزیابی طبقه‌بندی مجموعه داده‌های نامتوازن به نام‌های «صحت متعادل» و «ویژگی»، عملکرد بهتری در مقایسه با روش‌های دیگر دارد. پرونده مقاله