﻿<?xml version="1.0" encoding="utf-8"?>
<ArticleSet>
  <ARTICLE>
    <Journal>
      <PublisherName>مرکز منطقه ای اطلاع رسانی علوم و فناوری</PublisherName>
      <JournalTitle>فصلنامه مهندسی برق و مهندسی کامپيوتر ايران</JournalTitle>
      <ISSN>16823745</ISSN>
      <Volume>10</Volume>
      <Issue>2</Issue>
      <PubDate PubStatus="epublish">
        <Year>2012</Year>
        <Month>6</Month>
        <Day>21</Day>
      </PubDate>
    </Journal>
    <ArticleTitle>Extracting Bottlenecks Using Object Recognition in Reinforcement Learning</ArticleTitle>
    <VernacularTitle>استخراج گذرگاه‌ها با استفاده از تشخیص اشیا در یادگیری تقویتی</VernacularTitle>
    <FirstPage>55</FirstPage>
    <LastPage>62</LastPage>
    <ELocationID EIdType="doi" />
    <Language>fa</Language>
    <AuthorList>
      <Author>
        <FirstName>بهزاد</FirstName>
        <LastName>غضنفری</LastName>
        <Affiliation></Affiliation>
      </Author>
      <Author>
        <FirstName>ناصر</FirstName>
        <LastName>مزینی</LastName>
        <Affiliation></Affiliation>
      </Author>
      <Author>
        <FirstName>محمدرضا</FirstName>
        <LastName>جاهد مطلق</LastName>
        <Affiliation></Affiliation>
      </Author>
    </AuthorList>
    <History PubStatus="received">
      <Year>2015</Year>
      <Month>11</Month>
      <Day>29</Day>
    </History>
    <Abstract>Extracting bottlenecks improves considerably the speed of learning and the ability knowledge transferring in reinforcement learning. But, extracting bottlenecks is a challenge in reinforcement learning and it typically requires prior knowledge and designer’s help. This paper will propose a new method that extracts bottlenecks for reinforcement learning agent automatically. We have inspired of biological systems, behavioral analysts and routing animals and the agent works on the basis of its interacting to environment. The agent finds landmarks based in clustering and hierarchical object recognition. If these landmarks in actions space are close to each other, bottlenecks are extracted using the states between them. The Experimental results show a considerable improvement in the process of learning in comparison to some key methods in the literature.</Abstract>
    <OtherAbstract Language="FA">اين مقاله روش جديدي را مطرح مي‌کند که قادر به استخراج گذرگاه‌ها به‌صورت اتوماتيک براي عامل يادگيري تقويتي است. روش پيشنهادي از سيستم‌هاي بيولوژيکي، رفتار و مسيريابي حيوانات الهام گرفته شده است و به‌واسطه تعاملات عامل با محيط پيراموني‌اش عمل مي‌کند. عامل با استفاده از خوشه‌بندي و تشخيص اشيا به‌صورت سلسله مراتبي، نشانه‌هايي را پيدا مي‌کند. اگر اين نشانه‌ها در فضاي اقدام به هم نزديک باشند، گذرگاه‌ها با استفاده از حالت‌هاي بين آنها استخراج مي‌شوند. نتايج آزمايش‌ها بهبود قابل ملاحظه‌اي را در فرايند يادگيري تقويتي در مقايسه با ساير روش‌هاي مشابه نشان مي‌دهد.</OtherAbstract>
    <ObjectList>
      <Object Type="Keyword">
        <Param Name="Value">يادگيري تقويتي
خوشه‌بندي اشيا
يادگيري تقويتي سلسله مراتبي
اقدامات گسترش‌يافته زماني</Param>
      </Object>
    </ObjectList>
    <ArchiveCopySource DocType="Pdf">http://ijece.org/fa/Article/Download/28033</ArchiveCopySource>
  </ARTICLE>
</ArticleSet>