﻿<?xml version="1.0" encoding="utf-8"?>
<ArticleSet>
  <ARTICLE>
    <Journal>
      <PublisherName>مرکز منطقه ای اطلاع رسانی علوم و فناوری</PublisherName>
      <JournalTitle>فصلنامه مهندسی برق و مهندسی کامپيوتر ايران</JournalTitle>
      <ISSN>16823745</ISSN>
      <Volume>9</Volume>
      <Issue>2</Issue>
      <PubDate PubStatus="epublish">
        <Year>2011</Year>
        <Month>6</Month>
        <Day>21</Day>
      </PubDate>
    </Journal>
    <ArticleTitle>Improving Formant and Concatenative Speech Synthesis Techniques through Using Vocoders</ArticleTitle>
    <VernacularTitle>بهبود تولیدکننده‌های گفتار سازه‌ای و پیوندی با الهام از عملکرد فشرده‌ساز‌های گفتار</VernacularTitle>
    <FirstPage>77</FirstPage>
    <LastPage>84</LastPage>
    <ELocationID EIdType="doi" />
    <Language>fa</Language>
    <AuthorList>
      <Author>
        <FirstName>نوشین</FirstName>
        <LastName>مقصودی</LastName>
        <Affiliation></Affiliation>
      </Author>
      <Author>
        <FirstName>محمدمهدی</FirstName>
        <LastName>همایون‌پور</LastName>
        <Affiliation></Affiliation>
      </Author>
    </AuthorList>
    <History PubStatus="received">
      <Year>2015</Year>
      <Month>11</Month>
      <Day>28</Day>
    </History>
    <Abstract>In this paper an approach to improve the quality of synthetic speech in formant and concatenative synthesis techniques is described. To deal with this problem we focused on using vocoders. In concatenative speech synthesis the idea is based on post processing the generated speech to reduce discontinuities. The post processing is consists of integrating Straight method to synthesis system in order to smooth the boundary between units. On the other hand, in formant synthesis we used multi excitation linear predictive method to replace simple excitation signal in Klatt method with multiband excitation. Our synthesis techniques were evaluated with respect to naturalness, fluidity and intelligibility based on subjective methods. These experiments clarified that the naturalness of synthetic speech can be improved by using our smoothing methods and multiband excitation signal.</Abstract>
    <OtherAbstract Language="FA">این مقاله به پیاده‌سازی و بهبود بخش تولید گفتار از یک سیستم تبدیل متن به گفتار می‌پردازد. با این هدف، روش تولید پیوندی مبتنی بر روش جمع هم‌پوشان با پریود صحیح و تحریک چندباندی و روش تولید سازه‌ای برای زبان فارسی پیاده‌سازی شده و به‌منظور بهبود در کیفیت خروجی از قدرت فشرده‌سازهای گفتاری استفاده شده است. به‌عبارت دیگر در ایده مطرح‌شده در این مقاله برای رفع مشکلات تولیدکننده‌های گفتار از فشرده‌سازهای موجود استفاده شده است. به این ترتیب که از فشرده‌ساز  STRAIGHT برای هموارسازی طیفی در تولیدکننده پیوندی و از فشرده‌ساز پیشگویی خطی با تحریک ترکیبی در تولید گفتار به روش سازه‌ای بهره گرفته شده است. نتایج ارزیابی‌ها نشان داده که استفاده از این فشرده‌سازها به کاهش ناپیوستگی‌ها در تولیدکننده پیوندی و افزایش معیارهای قابلیت فهم و طبیعی‌بودن در تولیدکننده سازه‌ای کمک کرده است.</OtherAbstract>
    <ObjectList>
      <Object Type="Keyword">
        <Param Name="Value">STRAIGHT
تحریک چندباندی
روش پیوندی
روش سازه‌ای
فشرده‌ساز</Param>
      </Object>
    </ObjectList>
    <ArchiveCopySource DocType="Pdf">http://ijece.org/fa/Article/Download/28005</ArchiveCopySource>
  </ARTICLE>
</ArticleSet>