یکی از اصلیترین چالشهای مدلهای مبتنی بر مجاورت مسأله سرعت بازیابی اطلاعات میباشد. در مدلهای مبتنی بر مجاورت مفهومی به نام فاصله تعریف میشود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیتها و محاسبه فاصلهها چکیده کامل
یکی از اصلیترین چالشهای مدلهای مبتنی بر مجاورت مسأله سرعت بازیابی اطلاعات میباشد. در مدلهای مبتنی بر مجاورت مفهومی به نام فاصله تعریف میشود که برای محاسبه آن باید موقعیت کلمات پرس و جو در سند استخراج شود. این موضوع یعنی استخراج موقعیتها و محاسبه فاصلهها فرایندی زمانبر است و چون غالباً در زمان جستجو اجرا میشود از دید کاربر اهمیت بیشتری دارد. در صورتی که بتوان تعداد اسناد مورد بررسی را کاهش داد بازیابی سریعتر میشود. در این مقاله الگوریتمی به نام 3SNTK برای هرسکردن پویای اسناد در موقع جستجوی عبارت ارائه گردیده است. برای اجتناب از تخصیص بیش از حد حافظه و کاهش ریسک بروز خطا در موقع بازیابی، امتیاز تعدادی از اسناد بدون هیچ گونه هرسی محاسبه میشود (Skip-N). در این الگوریتم از سه هرم حداقل برای استخراج اسناد دارای بالاترین امتیازها استفاده شده و آزمایشها نشان میدهد که استفاده از الگوریتم پیشنهادی باعث بهبود سرعت بازیابی میگردد.
پرونده مقاله
سیستمهای پیشنهاددهنده شخصیسازی شده، در کنار موتورهای جستجو، راهکاری برای غلبه بر مشکل گرانباری اطلاعات هستند به گونهای که در آنها سعی میشود با استفاده از تکنیکهای هوشمند و تعاملات کاربران در وب، محیطی شخصیسازی شده جهت تولید پیشنهادات مناسب فراهم آید. یکی از زمینه چکیده کامل
سیستمهای پیشنهاددهنده شخصیسازی شده، در کنار موتورهای جستجو، راهکاری برای غلبه بر مشکل گرانباری اطلاعات هستند به گونهای که در آنها سعی میشود با استفاده از تکنیکهای هوشمند و تعاملات کاربران در وب، محیطی شخصیسازی شده جهت تولید پیشنهادات مناسب فراهم آید. یکی از زمینههای کاربردی برای این سیستمها، محدوده یادگیری تطبیقی است. یک زیرسیستم پیشنهاددهنده، ماژول مهمی از سیستمهای تطبیقی آموزشی است که وظیفه ارائه اشیای آموزشی مناسب به کاربر خود را دارد. کاربران گوسفند خاکستری، یکی از چالشهای مطرحشده در این دسته از سیستمها هستند. این کاربران تشابه کمی با دیگر فراگیران دارند لذا پیشنهادات ارائهشده برای دیگران و یا بر اساس عادات قبلی آنها، لزوماً مناسب این نوع از کاربران نیست. برای حل این چالش، راهکار مطرحشده در این مقاله، استخراج فراداده صفحات آموزشی وب و تطابق آنها با خصوصیت سبک یادگیری کاربر در قالب یک فرمول رتبهبندی، جهت ارائه مناسبترین پیشنهاد منبع آموزشی برای یک فراگیر است. تعیین سبک یادگیری کاربر، بر اساس مدل فلدر- سیلورمن انجام میگیرد. سپس بر طبق میزان آن، صفحات مناسب برای آموزش و یادگیری بر حسب پارامترهای صریح و پنهان تعریفشده در آن صفحات، استخراج و پیشنهاد میگردند. پاسخ سیستم به پرس و جوی کاربر در قالب خروجی ایده مطرحشده، به وی نمایش داده میشود. همچنین کاربر میتواند جواب پیشنهادات برای سؤال خود را با خروجی الگوریتم لوسین که در اکثر موتورهای جستجو مورد استفاده است، برای مقایسه میزان مناسببودن آنها مشاهده نماید. کاربر میزان مفیدبودن پیشنهادات مطرحشده را به سیستم بازخورد میدهد. این بازخورد برای الگوریتم اتوماتای یادگیر تعریفشده برای تولید نتایج و پیشنهادات بعدی، مورد استفاده قرار میگیرد. نمونهای از سیستم پیادهسازی شده، در محیط آموزشی دانشگاهی، مورد ارزیابی دانشجویان قرار گرفته که نتایج بازخورد کاربران نشان از بهبود عملکرد سیستم نسبت به الگوریتمهای متعارف جستجوی عمومی دارد. این سیستم را میتوان به صورت یادگیری رسمی و غیر رسمی بر پایه منبع در محیط وب، مورد استفاده قرار داد.
پرونده مقاله
استفاده از بافت و ترتیب واژگان در یک عبارت از مواردی است که میتواند به فهم بهتر آن عبارت منجر گردد. در سالهای اخیر، مدلهای زبانی از پیشآموزشیافته، پیشرفت شگرفی در زمینه پردازش زبان طبیعی به وجود آودهاند. در این راستا مدلهای مبتنی بر ترنسفورمر مانند الگوریتم BERT چکیده کامل
استفاده از بافت و ترتیب واژگان در یک عبارت از مواردی است که میتواند به فهم بهتر آن عبارت منجر گردد. در سالهای اخیر، مدلهای زبانی از پیشآموزشیافته، پیشرفت شگرفی در زمینه پردازش زبان طبیعی به وجود آودهاند. در این راستا مدلهای مبتنی بر ترنسفورمر مانند الگوریتم BERT از محبوبیت فزایندهای برخوردار گردیدهاند. این مسئله در زبان فارسی کمتر مورد بررسی قرار گرفته و بهعنوان یک چالش در حوزه وب فارسی مطرح میگردد. بنابراین در این مقاله، درونسازی واژگان فارسی با استفاده از این الگوریتم مورد بررسی قرار میگیرد که به درک معنایی هر واژه بر مبنای بافت متن میپردازد. در رویکرد پیشنهادی، مدل ایجادشده بر روی مجموعه دادگان وب فارسی مورد پیشآموزش قرار میگیرد و پس از طی دو مرحله تنظیم دقیق با معماریهای متفاوت، مدل نهایی تولید میشود. در نهایت ویژگیهای مدل استخراج میگردد و در رتبهبندی اسناد وب فارسی مورد ارزیابی قرار میگیرد. نتایج حاصل از این مدل، بهبود خوبی نسبت به سایر مدلهای مورد بررسی دارد و دقت را نسبت به مدل برت چندزبانه تا حداقل یک درصد افزایش میدهد. همچنین اعمال فرایند تنظیم دقیق با ساختار پیشنهادی بر روی سایر مدلهای موجود توانسته به بهبود مدل و دقت درونسازی بعد از هر فرایند تنظیم دقیق منجر گردد. نتایج رتبهبندی بر مبنای مدلهای نهایی، بیانگر بهبود دقت رتبهبندی وب فارسی نسبت به مدلهای پایه مورد ارزیابی با افزایش حدود 5 درصدی دقت در بهترین حالت است.
پرونده مقاله
رتبهبندی کارآمد اسناد در عصر اطلاعات امروز، نقش مهمی در سیستمهای بازیابی اطلاعات ایفا میکند. این مقاله یک رویکرد جدید برای رتبهبندی اسناد با استفاده از مدلهای درونسازی با تمرکز بر مدل زبانی BERT برای بهبود نتایج رتبهبندی ارائه میکند. رویکرد پیشنهادی از روشهای د چکیده کامل
رتبهبندی کارآمد اسناد در عصر اطلاعات امروز، نقش مهمی در سیستمهای بازیابی اطلاعات ایفا میکند. این مقاله یک رویکرد جدید برای رتبهبندی اسناد با استفاده از مدلهای درونسازی با تمرکز بر مدل زبانی BERT برای بهبود نتایج رتبهبندی ارائه میکند. رویکرد پیشنهادی از روشهای درونسازی واژگان برای بهتصویرکشیدن نمایشهای معنایی پرسوجوهای کاربر و محتوای سند استفاده میکند. با تبدیل دادههای متنی به بردارهای معنایی، ارتباط و شباهت بین پرسوجوها و اسناد تحت روابط رتبهبندی پیشنهادی با هزینه کمتر مورد ارزیابی قرار میگیرد. روابط رتبهبندی پیشنهادی عوامل مختلفی را برای بهبود دقت در نظر میگیرند که این عوامل شامل بردارهای درونسازی واژگان، مکان واژگان کلیدی و تأثیر واژگان باارزش در رتبهبندی بر مبنای بردارهای معنایی است. آزمایشها و تحلیلهای مقایسهای برای ارزیابی اثربخشی روابط پیشنهادی اعمال گردیده است. نتایج تجربی، اثربخشی رویکرد پیشنهادی را با دستیابی به دقت بالاتر در مقایسه با روشهای رتبهبندی رایج نشان میدهند. این نتایج بیانگر آن مسئله است که استفاده از مدلهای درونسازی و ترکیب آن در روابط رتبهبندی پیشنهادی بهطور قابل توجهی دقت رتبهبندی را تا 87/0 در بهترین حالت بهبود میبخشد. این بررسی به بهبود رتبهبندی اسناد کمک میکند و پتانسیل مدل درونسازی BERT را در بهبود عملکرد رتبهبندی نشان میدهد.
پرونده مقاله