پیشبینی امتیازات کاربران در سیستمهای پیشنهاددهنده با درنظرگرفتن پویایی علایق کاربران و تغییرات ویژگیهای اقلام
محورهای موضوعی : مهندسی برق و کامپیوتر
1 - گروه مهندسي كامپيوتر ، دانشگاه آزاد اسلامی واحد كاشمر، ایران
کلید واژه: سیستمهای پیشنهاددهنده, پویایی علایق, پویایی اقلام, پیشبینی امتیازات, تجزیه نامنفی ماتریس.,
چکیده مقاله :
سیستمهای پیشنهاددهنده برای استخراج اطلاعات مفید از حجم انبوهی از دادههای پیچیده به کاربران کمک کرده و استفاده از آنها در سالهای اخیر مورد توجهی چشمگیری قرار گرفته است. در عمل معمولا ًعلایق کاربران و ویژگیهای اقلام در این سیستمها در طول زمان تغییر میکنند و بنابراین تطبیق سیستمهای پیشنهاددهنده با این نوع تغییرات ضروری بوده و به ارائهی پیشنهاداتی دقیقتر به کاربران کمک میکند. با این وجود، اغلب سیستمهای پیشنهاددهندهی پویا، فقط مبتنی بر پویایی علایق کاربران در طول زمان هستند و تغییرات ویژگیهای اقلام را در نظر نمیگیرند. در این مقاله، مدلی مبتنی بر تجزیهی نامنفی ماتریس برای پیشبینی امتیازات کاربران به اقلام در سیستمهای پیشنهاددهنده ارائه میشود که از هر دوی پویایی علایق کاربران و تغییرات ویژگیهای اقلام در طول زمان استفاده میکند. در مدل پیشنهادی به منظور کاهش مشکل خلوتی دادهها، علاوه بر امتیازات کاربران از اطلاعات مربوط به اعتماد بین کاربران نیز استفاده میشود. نتایج ارزیابی بر روی مجموعه دادهی Epinions نشان میدهد که مدل پیشنهادی نسبت به روشهای مورد مقایسه از دقت بهتری برخوردار میباشد.
Recommender systems help users to extract useful information from a large volume of complex data, and their use has received significant attention in recent years. In practice, the interests of users and the characteristics of items in these systems change over time, and therefore, adapting recommender systems to these types of changes is necessary and helps to provide more accurate recommendations to users. However, most temporal recommender systems are only based on the dynamics of users' preferences over time and do not consider changes in item characteristics.
In this paper, we propose a non-negative matrix factorization-based recommender system that uses both dynamics of users' interests and the changes in item characteristics over time in predicting users' ratings of items. In the proposed model, in order to reduce the data sparsity problem, in addition to users' ratings, trust between users is also used. The evaluation results on the Epinions dataset show that the proposed model is more accurate than the compared methods.
[1] H. Tahmasbi, M. Jalali, and H. Shakeri, "TSCMF: temporal and social collective matrix factorization model for recommender systems," J. Intell. Inf. Syst., vol. 56, no. 1, pp. 169-187, Feb. 2021.
[2] Y. Koren, "Collaborative filtering with temporal dynamics," Commun. ACM, vol. 53, no. 4, pp. 89-97, Apr. 2010.
[3] I. Rabiu, N. Salim, A. Da'u, A. Osman, and M. Nasser, "Exploiting dynamic changes from latent features to improve recommendation using temporal matrix factorization," Egypt. Informatics J., vol. 22, no. 3, pp. 285-294, Sept. 2021.
[4] J. Zhang and X. Lu, "A multi-trans matrix factorization model with improved time weight in temporal recommender systems," IEEE Access, vol. 8, pp. 2408-2416, 2020.
[5] Z. Jin, Y. Zhang, W. Mu, W. Wang, and H. Jin, "Leveraging the dynamic changes from items to improve recommendation," in Proc. 37th Int. Conf. on Conceptual Modeling, pp. 507-520, Xi'an, China, 22-25 Oct. 2018.
[6] T. Wu, Y. Feng, J. Sang, B. Qiang, and Y. Wang, "A novel recommendation algorithm incorporating temporal dynamics, reviews and item correlation," IEICE Trans. Inf. Syst., vol. E101-D, no. 8, pp. 2027-2034, 2018.
[7] I. Rabiu, N. Salim, A. Da'u, and A. Osman, "Recommender system based on temporal models: a systematic review," Appl. Sci., vol. 10, no. 7, pp. 1-27, Apr. 2020.
[8] I. Rabiu, N. Salim, A. Da'u, and M. Nasser, "Modeling sentimental bias and temporal dynamics for adaptive deep recommendation system," Expert Syst. Appl., vol. 191, no. C, Article ID: 116262, Apr. 2022.
[9] D. Rafailidis, P. Kefalas, and Y. Manolopoulos, "Preference dynamics with multimodal user-item interactions in social media recommendation," Expert Syst. Appl., vol. 74, no. C, pp. 11-18, May 2017.
[10] Y. Y. Lo, W. Liao, C. S. Chang, and Y. C. Lee, "Temporal matrix factorization for tracking concept drift in individual user preferences," IEEE Trans. Comput. Soc. Syst., vol. 5, no. 1, pp. 156-168, Mar. 2018.
[11] C. Wangwatcharakul and S. Wongthanavasu, "A novel temporal recommender system based on multiple transitions in user preference drift and topic review evolution," Expert Syst. Appl., vol. 241, no. C, Article ID: 115626, Apr. 2021.
[12 ح. طهماسبي، م. جلالي و ح. شاكري، "یک سامانه پیشنهاددهنده اجتماعی مبتنی بر تجزیه ماتریس با درنظرگرفتن پویایی علایق کاربران، "پردازش علائم و دادهها، سال 18، شماره 1، صص. 28-13، خرداد 1400.
[13] S. Sheibani, H. Shakeri, and R. Sheibani, "Four-dimensional trust propagation model for improving the accuracy of recommender systems," J. Supercomput., vol. 79, pp. 16793-16820, 2023.
[14] C. Zhang, K. Wang, H. Yu, J. Sun, and E. P. Lim, "Latent factor transition for dynamic collaborative filtering," in Proc. of the SIAM Int. Conf. on Data Mining, pp. 452-460, Philadelfia, PA, USA24-26 Apr. 2014.
[15] C. Zhang, Improving Recommender Systems with Rich Side Information, Simon Fraser University, 2015.
[16] Z. Chen and S. Wang, "A review on matrix completion for recommender systems," Knowl. Inf. Syst., vol. 64, no. 1, pp. 1-34, Jan. 2022.
[17] B. Ju, Y. Qian, M. Ye, R. Ni, and C. Zhu, "Using dynamic multi-task non-negative matrix factorization to detect the evolution of user preferences in collaborative filtering," PLoS One, vol. 10, no. 8, Article ID: 0135090, 2015.
[18] H. Bao, Q. Li, S. S. Liao, S. Song, and H. Gao, "A new temporal and social PMF-based method to predict users' interests in micro-blogging," Decis. Support Syst., vol. 55, no. 3, pp. 698-709, Jun. 2013.
[19] A. Y. Aravkin, K. R. Varshney, and L. Yang, "Dynamic matrix factorization with social influence," in Proc. IEEE Int. Workshop on Machine Learning for Signal Processing, 6 pp., Vietri sul Mare, Italy, 13-16 Sept. 2016.
[20] D. Rafailidis and A. Nanopoulos, "Modeling users' preference dynamics and side information in recommender systems," IEEE Trans. Syst. Man, Cybern. Syst., vol. 46, no. 6, pp. 782-792, Jun. 2016.
[21] L. Xiong, X. Chen, T. K. Huang, J. Schneider, and J. G. Carbonell, "Temporal collaborative filtering with bayesian probabilistic tensor factorization," in Proc. of the SIAM Int. Conf. on Data Mining, pp. 211-222, Colombus, OH, USA, 29 Apr.-1 May 2010.
[22] J. Zhao, S. Yang, H. Huo, Q. Sun, and X. Geng, "TBTF: an effective time-varying bias tensor factorization algorithm for recommender system," Appl. Intell., vol. 51, no. 7, pp. 4933-4944, 2021.
[23] H. Tahmasbi, M. Jalali, and H. Shakeri, "Modeling user preference dynamics with coupled tensor factorization for social media recommendation," J. Ambient Intell. Humaniz. Comput., vol. 12, no. 10, pp. 9693-9712, 2021.
[24] S. Yu, Z. Zhou, B. Chen, and L. Cao, "Generalized temporal similarity-based nonnegative tensor decomposition for modeling transition matrix of dynamic collaborative filtering," Inf. Sci. (Ny), vol. 632, pp. 340-357, Jun. 2023.
[25] C. Tong, J. Qi, Y. Lian, J. Niu, and J. J. P. C. Rodrigues, "TimeTrustSVD: a collaborative filtering model integrating time, trust and rating information," Futur. Gener. Comput. Syst., vol. 93, pp. 933-941, Apr. 2019.
[26] D. Lee and H. S. Seung, "Algorithms for non-negative matrix factorization," in Proc. of the 13th Int. Conf. on Neural Information Processing Systems, pp. 535-541, Denver, CO, USA, 1-1 Jan. 2000.
[27] D. D. Lee and H. S. Seung, "Learning the parts of objects by non-negative matrix factorization," Nature, vol. 401, pp. 788-791, 1999.
[28] H. W. Kuhn and A. W. Tucker, "Nonlinear programming," in Proc. of the 2nd Berkeley Symp. on Mathematical Statistics and Probability, vol. 1951, pp. 481-492, 1951.
[29] J. Tang, Epinions Dataset, [Online]. Available: http://www.cse.msu.edu/~tangjili/trust.html. [Accessed: 11-Feb-2022].
[30] H. Ma, T. C. Zhou, M. R. Lyu, and I. King, "Improving recommender systems by incorporating contextual information," ACM Trans. Inf. Syst., vol. 29, no. 2, Article ID: 9, 23 pp., Apr. 2011.
نشریه مهندسی برق و مهندسی کامپیوتر ایران، ب- مهندسی کامپیوتر، سال 22، شماره 2، تابستان 1403 119
مقاله پژوهشی
پیشبینی امتیازات کاربران در سیستمهای پیشنهاددهنده با درنظرگرفتن پویایی علایق کاربران و تغییرات ویژگیهای اقلام
حمیدرضا طهماسبی
چکیده: سیستمهای پیشنهاددهنده برای استخراج اطلاعات مفید از حجم انبوهی از دادههای پیچیده به کاربران کمک میکنند و استفاده از آنها در سالهای اخیر مورد توجه چشمگیری قرار گرفته است. در عمل معمولاً علایق کاربران و ویژگیهای اقلام در این سیستمها در طول زمان تغییر میکنند و بنابراین تطبیق سیستمهای پیشنهاددهنده با این نوع تغییرات ضروری بوده و به ارائه پیشنهادهایی دقیقتر به کاربران کمک میکند. با وجود این، اغلب سیستمهای پیشنهاددهنده پویا فقط مبتنی بر پویایی علایق کاربران در طول زمان هستند و تغییرات ویژگیهای اقلام را در نظر نمیگیرند. در این پژوهش، مدلی مبتنی بر تجزیه نامنفی ماتریس برای پیشبینی امتیازات کاربران به اقلام در سیستمهای پیشنهاددهنده ارائه میشود که از هر دوی پویایی علایق کاربران و تغییرات ویژگیهای اقلام در طول زمان استفاده میکند. در مدل پیشنهادی بهمنظور کاهش مشکل خلوتی دادهها، علاوه بر امتیازات کاربران از اطلاعات مربوط به اعتماد بین کاربران استفاده میشود. نتایج ارزیابی بر روی مجموعه داده Epinions نشان میدهند که مدل پیشنهادی نسبت به روشهای مورد مقایسه از دقت بهتری برخوردار است.
کلیدواژه: سیستمهای پیشنهاددهنده، پویایی علایق، پویایی اقلام، پیشبینی امتیازات، تجزیه نامنفی ماتریس.
1- مقدمه
در چند دهه اخیر، رشد روزافزون اطلاعات دیجیتال، کاربران را با چالشی به نام سربار اطلاعاتی مواجه کرده است؛ بهطوری که پیمایش و یافتن اطلاعات مفید و دلخواه از میان این حجم انبوه اطلاعات برای کاربران دشوار بوده و در اغلب موارد باعث سردرگمی و ناتوانی در تصمیمگیری آنها میگردد. سیستمهای پیشنهاددهنده بهعنوان یک ابزار ارزشمند برای مقابله با مشکل سربار اطلاعاتی مفید بوده و استفاده از آنها در سالهای اخیر بهطور چشمگیری مورد توجه قرار گرفته است [1]. این سیستمها با تحلیل رفتار و ویژگیهای کاربران و فیلترکردن حجم زیادی از اطلاعات، لیستی از اقلامی را که میتواند مورد علاقه کاربر باشد به او پیشنهاد کرده و یا میزان علاقه کاربر به یک کالا را پیشبینی میکنند. اغلب سیستمهای پیشنهاددهنده از امتیازاتی که کاربران به اقلام دادهاند بهعنوان مهمترین اطلاعات برای تولید پیشنهادها و یا پیشبینیهای آتی استفاده میکنند. در عمل، معمولاً علایق و ترجیحات کاربران و همچنین ویژگیهای اقلام در طول زمان تغییر میکنند [2] تا [6]. بهعنوان مثال یک کاربر ممکن است در نوجوانی، فیلم کارتونی دوست داشته و چند سال بعد به فیلمهای علمی و تخیلی گرایش پیدا کرده و اکنون فیلمهای رمانتیک را ترجیح دهد. در همین حال محبوبیت فیلمها نیز بهطور مداوم در حال تغییر هستند. تغییر شکل، کیفیت، قابلیت و محبوبیت، نمونههایی از ویژگیهای متغیر و پویای اقلام در طول زمان میباشند [5]. با این وجود، اغلب روشها در سیستمهای پیشنهاددهنده، پویایی زمانی علایق کاربران و تغییرات ویژگیهای اقلام را که میتواند بر دقت پیشنهادها به کاربران تأثیر بگذارد، نادیده میگیرند [3] تا [5]. هرچند این روشها موفقیت چشمگیری در ارائه پیشنهادها داشتهاند، بهدلیل عدم توجه به پویایی زمانی علایق کاربران و تغییر ویژگیهای اقلام در ارائهدادن پیشنهادهای دقیق، کافی نیستند [7]. دقت سیستمهای پیشنهاددهنده معمولی پس از مدتی بهدلیل عدم توجه به پویایی علایق کاربران و ویژگیهای اقلام کاهش مییابد [4]. مطالعات انجامشده نشان میدهند که تطبیقدادن سیستمهای پیشنهاددهنده با علایق پویای کاربران و ویژگیهای اقلام که دائماً در حال تغییر هستند به بهبود دقت پیشنهادها کمک میکند [3] تا [5]. بنابراین استخراج الگوها و تمایلات تغییر در علایق و رفتار کاربران و ویژگیهای اقلام ضرورت داشته و موجب ارائه پیشنهادهایی نزدیکتر به ترجیحات و تمایلات کاربران میگردد [4] و [7]. مطالعاتی برای ارائه سیستمهای پیشنهاددهنده زمانی انجام شده است؛ ولی اغلب آنها فقط پویایی علایق کاربران را در نظر میگیرند و این واقعیت را که ویژگیهای اقلام نیز در طول زمان تغییر میکند نادیده میگیرند. اخیراً رابیو و همکارانش [3] و همچنین ژانگ و لیو [4] روشهایی مبتنی بر تجزیه ماتریس ارائه کردهاند که در آنها هر دوی پویایی علایق کاربران و تغییر ویژگیهای اقلام در طول زمان بهمنظور افزایش دقت پیشنهادها در نظر گرفته شده است. در روش تجزیه ماتریس، ویژگیهای پنهان کاربران و اقلام با تجزیه ماتریس امتیازاتی که کاربران به اقلام دادهاند، استخراج شده و برای پیشبینی امتیازات استفاده میشوند. روش تجزیه ماتریس بهعلت قابلیت پیشبینی و مقیاسپذیری خوبی که دارد [1] در اکثر الگوریتمهای سیستمهای پیشنهاددهنده استفاده میشود. اگرچه روشهای پیشنهادشده توسط رابیو و همکارانش [3] و همچنین ژانگ و لیو [4]، پویایی زمانی علایق کاربران و تغییر ویژگیهای اقلام را در ارائهدادن پیشنهادهای بهتر به کاربران در نظر میگیرند، با مشکل خلوتی دادهها2 مواجه هستند. این مشکل در شرایطی اتفاق میافتد که اغلب کاربران، تعداد بسیار کمی از اقلام را امتیازدهی کردهاند. خلوتی دادهها از محدودیتهای ذاتی سیستمهای پیشنهاددهنده محسوب شده و باعث کاهش دقت پیشنهادها میگردد [1]، [8] و [9]. در سیستمهای پیشنهاددهندهای که پویایی زمانی را در مدلسازی علایق کاربران در نظر میگیرند در یک دوره زمانی خاص، میزان داده موجود میتواند بهطور قابل توجهی کم باشد و در نتیجه مسئله خلوتی دادهها در این سیستمها شدیدتر است [10] تا [12]. پیشبینی دقیق و برآوردهکردن نیازهای کاربران با توجه به تغییرات پویای علایق کاربران و ویژگیهای اقلام، یکی از چالشهای اساسی سیستمهای پیشنهاددهنده است و خلوتی دادهها این کار را دشوارتر میسازد [2] و [7].
با توجه به اهمیت و ضرورت مدلسازی توأم پویایی زمانی علایق کاربران و تغییرات ویژگیهای اقلام در سیستمهای پیشنهاددهنده، در این پژوهش مدلی مبتنی بر تجزیه نامنفی ماتریس3 برای پیشبینی امتیازات کاربران در سیستمهای پیشنهاددهنده ارائه میشود که علاوه بر در نظر گرفتن پویایی علایق کاربران در طول زمان، تغییر ویژگیهای اقلام را نیز مورد توجه قرار داده است. همچنین بهمنظور کاهش مشکل خلوتی دادهها، علاوه بر ماتریس امتیازات از اطلاعات اعتماد بین کاربران نیز در مدل پیشنهادی استفاده میشود. یک کاربر معمولاً در انتخاب اقلام از نظرات افرادی که به آنها اعتماد دارد استفاده میکند. بنابراین روابط اعتماد بین کاربران در علایق و ترجیحات آنها تأثیرگذار است [12] و [13] و بهعنوان یک منبع ارزشمند برای کاهش مشکل خلوتی دادهها در مطالعات مربوط به سیستمهای پیشنهاددهنده مورد توجه قرار دارد [1]. مهمترین مزیت روش تجزیه ماتریس که موجب استفاده آن در مدل پیشنهادی شده است، امکان ترکیب راحتتر اطلاعات جانبی مختلف از قبیل امتیازات کاربران و اعتماد بین آنها در مدل میباشد [6].
در ادامه این پژوهش در بخش دوم به بررسی پیشینه تحقیق پرداخته میشود. مسئله هدف در بخش سوم، مطرح و در بخش چهارم، مدل پیشنهادی معرفی میشود. نتایج ارزیابی مدل پیشنهادی در بخش پنجم و در بخش ششم نیز نتیجهگیری و پیشنهادهای کارهای آتی بیان میگردند.
2- پیشینه تحقیق
روش تجزیه ماتریس در پیشبینیکردن امتیازات در سیستمهای پیشنهادهنده بهخوبی عمل کرده و توجه چشمگیری را به خود جلب کرده است [3]. تجزیه ماتریس امتیازات برای هر کاربر و هر قلم آیتم (کالا)، یک بردار مجزا از ویژگیهای پنهان استخراج میکند و با ضرب داخلی هر زوج بردار ویژگی کاربر و قلم آیتم، امتیارات نامشخص را تخمین میزند. برای استخراج علایق کاربران، مطالعات متعددی با بهکارگیری روش تجزیه ماتریس برای مدلسازی پویایی زمانی در سیستمهای پیشنهاددهنده با درنظرگرفتن تغییر علایق کاربران در طول زمان انجام شده است. معروفترین مطالعه، سیستم پیشنهاددهنده زمانی ارائهشده توسط کورن [2] به نام TimeSVD++ است که با توسعه روش تجزیه مقدار تکین 4(SVD)، پویایی علایق کاربران را با تعریف یک میزان تمایل برای هر کاربر و هر آیتم در هر دوره زمانی استخراج میکند. یادگیری پارامترها در TimeSVD++ در هر مرحله بهصورت مجزا انجام میشود که باعث شده تلاش قابل توجهی برای تنظیم پارامترهای مدل صرف گردد [10]. ژانگ و همکارانش [14] دو روش به نامهای TMF و BTMF با درنظرگرفتن پویایی علایق کاربران ارائه کردهاند. در TMF فرض میشود تغییر علایق کاربران بهصورت تدریجی است و علایق دوره زمانی فعلی کاربران به علایق آنها در دوره زمانی قبلی بستگی دارد. TMF با استفاده از روش تجزیه احتمالاتی ماتریس5، تغییرات پویای علایق کاربران به اقلام بین دو دوره زمانی متوالی را با یادگیری یک ماتریس انتقال بین این دو دوره زمانی، استخراج میکند؛ بهطوری که هر کاربر الگوی تغییر علایق مخصوص به خود را دارد. بهمنظور افزایش دقت و کاهش پیچیدگی تخمین مقادیر مناسب برای پارامترها در روش TMF، این روش به مدلی مبتنی بر بیزین به نام BTMF توسعه یافت که از زنجیره مارکوف مونتکارلو برای یادگیری ماتریس انتقال و تخمین پارامترها استفاده میکند. در روشهای TMF و BTMF کاربرانی که تعداد کمی از اقلام را امتیاز دادهاند و به کاربران شروع سرد معروف هستند، در مرحله پیشپردازش دادهها حذف میشوند. محدودیت کاربران شروع سرد در این دو روش، تأثیر منفی بر کارایی سیستم پیشنهاددهنده میگذارد [15].
یکی از روشهای تجزیه ماتریس، تجزیه ماتریس امتیازات به دو ماتریس نامنفی شامل بردارهای ویژگیهای کاربران و اقلام است که تجزیه نامنفی ماتریس نام دارد [16]. یک روش مبتنی بر تجزیه نامنفی ماتریس توسط جیو و همکارانش [17] ارائه شده که از یک ماتریس انتقال برای نگاشت بین ویژگیهای پنهان کاربران در دو دوره زمانی متوالی استفاده میکند تا پویایی زمانی علایق کاربر را مدل کند. اگرچه ماتریس انتقال استفادهشده در این روش برای هر کاربر متفاوت است، این ماتریس در طول زمان برای یک کاربر خاص، ثابت در نظر گرفته شده است. در حالی که عملاً هر کاربر در دورههای زمانی مختلف، الگوی تغییر علایق متفاوتی میتواند داشته باشد [1].
روشهای بیانشده فوق با محدودیت مهم خلوتی دادهها مواجه هستند که این مشکل میتواند تأثیر منفی در دقت سیستمهای پیشنهاددهنده داشته باشد. در برخی از سیستمهای پیشنهاددهنده با درنظرگرفتن تغییرات پویای علایق کاربران، مقابله با مشکل خلوتی دادهها نیز مورد توجه قرار گرفته است. یک مدل برای استخراج پویای علایق کاربران با استفاده از روش تجزیه ماتریس توسط لو و همکارانش [10] ارائه شده است. این مدل با توسعه روش کاهش گرادیان از امتیازات دورههای زمانی قبلی برای یادگیری بردار ویژگیهای پنهان هر کاربر در یک دوره زمانی خاص استفاده میکند. در این روش یک مدل خطی برای استخراج الگوی انتقال برای بردار ویژگی پنهان هر کاربر با استفاده از رگرسیون لاسو آموزش داده میشود. روش گرادیان ارائهشده در این مدل، مشکل خلوتی دادهها را کاهش میدهد؛ ولی کاربران با تعداد امتیازات کم در این مدل نادیده گرفته شدهاند و مسئله کاربران شروع سرد محدودیت این مدل میباشد. برخی روشهای پیشنهاددهنده، علاوه بر امتیازات کاربران از اطلاعات جانبی از قبیل دادههای دموگرافی کاربران، نظرات کاربران درباره اقلام و اعتماد بین کاربران برای غلبه بر مشکل خلوتی دادهها استفاده میکنند. بهعنوان مثال، روشی مبتنی بر تغییرات زمانی علایق کاربران برای پیشبینی امتیازات توسط ویو و همکارانش [6] ارائه شده که علاوه بر امتیازات کاربران به اقلام، از نظرات متنی کاربران درباره اقلام و همچنین همبستگی بین اقلام استفاده میکند. اطلاعات جانبی استفادهشده در این روش در کاهش مشکل خلوتی دادهها مؤثر بوده است. با وجود این، عدم امکان پیشبینی امتیازات کاربران جدید، محدودیت اصلی این روش است. همچنین رافیلیدیس و همکارانش [9] یک سیستم پیشنهاددهنده مبتنی
بر تجزیه نامنفی ماتریس با درنظرگرفتن پویایی علایق کاربران ارائه کردهاند که برای مقابله با مشکل خلوتی دادهها در کنار اطلاعات امتیازدهی کاربران از توضیحات و نظرات کاربران درباره اقلام نیز استفاده میکند. این روش با ترکیب امتیازات کاربران و نظرات آنها و یادگیری یک ماتریس انتقال برای نگاشت تغییرات علایق کاربران بین دو دوره زمانی متوالی، با استفاده از روش تجزیه نامنفی ماتریس، الگوی تغییرات علایق کاربران را استخراج میکند. ماتریس انتقال در این روش برای همه کاربران یکسان فرض میشود؛ در حالی که روند تغییرات علایق برای هر کاربر میتواند متفاوت باشد [1] و [12]. همچنین در این روش فقط از بازخورد ضمنی نظرات کاربران استفاده شده و معانی پنهانی نهفته در این نظرات نادیده گرفته میشود.
در سیستمهای پیشنهاددهنده اجتماعی، اطلاعات اعتماد بین کاربران میتواند بهعنوان یک منبع مؤثر برای برخورد با مشکل خلوتی دادهها استفاده شود. یک سیستم پیشنهادهنده اجتماعی با درنظرگرفتن این که روند و الگوی تغییر علایق هر کاربر در طول زمان لزوماً مشابه سایر کاربران نمیباشد، توسط طهماسبی و همکارانش [1] ارائه شده که از روابط اعتماد بین کاربران برای غلبه بر مشکل خلوتی دادهها استفاده میکند. در این روش با آموزش یک ماتریس انتقال برای هر کاربر خاص، پویایی علایق او بین دو دوره زمانی متوالی مدل شده و با ترکیب امتیازات کاربران و اعتماد بین آنها با استفاده از روش تجزیه ماتریس، پیشبینی امتیازات صورت میگیرد. اگرچه اطلاعات اعتماد نیز همانند امتیازات کاربران بهخصوص در یک دوره زمانی، بسیار کم هستند، این اطلاعات مکمل امتیازات کاربران به اقلام بوده و بهعنوان اطلاعات جانبی در کنار امتیازات کاربران میتوانند در ارائه پیشنهادهای دقیقتر و شخصیتر به کاربران مفید باشند [18]. مدل دیگری مبتنی بر تجزیه ماتریس توسط آراوکین و همکارانش [19] ارائه شده که با استفاده از امتیازات و اعتماد میان کاربران برای استخراج علایق پویای کاربران استفاده میکند. بدین منظور در این روش یک ماتریس انتقال علایق کاربران تعریف میگردد و اعتماد میان کاربران بهصورت یک گراف در هر دوره زمانی در نظر گرفته میشود. هرچند این روش با استفاده از اطلاعات جانبی اعتماد توانسته است مشکل خلوتی دادهها را کاهش دهد، در این روش فرض میشود الگوی پویایی علایق کاربران مشابه یکدیگر است. بائو و همکارانش [18] یک رویکرد مبتنی بر تجزیه احتمالاتی ماتریس با درنظرگرفتن پویایی علایق کاربران ارائه کردهاند که علاوه بر امتیازات از اعتماد نیز استفاده میکند. این روش با این فرض که علایق و ترجیحات قدیمیتر کاربر، تأثیر کمتری در امتیازات و علایق فعلی او دارند، با معرفی یک تابع کاهش زمانی به امتیازات کاربر وزن میدهد؛ بهطوری که با گذشت زمان از تأثیر امتیازات قدیمی در محاسبه امتیازات فعلی کاسته شود. وزن محاسبهشده توسط این تابع در یک دوره زمانی خاص برای امتیازات همه کاربران یکسان است؛ در حالی که عملاً روند تغییرات و تأثیرات علایق قدیمیتر برای هر کاربر میتواند متفاوت باشد [12] و [20].
برخی از سیستمهای پیشنهاددهنده مبتنی بر علایق پویای کاربران برای پیشبینی امتیازات کاربران از روش تجزیه تنسور6 استفاده کردهاند. تجزیه تنسور، بسط تجزیه ماتریس به یک تنسور سهبعدی با درنظرگرفتن تأثیرات زمانی میباشد [12]. یک روش مبتنی بر تجزیه احتمالاتی بیزین تنسور توسط شیونگ و همکارانش [21] ارائه شده است. در این مدل از یک تنسور سهبعدی شامل ابعاد کاربر، آیتم و دوره زمانی استفاده میشود که هر مقدار در تنسور، متناظر با امتیازی است که یک کاربر به یک آیتم در یک دوره زمانی خاص میدهد. همچنین روشی مشابه توسط ژائو و همکارانش [22] ارائه شده که پویایی علایق کاربران را با مدلکردن میزان تمایل هر کاربر و هر آیتم بهصورت تابعی که در طول زمان تغییر میکند، استخراج میکند. این دو روش فقط تغییرات کلی علایق کاربران در طول زمان را مدل میکنند و توانایی استخراج تغییرات علایق برای هر کاربر خاص را ندارند [10] و [11]. رافیلیدیس و نانوپولوس [20] نیز یک مدل مبتنی بر تجزیه تنسور و ماتریس اتصالی به آن ارائه کردهاند که تنسور و ماتریس اتصالی به آن بهترتیب متناظر با تعاملات کاربران با اقلام و اطلاعات مربوط به ویژگیهای فردی کاربران میباشند. این روش با پیشنهاد یک معیار به نام نرخ تغییر علایق کاربر، میزان تغییر علایق هر کاربر در طول زمان را استخراج کرده و بر اساس آن اهمیت علایق قبلی هر کاربر وزندهی میشود. این روش توسط طهماسبی و همکارانش [23] توسعه یافته است. مدل توسعهیافته فرض میکند هرچه زمان میگذرد، اهمیت و تأثیر علایق و ترجیحات قبلی کاربر در تعیین علایق فعلی او کمتر میشود و بر این اساس یک تابع کاهش زمانی مناسب برای هر کاربر با توجه به نرخ تغییر علایق او پیشنهاد میکند. این مدل همچنین علاوه بر ویژگیهای فردی کاربران از یک ماتریس دیگر شامل اطلاعات شباهت بین کاربران در طول زمان برای مقابله بهتر با مشکلات خلوتی دادهها و کاربران شروع سرد استفاده میکند. یک روش مبتنی بر تجزیه نامنفی تنسور توسط یو و همکارانش [24] ارائه شده که با معرفی یک معیار شباهت زمانی بین دورههای زمانی، پویایی علایق کاربران را استخراج میکند. استفاده از روش تجزیه تنسور میتواند بهعنوان یک روش اصولی و ساختیافته برای مدلکردن پویایی زمانی در سیستمهای پیشنهاددهنده بهکار رود [10]. با وجود این، استفاده از تنسورها مخصوصاً تنسورهای بسیار بزرگ و خلوت، به نوبه خود چالشهای جدیدی را بهوجود آورده و باعث پیچیدگی سیستمهای پیشنهاددهنده میشوند. از جمله میتوان پیچیدگی حافظهای بالا، محاسبات زمانبر و نرخ همگرایی کند در فرایند یادگیری مدل را نام برد [3] و [10].
در همه روشها و مطالعات مذکور، تلاشهای قابل توجهی برای بهبود دقت سیستمهای پیشنهاددهنده انجام گردیده است. با وجود این، آنها فرض میکنند که ویژگیهای اقلام در طول زمان ثابت است و فقط بر روی تغییرات پویای علایق کاربران متمرکز هستند. یک مدل مبتنی بر تجزیه ماتریس به روش تجزیه مقدار تکین (SVD) توسط تانگ و همکارانش [25] ارائه شده که با درنظرگرفتن تأثیرات زمان بر هر دوی ویژگیهای کاربران و اقلام، اطلاعات امتیازدهی، اعتماد و زمان را برای مدلسازی پویایی علایق کاربر با هم ترکیب میکند. در این روش، این موضوع که الگوی تغییر علایق هر کاربر در طول زمان میتواند متفاوت باشد نادیده گرفته شده است. یک روش مشابه مبتنی بر تجزیه ماتریس نیز توسط ژانگ و لیو [4] ارائه شده است. در این روش با درنظرگرفتن این موضوع که کاربران اطلاعات را در طول زمان فراموش میکنند، با ترکیب این فراموشی و شباهت بین اقلام، یک تابع وزنی برای کاهش تأثیر علایق قدیمیتر کاربران در تعیین علایق فعلی آنها و همچنین حفظ تأثیر علایق پایدار کاربران معرفی میشود. سپس پویایی علایق کاربران
و تغییر ویژگیهای اقلام با یادگیری ماتریسهای انتقال ویژگیهای پنهان کاربران و اقلام بین دوره زمانی فعلی و همه دورههای زمانی قبلی مدل میشوند. این روش با مشکل خلوتی دادهها مواجه است. رابیو و همکارانش [3] روشی مبتنی بر تجزیه ماتریس با درنظرگرفتن تغییرات علایق کاربران و ویژگیهای اقلام در طول زمان برای پیشبینی امتیازات کاربران ارائه کردهاند. این روش فرض میکند که الگوی تغییر علایق هر کاربر و ویژگیهای هر آیتم روند متفاوتی دارد و با استفاده از روش فاصله
جدول 1: معرفی نمادها.
نماد | تعریف |
| تعداد کاربران |
| تعداد اقلام |
| تعداد ویژگیهای پنهان |
| تعداد دورههای زمانی |
| ماتریس امتیازات کاربران به اقلام در دوره زمانی |
| امتیاز کاربر به قلم آیتم در دوره زمانی |
| ماتریس اعتماد کاربران به یکدیگر در دوره زمانی |
| مقدار اعتماد کاربر به کاربر در دوره زمانی |
| ماتریس ویژگیهای پنهان کاربران در دوره زمانی |
| ماتریسهای ویژگیهای پنهان اقلام در دوره زمانی |
| ماتریس امتیازات تخمینزدهشده کاربران به اقلام در دوره زمانی |
| ماتریس تغییر ویژگیهای کاربران از دوره زمانی به دوره زمانی |
| ماتریس تغییر ویژگیهای کاربر از دوره زمانی به دوره زمانی |
| ماتریس تغییر ویژگیهای اقلام از دوره زمانی به دوره زمانی |
| ماتریس تغییر ویژگیهای قلم آیتم از دوره زمانی به دوره زمانی |
| ماتریس ویژگیهای پنهان کاربران اعتمادکننده در دوره زمانی |
| ماتریس ویژگیهای پنهان کاربران معتمد در دوره زمانی |
| ماتریس همانی |
| نُرم فروبنیوس |
| نُرم یک |
| کنترلکننده میزان تأثیر اعتماد بر علایق کاربران |
| کنترلکننده میزان وابستگی مدل به علایق و ویژگیهای قبلی |
| پارامترهای تنظیمسازی |
| ضرب آدامار |
| گرادیان تابع هدف |
هلینگر7، میزان تغییر ویژگیهای پنهان کاربران در دو دوره زمانی متوالی و همچنین میزان تغییر ویژگیهای پنهان اقلام در دو دوره زمانی متوالی را محاسبه میکند. در این روش کاربران یا اقلامی با کمتر از 20 امتیازدهی حذف میشوند؛ در نتیجه، تأثیر کاربران شروع سرد در این روش بررسی نشده که میتواند اثر نامطلوبی در دقت پیشبینی امتیازات داشته باشند. همچنین مشکل خلوتی دادهها نیز بهعنوان محدودیت این روش به شمار میرود.
مدلسازی هر دوی پویایی علایق کاربران و تغییر ویژگیهای اقلام میتواند منجر به بهبود پیشنهادهای ارائهشده به کاربر گردد. در این پژوهش روشی ارائه میکنیم که هم پویایی علایق کاربران و هم تغییر ویژگیهای اقلام در طول زمان را برای پیشبینی دقیقتر امتیازات کاربران به اقلام در سیستمهای پیشنهاددهنده در نظر میگیرد. روش پیشنهادی مبتنی بر این واقعیت است که الگوی تغییر علایق هر کاربر و ویژگیهای هر آیتم در طول زمان برای هر کاربر و هر آیتم میتواند متفاوت باشد. سیستمهای پیشنهاددهنده زمانی موجود بهندرت به رسیدگی و برخورد مناسب با مشکل خلوتی دادهها پرداختهاند [8]. در روش پیشنهادی این پژوهش علاوه بر امتیازات کاربران به اقلام، از اعتماد بین کاربران برای مقابله با مشکل خلوتی دادهها استفاده میشود.
3- بیان مسئله
نمادهای مهم استفادهشده در پژوهش در جدول 1 معرفی شدهاند. در یک سیستم پیشنهاددهنده، امتیازاتی را که کاربر به آیتم در دوره زمانی میدهند میتوان بهصورت یک ماتریس نشان داد. درایه در این ماتریس بیانگر امتیازی است که کاربر به آیتم در دوره زمانی داده است. در اغلب سیستمهای پیشنهاددهنده، مقدار یک عدد حقیقی بین صفر تا میباشد که معمولاً مقدار برابر 5 است [12]. مقدار صفر به این معناست که کاربر امتیازی به آیتم نداده است. هرچه مقدار امتیاز دادهشده بیشتر باشد، بیانگر رضایت بیشتر کاربر از آن آیتم است. در عمل، کاربران تعداد کمی از اقلام را در یک دوره زمانی امتیازدهی میکنند و در نتیجه ماتریس خلوت میباشد [10]. در اغلب سیستمهای پیشنهاددهنده اجتماعی، یک کاربر علاوه بر امتیاز به اقلام میتواند کاربرانی را بهعنوان افراد مورد اعتماد خود تعیین کند. اعتماد میان کاربران در دوره زمانی را میتوان با ماتریس نشان داد. هر درایه در این ماتریس مقدار صفر یا یک دارد. مقدار صفر به معنی عدم وجود اعتماد کاربر به کاربر و مقدار یک به معنی اعتماد کاربر به کاربر در دوره زمانی میباشد.
با درنظرگرفتن تغییرات علایق کاربران و ویژگیهای اقلام در طول زمان و با توجه به این واقعیت که اعتماد بین کاربران بر علایق آنها تأثیر میگذارد، هدف این پژوهش، پیشبینی مقادیر ماتریس با استفاده از مدلسازی پویایی علایق کاربران و تغییرات ویژگیهای اقلام و ترکیب ماتریسهای امتیازات و اعتماد میباشد.
4- مدل پیشنهادی
شکل 1 ساختار مدل پیشنهادی را نشان میدهد. با فرض این که ماتریسهای و بهترتیب ماتریسهای ویژگیهای پنهان کاربران و اقلام در دوره زمانی بوده که ابعاد فضای ویژگی میباشد، با استفاده از تکنیک تجزیه نامنفی ماتریس معرفیشده توسط لی و سئونگ [26] میتوان ماتریسهای ویژگیهای پنهان کاربران و اقلام در دوره زمانی را با تجزیه ماتریس امتیازات استخراج نمود. برای یادگیری آسانتر پارامترها، ابتدا مقادیر امتیازات در ماتریس با استفاده از تابع نرمالسازی به بازه [0,1] تبدیل میشوند. با ضرب دو ماتریس استخراجشده و (یعنی ) میتوان مقادیر ماتریس را تخمین زد. به عبارتی ماتریس بهعنوان تخمینی از مقادیر ماتریس بهصورت زیر بهدست میآید
(1)
تجزیه نامنفی ماتریس متناظر با مسئله بهینهسازی زیر است
(2)
که ماتریسهای و نامنفی هستند و نرم فروبنیوس است
بهطوری که .
با درنظرگرفتن پویایی علایق کاربران، همانند مطالعات [1]، [4] و [14] فرض میکنیم یک وابستگی زمانی بین ویژگیهای پنهان هر کاربر در دو دوره زمانی متوالی و وجود دارد. این وابستگی را با یک ماتریس انتقال برای کاربران مدل میکنیم. برای
[1] این مقاله در تاریخ 5 تیر ماه 1402 دریافت و در تاریخ 14 آبان ماه 1402 بازنگری شد.
حمیدرضا طهماسبی (نويسنده مسئول)، گروه مهندسي كامپيوتر، واحد کاشمر، دانشگاه آزاد اسلامی، کاشمر، ايران، (email: htahma@gmail.com).
[2] . Data Sparsity
[3] . Non-Negative Matrix Factorization
[4] . Singular Value Decomposition
[5] . Probabilistic Matrix Factorization
[6] . Tensor Factorization
[7] . Hellinger Distance Measure
شکل 1: ساختار مدل پیشنهادی پیشبینی امتیازات کاربران به اقلام.
کاربر ، یک ماتریس انتقال است که انتقال علایق کاربر از دوره زمانی به دوره زمانی را مدل میکند. ماتریس انتقال ، این که چگونه بردار ویژگیهای پنهان کاربر در دوره میتواند توسط بردار ویژگیهای پنهان کاربر در دوره زمانی بیان شود را استخراج میکند و خواهیم داشت
(3)
بر این اساس با استفاده از ماتریس انتقال ، (2) را میتوان بهصورت زیر بازنویسی کرد
(4)
که ماتریسهای و نیز نامنفی هستند. از آنجا که ویژگیهای اقلام نیز در طول زمان تغییر میکنند بهطور مشابه، یک ماتریس انتقال برای استخراج روند تغییر ویژگیهای اقلام بین دو ماتریس ویژگی و معرفی میکنیم. برای آیتم ، ماتریس انتقال ، انتقال بردار ویژگیهای آیتم از دوره زمانی به دوره زمانی را مدل میکند و خواهیم داشت
(5)
بنابراین (4) را میتوان بهصورت زیر بازنویسی کرد
(6)
ماتریس در رابطه مذکور نیز نامنفی است. با درنظرگرفتن روابط اعتماد در سیستمهای پیشنهاددهنده اجتماعی با فرض آن که ماتریسهای و بهترتیب ماتریسهای ویژگیهای پنهان اعتمادکنندگان و معتمدین در دوره زمانی باشند، با استفاده از تکنیک تجزیه نامنفی ماتریس، ماتریسهای و استخراج گردیده و مقادیر ماتریس اعتماد با محاسبه حاصلضرب قابل پیشبینی و تخمین خواهند بود. با توجه به اینکه کاربران در ماتریس امتیازات، همان کاربران اعتمادکننده در ماتریس اعتماد هستند، فضای ویژگیهای پنهان آنها نیز یکسان در نظر گرفته شده [1] و در نتیجه معادل میباشد. تجزیه نامنفی ماتریس متناظر با مسئله بهینهسازی زیر است
(7)
که ماتریس نامنفی است. همانند (4) با توجه به پویایی علایق کاربران، (7) با استفاده از ماتریس انتقال علایق کاربران از دوره زمانی به بهصورت زیر بازنویسی میشود
(8)
ماتریس در رابطه فوق نامنفی است. برای درنظرگرفتن هر دوی پویایی علایق کاربران و تغییر ویژگیهای اقلام در طول زمان و همچنین اعتماد بین کاربران در پیشبینی و تخمین بهتر امتیازات، (6) و (8) را با هم ترکیب کرده و در نتیجه تابع هدف بهصورت زیر خواهد بود
(9)
(20)
(22)
که ماتریس همانی و بیانگر نرم یک میباشد؛ بهطوری
که است. سه عبارت نخست در (9) بیانگر
میزان خطای تخمین بر مبنای (6) و (8) میباشند. پارامتر میزان تأثیر اعتماد بر علایق کاربران را کنترل میکند. مقادیر بزرگتر برای این پارامتر به معنای تأثیر بیشتر اعتماد بر روی علایق کاربران است. عبارت چهارم در رابطه مذکور، عبارت منظمسازی پویایی زمانی بر اساس ماتریسهای انتقال و میباشد. پارامتر در این عبارت، میزان وابستگی مدل به علایق قبلی کاربران و ویژگیهای قبلی اقلام را کنترل میکند . هرچه مقدار بیشتر باشد، بیانگر وابستگی بیشتر مدل به علایق قبلی کاربران و ویژگیهای قبلی اقلام میباشد. عبارت پنجم، منظمسازی نرم یک است که قید خلوتبودن را روی ماتریسهای تجزیه ، و اعمال میکند. پارامتر تأثیر منظمسازی نرم یک روی تابع هدف را کنترل میکند و عبارت آخر با پارامتر تنظیمسازی ، قید خلوتبودن را روی ماتریسهای و اعمال میکند و . برای سادگی مدل در پیادهسازی در نظر میگیریم.
تابع هدف در (9) بهطور همزمان برای همه متغیرهای ، ، ، و محدب نیست. با وجود این، میتوان یک بهینه محلی برای را با استفاده از روش قواعد بهروزرسانی ضربی 1(MU) [27] بهدست آورد که هر متغیر با ثابت نگهداشتن چهار متغیر دیگر بهروزرسانی میشود. با توجه به شرایط کروش- کان- تاکر 2(KKT) [28] خواهیم داشت
(10)
(11)
(12)
که به معنای ضرب آدامار یا مؤلفه به مؤلفه بوده و نماد بیانگر گرادیان تابع هدف میباشد. این گرادیان نسبت به هر یک از متغیرها عبارت است از
(13)
(14)
(15)
(16)
(17)
که ، ، ، و بهترتیب ترانهاده ماتریسهای ، ، ، و میباشند. با جایگذاری گرادیانهای فوق ((13) تا (17)) در شرایط (12)، قواعد بهروزرسانی (18) تا (22) حاصل میشوند
(18)
(19)
(21)
الگوریتم مدل پیشنهادی در شکل 2 مشاهده میشود. در این الگوریتم
در خطوط 1 و 2، ماتریسهای ویژگی ، و با مقادیر تصادفی نامنفی مقداردهی اولیه میشوند. همچنین ماتریسهای انتقال و نیز با حاصلضرب پارامتر و ماتریس همانی مقداردهی اولیه میگردند. در خط 4، ماتریسهای و با استفاده از تجزیه نامنفی ماتریس بهدست میآیند. الگوریتم بهینهسازی تکراری در خطوط 5 تا 15 انجام میشود. در خطوط 6 تا 10 ماتریسهای ، ، ، و بهروزرسانی میشوند و بر اساس ماتریسهای بهروزشده، در خط 11 تابع هدف محاسبه میشود. در هر تکرار بعد از محاسبه جدید، همگرایی در خط 5 بررسی میشود؛ بهطوری که اگر میزان تغییر بین تکرار فعلی و قبلی بیشتر از مقدار آستانه باشد و یا تعداد دفعات تکرار از مقدار حداکثر تعیینشده (Itermax) کمتر باشد، الگوریتم بهینهسازی تکرار میشود. پس از پایان الگوریتم بهینهسازی در خط 16، ماتریس که شامل امتیازات پیشبینیشده است، محاسبه میگردد.
[1] . Multiplicative Update Rule
[2] . Karush-Kuhn-Tucker Conditions
شکل 2: الگویتم روش پیشنهادی.
5- نتایج ارزیابی
5-1 مجموعه دادهها
بهمنظور ارزیابی مدل پیشنهادی از مجموعه داده Epinions [29] استفاده میکنیم. Epinions.com یک وبسایت معروف بررسی محصولات است که کاربران، نظرات خود درباره محصولات را از طریق امتیازدهی با مقادیر بین یک تا پنج و همچنین توضیحات متنی درباره محصولات بیان میکنند. همچنین هر کاربر یک لیست اعتماد دارد که کاربران مورد اعتماد خود را به آن اضافه کرده و شبکهای از روابط اعتماد بین کاربران بهوجود میآید. Epinions بهعنوان تنها مجموعه داده واقعی و بزرگ شامل اطلاعات امتیازات به اقلام و روابط اعتماد بین کاربران و همچنین زمان امتیازدهی و برقراری اعتماد [12] و [19]، یک منبع داده ایدهآل برای ارزیابی سیستمهای پیشنهاددهنده اجتماعی است [30]. مجموعه داده Epinions مورد استفاده شامل 22166 کاربر است که به حداقل یک آیتم از بین 29677 آیتم در فاصله زمانی 5/7/1999 تا 8/5/2011 امتیاز دادهاند. تعداد کل امتیازات و همچنین روابط اعتماد به ترتیب 922267 و 300548 میباشد. این مجموعه داده به 11 بازه زمانی تقسیم میشود. اطلاعات روابط اعتماد قبل از تاریخ 11/6/2001 در دسترس نیست؛ در نتیجه همه دادههای قبل از این تاریخ بهعنوان اولین بازه زمانی و همچنین دادههای بعد از تاریخ 11/6/2010 نیز بهعنوان آخرین بازه زمانی منظور میشوند. دادههای بین دو تاریخ مذکور نیز به نه بازه زمانی یکساله تقسیم میگردند.
5-2 روش ارزیابی
برای انجام آزمایشها، اطلاعات امتیازات و اعتماد در هر بازه زمانی (بهجز اولین بازه) بهعنوان مجموعه داده تست و همه بازههای زمانی قبل از آن بهعنوان مجموعه آموزشی انتخاب میشوند. بر این اساس 10 مجموعه آموزش/ تست بر روی مجموعه داده Epinions حاصل میشود. میانگین نتایج روی این مجموعهها بهعنوان نتایج نهایی گزارش میگردد. از زبان برنامهنویسی پایتون برای پیادهسازی مدل استفاده شده و آزمایشها بر روی کامپیوتری با پردازنده اینتل 7Corei، 8 گیگابایت حافظه اصلی و سیستم عامل ویندوز 10 صورت پذیرفته است.
بهمنظور ارزیابی و مقایسه دقت مدل پیشنهادی با سایر روشها در پیشبینی و تخمین امتیازات از دو معیار معروف خطای میانگین قدر مطلق 1(MAE) و خطای جذر میانگین مربعات 2(RMSE) استفاده میکنیم. این معیارها بهصورت زیر تعریف میشوند
(23)
(24)
[1] . Mean Absolute Error
[2] . Root Mean Square Error
جدول 2: نتایج ارزیابی روشهای مورد مقایسه برحسب معیارهای MAE و RMSE.
روش پیشنهادی | MTMF | Dui-TMF | TimeTrustSVD | TSCMF | TMF | DMNMF | TimeSVD++ | معیار |
8619/0 | 043/1 | 0847/1 | 0167/1 | 9102/0 | 1027/1 | 1493/1 | 1749/1 | MAE |
- | 36/17 | 54/20 | 23/15 | 31/5 | 84/21 | 01/25 | 64/26 | بهبود (درصد) |
0839/1 | 2721/1 | 279/1 | 2542/1 | 126/1 | 3119/1 | 3096/1 | 3377/1 | RMSE |
- | 79/14 | 25/15 | 58/13 | 74/3 | 38/17 | 23/17 | 97/18 | بهبود (درصد) |
مجموعه امتیازات در مجموعه تست است. مقادیر کوچکتر MAE یا RMSE به معنی دقت بالاتر در پیشبینی امتیازات میباشند.
5-3 روشهای مورد مقایسه
مدل پیشنهادی با روشهای پیشنهاددهنده زمانی زیر مقایسه میشود:
1) روش TimeSVD++ [2]: بهعنوان یک روش پایه با توسعه
روش تجزیه مقدار تکین، پویایی علایق کاربران را در طول زمان استخراج میکند.
2) روش 1DMNMF [17]: روشی مبتنی بر تجزیه نامنفی ماتریس که با یک ماتریس انتقال علایق بین دو دوره زمانی متوالی برای هر کاربر، پویایی زمانی علایق کاربر را مدل میکند.
3) روش 2TMF [10]: این مدل با توسعه روش کاهش گرادیان برای یادگیری ویژگیهای پنهان هر کاربر در یک دوره زمانی خاص و نیز رگرسیون لاسو، پویایی علایق کاربران را استخراج میکند.
4) روش 3TSCMF [1]: مدلی که با یادگیری یک ماتریس انتقال برای هر کاربر خاص، پویایی علایق او بین دو دوره زمانی متوالی را استخراج کرده و با ترکیب امتیازات کاربران و اعتماد بین آنها با استفاده از روش تجزیه ماتریس، امتیازات کاربران به اقلام را پیشبینی میکند.
5) روش 4TimeTrustSVD [25]: یک مدل مبتنی بر تجزیه مقدار تکین که با درنظرگرفتن تأثیرات زمان بر ویژگیهای کاربران و نیز اقلام، اطلاعات امتیازدهی، اعتماد و زمان را برای مدلسازی پویایی علایق کاربر با هم ترکیب میکند.
6) روش dui-TMF [3]: روشی مبتنی بر تجزیه ماتریس که با این فرض که الگوی تغییر علایق هر کاربر و ویژگیهای هر آیتم متفاوت است، هر دوی تغییرات علایق کاربران و ویژگیهای اقلام در طول زمان را برای پیشبینی امتیازات کاربران در نظر میگیرد.
7) روش 5MTMF [4]: این روش با کاهش تأثیر علایق قدیمیتر کاربران در تعیین علایق فعلی آنها، پویایی علایق کاربران و تغییر ویژگیهای اقلام را با یادگیری ماتریسهای انتقال ویژگیهای پنهان کاربران و اقلام بین دوره زمانی فعلی و همه دورههای زمانی قبلی با استفاده از روش تجزیه ماتریس مدل میکند.
مناسبترین مقدار برای هر یک از پارامترهای مربوط به هر روش توسط ارائهدهندگان آن روش تعیین شده و یا با آزمایش توسط ما بهدست میآیند. نرخ یادگیری در روشهای TimeSVD++، TMF، TSCMF، TimeTrustSVD و dui-TMF بهترتیب مقادیر 003/0، 002/0، 003/0، 001/0 و 003/0 انتخاب شد. در روش TSCMF، و انتخاب و در روش MTMF، ، و منظور شد. برای پارامترهای ، Itermax و در مدل پیشنهادی بهترتیب مقادیر 5، 105 و 5-10 انتخاب شد. بهمنظور مقایسه عادلانه روشها، اندازه بعد فضای ویژگیهای پنهان در همه روشها برابر 10 و مقدار پارامتر منظمسازی برابر 001/0 در نظر گرفته شد.
5-4 نتایج
کارایی روشهای مقایسهشده برحسب MAE و RMSE بر روی مجموعه داده Epinions در جدول 2 مشاهده میشوند. سطر بهبود در این جدول، درصد بهبودی را که در مدل پیشنهادی نسبت به سایر روشهای مقایسهشده حاصل میشود نشان میدهد. همان طور که مشاهده میشود، مدل پیشنهادی عملکرد بهتری در مقایسه با سایر روشها در جدول مذکور برحسب هر دو معیار MAE و RMSE دارد. روشهای TimeSVD++، DMNMF و TMF که فقط پویایی زمانی علایق کاربران را در نظر گرفته و همچنین از هیچ اطلاعات جانبی از قبیل اعتماد استفاده نمیکنند، عملکرد ضعیفی در استخراج علایق پویای کاربران داشتهاند. مدل پیشنهادی با اختلاف چشمگیری در مقادیر MAE و RMSE بر این روشها برتری دارد. این اختلاف قابل توجه بیانگر این نتیجه است که درنظرگرفتن هر دوی پویایی علایق کاربران و تغییر ویژگیهای اقلام و همچنین استفاده از روابط اعتماد بین کاربران میتواند به بهبود دقت پیشبینی در سیستمهای پیشنهاددهنده کمک کند.
نتایج جدول 2 نشان میدهند که روشهای dui-TMF و MTMF که هر دوی پویایی زمانی علایق کاربران و تغییر ویژگیهای اقلام در طول زمان را در استخراج علایق پویای کاربران مورد توجه قرار میدهند، عملکرد بهتری نسبت به روشهای TimeSVD++، DMNMF و TMF داشتهاند. این نتیجه به این معناست که برای دستیابی به پیشنهادهای دقیقتر و واقع بینانهتر به کاربران، درنظرگرفتن همزمان تغییرات پویای علایق کاربران و ویژگیهای اقلام مفید است. با وجود این، دو روش dui-TMF و MTMF از کارایی پایینتری در مقایسه با مدل پیشنهادی برخوردار هستند. مدل پیشنهادی با بهبود بهترتیب 54/20 درصد و 25/15 درصد برای مقادیر MAE و RMSE نسبت به روش dui-TMF و بهترتیب 36/17 درصد و 79/14 درصد برای مقادیر MAE و RMSE نسبت به روش MTMF، اختلاف قابل ملاحظهای با این دو روش دارد. علت اصلی برتری مدل پیشنهادی نسبت به روشهای dui-TMF و MTMF میتواند بهدلیل استفاده از اعتماد در مدل پیشنهادی باشد. تعداد امتیازات کاربران به اقلام در هر بازه زمانی اندک است. استفاده از اعتماد در مدل پیشنهادی موجب کاهش مشکل خلوتی دادهها شده و دقت پیشبینی را بهبود میدهد. روشهای مبتنی بر اعتماد TimeTrustSVD و TSCMF نیز که کارایی بهتری نسبت به روشهای TimeSVD++، DMNMF، TMF، dui-TMF و MTMF دارند، اهمیت نقش اعتماد را در بهبود کارایی سیستمهای پیشنهاددهنده نشان میدهند. علیرغم این که روش TimeTrustSVD علاوه بر استفاده از اعتماد، همانند مدل
(الف)
(ب)
[1] . Dynamic Multi-Task Non-Negative Matrix Factorization
[2] . Temporal Matrix Factorization
[3] . Temporal and Social Collective Matrix Factorization
[4] . Singular Value Decomposition with Time and Trust
[5] . Multi-Trans Matrix Factorization
شکل 3: تأثیر مقادیر مختلف پارامتر بر دقت مدل پیشنهادی.
جدول 3: مقادیر آزمون t-test بین نتایج مدل پیشنهادی و روشهای مورد مقایسه.
MTMF | Dui-TMF | TimeTrustSVD | TSCMF | TMF | DMNMF | TimeSVD++ | معیار |
0093/0 | 0 | 0 | 0031/0 | 0 | 0034/0 | 0 | MAE |
0075/0 | 0 | 0028/0 | 0014/0 | 0 | 0411/0 | 0019/0 | RMSE |
پيشنهادي بهصورت همزمان، پويايي علايق كاربران و تغييرات
ويژگيهاي اقلام در طول زمان را در استخراج علايق پوياي كاربران مورد توجه قرار ميدهد، برحسب هر دو معیار MAE و RMSE دقتی کمتر از مدل پیشنهادی دارد. برتری مدل پیشنهادی بیانگر این است که درنظرگرفتن الگوی منحصربهفرد تغییر علایق برای هر کاربر و همچنین یادگیری ویژگیهای پنهان کاربران و اقلام در بازه زمانی فعلی با استفاده از دادههای بازه زمانی قبلی در رویکرد پیشنهادی، در بهبود دقت پیشبینی مؤثر بوده است.
نتایج نشان میدهند که روش TSCMF بهترین عملکرد را بعد از مدل پیشنهادی دارد. عملکرد بهتر روش TSCMF در مقایسه با شش روش دیگر میتواند به این دلیل باشد که در روش TSCMF همانند مدل پیشنهادی، هر کاربر تغییر الگوی علایق منحصربهفرد خود را دارد و فقط از ترکیب امتیازات و روابط اعتماد بین کاربران در بازه زمانی قبلی برای یادگیری ویژگیهای پنهان در بازه زمانی فعلی استفاده شده است. با
وجود این، درنظرگرفتن هر دوی پویایی زمانی علایق کاربران و تغییر ویژگیهای اقلام در طول زمان در مدل پیشنهادی باعث برتری آن بر روش TSCMF شده است. هرچند میزان بهبود در مدل پیشنهادی نسبت به روش TSCMF برحسب MAE و RMSE بهترتیب 31/5 درصد و 74/3 درصد است، این میزان بهبود کم نیز میتواند تأثیر قابل ملاحظهای در کیفیت پیشنهادهای ارائهشده توسط سیستمهای پیشنهاددهنده در واقعیت داشته باشد [2].
با استفاده از آزمون آماری زوجی، معناداربودن میزان بهبود عملکرد در مدل پیشنهادی در مقایسه با سایر روشها بررسی شد. این آزمون بین مقادیر MAE و RMSE مدل پیشنهادی و هر یک از روشهای مورد مقایسه با درنظرگرفتن سطح معناداری برابر با 05/0 انجام شد. جدول 3 مقادیر بهدست آمده را نشان میدهد. از آنجا که این مقادیر کمتر از 05/0 هستند میتوان نتیجه گرفت که بهبود عملکرد در مدل پیشنهادی نسبت به روشهای مقایسهشده از نظر آماری معنادار است.
بهطور خلاصه، نتایج آزمایشها نشان میدهند مدل پیشنهادی نسبت به روشهای مقایسهشده در استخراج و مدلکردن علایق پویای کاربران بهتر عمل کرده و با کاهش مشکل خلوتی دادهها موجب بهبود دقت در پیشبینی امتیازات در سیستمهای پیشنهاددهنده میگردد.
5-5 تأثیر پارامتر
میزان تأثیر اعتماد بر علایق کاربران توسط پارامتر کنترل میشود. بهمنظور بررسی تأثیر مقادیر مختلف این پارامتر بر دقت مدل پیشنهادی، کارایی مدل برحسب هر دو معیار MAE و RMSE بهازای مقادیر 1/0، 2/0، 5/0، 1، 2، 5، 10 و 20 برای پارامتر ارزیابی شد. مقادیر کمتر برای باعث اعمال اثر کمتر اعتماد بر روی علایق کاربران و مقادیر بیشتر برای این پارامتر باعث اعمال اثر بیشتر اعتماد بر روی علایق کاربران میگردد. شکل 3 نتایج حاصل را نشان میدهد. نتایج بهدست آمده بیانگر آن است که پارامتر تأثیر قابل ملاحظهای بر دقت مدل دارد و ترکیب امتیازات و اطلاعات اعتماد میتواند باعث بهبود دقت مدل گردد. همان طور که در شکل 3 مشاهده میشود در ابتدا و با افزایش مقدار از 1/0 تا 5، میانگین MAE و RMSE تنزل یافته و پس از آن با افزایش مقدار ، میانگین MAE و RMSE روند صعودی دارد. به عبارتی، کارایی مدل پیشنهادی با افزایش مقدار افزایش یافته و در مقدار 5 بهترین عملکرد را دارد و پس از آن با افزایش مقدار ، کارایی مدل کاهش مییابد.
6- نتیجهگیری و کارهای آتی
تطبیقدادن سیستمهای پیشنهاددهنده با پویایی علایق کاربران و ویژگیهای اقلام که دائماً در حال تغییر هستند، ضروری بوده و موجب ارائه پیشنهادهایی نزدیکتر به ترجیحات و تمایلات کاربران میگردد.
در این پژوهش با درنظرگرفتن هر دوی پویایی علایق کاربران و تغییر ویژگیهای اقلام در طول زمان، مدلی مبتنی بر تجزیه ماتریس برای پیشبینی دقیقتر امتیازات کاربران به اقلام در سیستمهای پیشنهاددهنده ارائه گردید که علاوه بر امتیازات کاربران به اقلام، از روابط اعتماد بین کاربران برای برخورد با مشکل خلوتی دادهها استفاده میکند. نتایج ارزیابی بیانگر این است که مدل پیشنهادی در استخراج و مدلکردن پویایی علایق کاربران و ویژگیهای اقلام بهتر عمل کرده و باعث بهبود دقت در پیشبینی امتیازات گردیده است. به عبارتی، استفاده همزمان از پویایی علایق کاربران و تغییرات ویژگیهای اقلام در ارائه پیشنهادهای واقعبینانهتر به کاربران مفید بوده است. علاوه بر این، هر کاربر و هر قلم آیتم، روند تغییرات مخصوص به خود را دارد و درنظرگرفتن الگوی منحصربهفرد تغییر علایق برای هر کاربر و همچنین ویژگیهای هر قلم آیتم در طول زمان در مدل پیشنهادی، در بهبود دقت پیشبینی مؤثر بوده است.
برای کارهای آتی، توسعه مدل پیشنهادی بهمنظور برخورد با مشکل کاربران شروع سرد در وضعیتی که هیچ دادهای از امتیازات و روابط اعتماد مربوط به زمانهای گذشته از برخی کاربران وجود ندارد، مورد توجه است. بدین منظور، استفاده از سایر اطلاعات جانبی مثل ویژگیهای دموگرافی کاربران مفید خواهد بود. همچنین اعمال میزان تأثیرپذیری هر کاربر از افراد مورد اعتمادش در مدل پیشنهادی مد نظر است.
مراجع
[1] H. Tahmasbi, M. Jalali, and H. Shakeri, "TSCMF: temporal and social collective matrix factorization model for recommender systems," J. Intell. Inf. Syst., vol. 56, no. 1, pp. 169-187, Feb. 2021.
[2] Y. Koren, "Collaborative filtering with temporal dynamics," Commun. ACM, vol. 53, no. 4, pp. 89-97, Apr. 2010.
[3] I. Rabiu, N. Salim, A. Da'u, A. Osman, and M. Nasser, "Exploiting dynamic changes from latent features to improve recommendation using temporal matrix factorization," Egypt. Informatics J., vol. 22, no. 3, pp. 285-294, Sept. 2021.
[4] J. Zhang and X. Lu, "A multi-trans matrix factorization model with improved time weight in temporal recommender systems," IEEE Access, vol. 8, pp. 2408-2416, 2020.
[5] Z. Jin, Y. Zhang, W. Mu, W. Wang, and H. Jin, "Leveraging the dynamic changes from items to improve recommendation," in Proc. 37th Int. Conf. on Conceptual Modeling, pp. 507-520, Xi'an, China, 22-25 Oct. 2018.
[6] T. Wu, Y. Feng, J. Sang, B. Qiang, and Y. Wang, "A novel recommendation algorithm incorporating temporal dynamics, reviews and item correlation," IEICE Trans. Inf. Syst., vol. E101-D,
no. 8, pp. 2027-2034, 2018.
[7] I. Rabiu, N. Salim, A. Da'u, and A. Osman, "Recommender system based on temporal models: a systematic review," Appl. Sci., vol. 10, no. 7, pp. 1-27, Apr. 2020.
[8] I. Rabiu, N. Salim, A. Da'u, and M. Nasser, "Modeling sentimental bias and temporal dynamics for adaptive deep recommendation system," Expert Syst. Appl., vol. 191, no. C, Article ID: 116262, Apr. 2022.
[9] D. Rafailidis, P. Kefalas, and Y. Manolopoulos, "Preference dynamics with multimodal user-item interactions in social media recommendation," Expert Syst. Appl., vol. 74, no. C, pp. 11-18, May 2017.
[10] Y. Y. Lo, W. Liao, C. S. Chang, and Y. C. Lee, "Temporal matrix factorization for tracking concept drift in individual user preferences," IEEE Trans. Comput. Soc. Syst., vol. 5, no. 1, pp. 156-168, Mar. 2018.
[11] C. Wangwatcharakul and S. Wongthanavasu, "A novel temporal recommender system based on multiple transitions in user preference drift and topic review evolution," Expert Syst. Appl., vol. 241, no. C, Article ID: 115626, Apr. 2021.
[12] ح. طهماسبي، م. جلالي و ح. شاكري، "یک سامانه پیشنهاددهنده اجتماعی مبتنی بر تجزیه ماتریس با درنظرگرفتن پویایی علایق کاربران، "پردازش علائم و دادهها، سال 18، شماره 1، صص. 28-13، خرداد 1400.
[13] S. Sheibani, H. Shakeri, and R. Sheibani, "Four-dimensional trust propagation model for improving the accuracy of recommender systems," J. Supercomput., vol. 79, pp. 16793-16820, 2023.
[14] C. Zhang, K. Wang, H. Yu, J. Sun, and E. P. Lim, "Latent factor transition for dynamic collaborative filtering," in Proc. of the SIAM Int. Conf. on Data Mining, pp. 452-460, Philadelfia, PA, USA24-26 Apr. 2014.
[15] C. Zhang, Improving Recommender Systems with Rich Side Information, Simon Fraser University, 2015.
[16] Z. Chen and S. Wang, "A review on matrix completion for recommender systems," Knowl. Inf. Syst., vol. 64, no. 1, pp. 1-34, Jan. 2022.
[17] B. Ju, Y. Qian, M. Ye, R. Ni, and C. Zhu, "Using dynamic multi-task non-negative matrix factorization to detect the evolution of user preferences in collaborative filtering," PLoS One, vol. 10, no. 8, Article ID: 0135090, 2015.
[18] H. Bao, Q. Li, S. S. Liao, S. Song, and H. Gao, "A new temporal and social PMF-based method to predict users' interests in micro-blogging," Decis. Support Syst., vol. 55, no. 3, pp. 698-709, Jun. 2013.
[19] A. Y. Aravkin, K. R. Varshney, and L. Yang, "Dynamic matrix factorization with social influence," in Proc. IEEE Int. Workshop on Machine Learning for Signal Processing, 6 pp., Vietri sul Mare, Italy, 13-16 Sept. 2016.
[20] D. Rafailidis and A. Nanopoulos, "Modeling users' preference dynamics and side information in recommender systems," IEEE Trans. Syst. Man, Cybern. Syst., vol. 46, no. 6, pp. 782-792, Jun. 2016.
[21] L. Xiong, X. Chen, T. K. Huang, J. Schneider, and J. G. Carbonell, "Temporal collaborative filtering with bayesian probabilistic tensor factorization," in Proc. of the SIAM Int. Conf. on Data Mining, pp. 211-222, Colombus, OH, USA, 29 Apr.-1 May 2010.
[22] J. Zhao, S. Yang, H. Huo, Q. Sun, and X. Geng, "TBTF: an effective time-varying bias tensor factorization algorithm for recommender system," Appl. Intell., vol. 51, no. 7, pp. 4933-4944, 2021.
[23] H. Tahmasbi, M. Jalali, and H. Shakeri, "Modeling user preference dynamics with coupled tensor factorization for social media recommendation," J. Ambient Intell. Humaniz. Comput., vol. 12,
no. 10, pp. 9693-9712, 2021.
[24] S. Yu, Z. Zhou, B. Chen, and L. Cao, "Generalized temporal similarity-based nonnegative tensor decomposition for modeling transition matrix of dynamic collaborative filtering," Inf. Sci. (Ny), vol. 632, pp. 340-357, Jun. 2023.
[25] C. Tong, J. Qi, Y. Lian, J. Niu, and J. J. P. C. Rodrigues, "TimeTrustSVD: a collaborative filtering model integrating time, trust and rating information," Futur. Gener. Comput. Syst., vol. 93, pp. 933-941, Apr. 2019.
[26] D. Lee and H. S. Seung, "Algorithms for non-negative matrix factorization," in Proc. of the 13th Int. Conf. on Neural Information Processing Systems, pp. 535-541, Denver, CO, USA, 1-1 Jan. 2000.
[27] D. D. Lee and H. S. Seung, "Learning the parts of objects by non-negative matrix factorization," Nature, vol. 401, pp. 788-791, 1999.
[28] H. W. Kuhn and A. W. Tucker, "Nonlinear programming," in Proc. of the 2nd Berkeley Symp. on Mathematical Statistics and Probability, vol. 1951, pp. 481-492, 1951.
[29] J. Tang, Epinions Dataset, [Online]. Available: http://www.cse.msu.edu/~tangjili/trust.html. [Accessed: 11-Feb-2022].
[30] H. Ma, T. C. Zhou, M. R. Lyu, and I. King, "Improving recommender systems by incorporating contextual information," ACM Trans. Inf. Syst., vol. 29, no. 2, Article ID: 9, 23 pp., Apr. 2011.
حمیدرضا طهماسبی مدرک دکتری خود را در رشتهی مهندسی کامپیوتر گرایش سیستمهای نرمافزاری در سال 1397 از دانشگاه آزاد اسلامی اخذ و از سال 1388 عضو هیأت علمی دانشگاه آزاد اسلامی بوده و هماکنون استادیار گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد کاشمر میباشد. زمینههای پژوهشی مورد علاقهی ایشان یادگیری ماشین، علم داده، انفورماتیک سلامت، سیستمهای پیشنهاددهنده، و مهندسی نرمافزار میباشد.