بهبود دقت سيستمهای پیشنهاددهنده با تخمین اعتماد آگاه از زمان، مکان و زمینه بر اساس خوشه بندی و توزیع بتا
محورهای موضوعی : مهندسی برق و کامپیوترسمانه شیبانی 1 , حسن شاکری 2 * , رضا شیبانی 3
1 - گروه مهندسي كامپيوتر، دانشگاه آزاد اسلامی واحد مشهد
2 - گروه مهندسي كامپيوتر، دانشگاه آزاد اسلامی واحد مشهد
3 - گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی واحد مشهد
کلید واژه: اعتماد, پيشنهاد آگاه از زمينه, توزيع بتا, خوشهبندي, سيستمهاي پيشنهاددهنده,
چکیده مقاله :
در دهههاي اخير رويكرد محاسبه و اعمال اعتماد بين كاربران در طراحي سيستمهاي پيشنهاددهنده مورد توجه محققان قرار گرفته است. با وجود اين، اغلب سيستمهاي پيشنهاددهنده مبتني بر اعتماد فقط از يك فاكتور براي تخمين مقدار اعتماد استفاده ميكنند. در اين مقاله يك رويكرد چندفاكتوري براي تخمين اعتماد بين كاربران سيستمهاي پيشنهاددهنده ارائه ميشود. در طرح پيشنهادي، ابتدا كاربران سيستم براساس شباهت مبتني بر اطلاعات دموگرافيك و تاريخچه ارزشيابيها خوشهبندي ميشوند. براي تخمين ارزشيابي كاربر فعال به يك آيتم خاص، مقدار اعتماد بين او و ساير كاربران همخوشهاش با درنظرگرفتن فاكتورهاي زمان، مكان، و زمينه ارزشيابي محاسبه ميشود. براي اين منظور، ما الگوريتمي مبتني بر توزيع بتا معرفي ميكنيم. يك معيار مبتني بر درخت جديد براي محاسبه شباهت معنايي بين زمينهها مورد استفاده قرار ميگيرد. در نهايت، ارزشيابي كاربر فعال با استفاده از ميانگينگيري وزني تخمين زده ميشود كه مقادير اعتماد به عنوان وزن در ميانگينگيري منظور ميشوند. طرح پيشنهادي بر روي سه مجموعهداده مطرح اجرا شده و ارزيابي و مقايسه نشان ميدهد كه اين طرح نتايج بهتري از نظر ملاكهاي دقت و كارآمدي نسبت به روشهاي موجود ارائه ميكند.
Calculation and applying trust among users has become popular in designing recommender systems in recent years. However, most of the trust-based recommender systems use only one factor for estimating the value of trust. In this paper, a multi-factor approach for estimating trust among users of recommender systems is introduced. In the proposed scheme, first, users of the system are clustered based on their similarities in demographics information and history of ratings. To predict the rating of the active user into a specific item, the value of trust between him and the other users in his cluster is calculated considering the factors i.e. time, location, and context of their rating. To this end, we propose an algorithm based on beta distribution. A novel tree-based measure for computing the semantic similarity between the contexts is utilized. Finally, the rating of the active user is predicted using weighted averaging where trust values are considered as weights. The proposed scheme was performed on three datasets, and the obtained results indicated that it outperforms existing methods in terms of accuracy and other efficiency metrics.
1. Yao, L., Xu, Z., Zhou, X., & Lev, B., Synergies Between Association Rules and Collaborative Filtering in Recommender System: An Application to Auto Industry. Data Science and Digital Business, 2019: p. 16.
2. Rubens, N., et al., Active learning in recommender systems, in Recommender systems handbook. 2015, Springer. p. 809-846.
3. Li, Y.-M., C.-T. Wu, and C.-Y. Lai, A social recommender mechanism for e-commerce: Combining similarity, trust, and relationship. Decision Support Systems, 2013. 55(3): p. 740-752.
4. Savage, N.S., et al., I’m feeling loco: A location based context aware recommendation system, in Advances in Location-Based Services. 2012, Springer. p. 37-54.
5. Bączkiewicz, A., et al., Methodical Aspects of MCDM Based E-Commerce Recommender System. Journal of Theoretical and Applied Electronic Commerce Research, 2021. 16(6): p. 2192-2229.
6. Elahi, M., et al., User Preference Elicitation, Rating Sparsity and Cold Start. 2018.
7. Antolić, G. and L. Brkić. Recommender system based on the analysis of publicly available data. in 2017 40th International Convention on Information and Communication Technology, Electronics and Microelectronics (MIPRO). 2017. IEEE.
8. Wangwatcharakul, C. and S. Wongthanavasu, A novel temporal recommender system based on multiple transitions in user preference drift and topic review evolution. Expert Systems with Applications, 2021. 185: p. 115626.
9. Nilashi, M., O. Ibrahim, and K. Bagherifard, A recommender system based on collaborative filtering using ontology and dimensionality reduction techniques. Expert Systems with Applications, 2018. 92: p. 507-520.
10. Zheng, X.-L., et al., A hybrid trust-based recommender system for online communities of practice. IEEE Transactions on Learning Technologies, 2015. 8(4): p. 345-356.
11. Sani, N.S. and F.N. Tabriz, A new strategy in trust-based recommender system using k-means clustering. International Journal of Advanced Computer Science And Applications, 2017. 8(9): p. 152-156.
12. Nobahari, V., M. Jalali, and S.J.S. Mahdavi, ISoTrustSeq: a social recommender system based on implicit interest, trust and sequential behaviors of users using matrix factorization. Journal of Intelligent Information Systems, 2019. 52(2): p. 239-268.
13. AlBanna, B., et al., Interest aware location-based recommender system using geo-tagged social media. ISPRS International Journal of Geo-Information, 2016. 5(12): p. 245.
14. Celdrán, A.H., et al., Design of a recommender system based on users’ behavior and collaborative location and tracking. Journal of Computational Science, 2016. 12: p. 83-94.
15. Khazaei, E. and A. Alimohammadi, An automatic user grouping model for a group recommender system in location-based social networks. ISPRS international journal of geo-information, 2018. 7(2): p. 67.
16. Gao, H., et al. Content-aware point of interest recommendation on location-based social networks. in Twenty-ninth AAAI conference on Artificial Intelligence. 2015.
17. Tahmasbi, H., M. Jalali, and H. Shakeri. Modeling temporal dynamics of user preferences in movie recommendation. in 2018 8th International Conference on Computer and Knowledge Engineering (ICCKE). 2018. IEEE.
18. Kefalas, P. and Y. Manolopoulos, A time-aware spatio-textual recommender system. Expert Systems with Applications, 2017. 78: p. 396-406.
19. Fard, K.B., et al., Recommender System Based on Semantic Similarity. International Journal of Electrical & Computer Engineering (2088-8708), 2013. 3(6).
20. Urena, R., et al., A review on trust propagation and opinion dynamics in social networks and group decision making frameworks. Information Sciences, 2019. 478: p. 461-475.
21. Ghavipour, M. and M.R. Meybodi, A dynamic algorithm for stochastic trust propagation in online social networks: Learning automata approach. Computer Communications, 2018. 123: p. 11-23.
22. Xue, H., et al., Content-aware trust propagation toward online review spam detection. Journal of Data and Information Quality (JDIQ), 2019. 11(3): p. 1-31.
23. Ying, H., et al., Time-aware metric embedding with asymmetric projection for successive POI recommendation. World Wide Web, 2019. 22(5): p. 2209-2224.
24. Rafailidis, D. and A. Nanopoulos, Modeling users preference dynamics and side information in recommender systems. IEEE Transactions on Systems, Man, and Cybernetics: Systems, 2015. 46(6): p. 782-792.
25. Adomavicius, G. and A. Tuzhilin, Context-aware recommender systems, in Recommender systems handbook. 2011, Springer. p. 217-253.
26. Lathia, N., et al. Temporal diversity in recommender systems. in Proceedings of the 33rd international ACM SIGIR conference on Research and development in information retrieval. 2010.
27. Xiong, L., et al. Temporal collaborative filtering with bayesian probabilistic tensor factorization. in Proceedings of the 2010 SIAM international conference on data mining. 2010. SIAM.
28. Roy, F., A Comparative Analysis of Different Trust Metrics in User-User Trust-Based Recommender System. 2020.
29. Bedi, P., Combining trust and reputation as user influence in cross domain group recommender system (CDGRS). Journal of Intelligent & Fuzzy Systems, 2020. 38(5): p. 6235-6246.
30. Richa and P. Bedi, Trust and Distrust based Cross-domain Recommender System. Applied Artificial Intelligence, 2021. 35(4): p. 326-351.
31. El Yebdri, Z., et al., Context-aware recommender system using trust network. Computing, 2021: p. 1-19.
32. Asani, E., H. Vahdat-Nejad, and J. Sadri, Restaurant recommender system based on sentiment analysis. Machine Learning with Applications, 2021. 6: p. 100114.
33. Cardoso, I.M.G., Vulcont: A Recommender System based on Contexts History Ontology. 2017.
34. Seo, Y.-D. and Y.-S. Cho, Point of interest recommendations based on the anchoring effect in location-based social network services. Expert Systems with Applications, 2021. 164: p. 114018.
35. Milias, V. and A. Psyllidis, Assessing the influence of point-of-interest features on the classification of place categories. Computers, Environment and Urban Systems, 2021. 86: p. 101597.
36. Han, P., et al., Point-of-interest recommendation with global and local context. IEEE Transactions on Knowledge and Data Engineering, 2021.
37. Agrawal, S., D. Roy, and M. Mitra, Tag embedding based personalized point of interest recommendation system. Information Processing & Management, 2021. 58(6): p. 102690.
38. Fang, W., et al., A resilient trust management scheme for defending against reputation time-varying attacks based on BETA distribution. Science China Information Sciences, 2017. 60(4): p. 1-11.
39. Moe, M.E., B.E. Helvik, and S.J. Knapskog. Comparison of the beta and the hidden markov models of trust in dynamic environments. in IFIP International Conference on Trust Management. 2009. Springer.
40. Wu, X., et al., BLTM: beta and LQI based trust model for wireless sensor networks. IEEE Access, 2019. 7: p. 43679-43690.
41. Wu, Z. and M. Palmer. V Verbs semantics and lexical selection. in Proceedings of the 32nd annual meeting on Association for Computational Linguistics. 1994.
42. Yelp Challenge Dataset. 2018.
43. Liu, Y., et al., An experimental evaluation of point-of-interest recommendation in location-based social networks. Proceedings of the VLDB Endowment, 2017. 10(10): p. 1010-1021.
44. Cho, E., S.A. Myers, and J. Leskovec. Friendship and mobility: user movement in location-based social networks. in Proceedings of the 17th ACM SIGKDD international conference on Knowledge discovery and data mining. 2011.
45. Ardissono, L. and N. Mauro, A compositional model of multi-faceted trust for personalized item recommendation. Expert Systems with Applications, 2020. 140: p. 112880.
67 نشریه مهندسی برق و مهندسی کامپیوتر ایران، ب- مهندسی کامپیوتر، سال 21، شماره 1، بهار 1402
مقاله پژوهشی
بهبود دقت سیستمهای پیشنهاددهنده با تخمین اعتماد آگاه از زمان، مکان و زمینه بر اساس خوشهبندی و توزیع بتا
سمانه شیبانی، حسن شاکری و رضا شیبانی
چکیده: در دهههاي اخير، رويکرد محاسبه و اعمال اعتماد بين کاربران در طراحي سيستمهاي پيشنهاددهنده مورد توجه محققان قرار گرفته است. با وجود اين، اغلب سيستمهاي پيشنهاددهنده مبتني بر اعتماد فقط از يک فاکتور براي تخمين مقدار اعتماد استفاده ميکنند. در اين مقاله يک رويکرد چندفاکتوري براي تخمين اعتماد بين کاربران سيستمهاي پيشنهاددهنده ارائه ميگردد که در طرح پيشنهادي، ابتدا کاربران سيستم بر اساس شباهت مبتني بر مشخصات و تاريخچه ارزشيابيها خوشهبندي ميشوند. براي تخمين ارزشيابي کاربر فعال به يک آيتم خاص، مقدار اعتماد بين او و ساير کاربران همخوشهاش با درنظرگرفتن فاکتورهاي زمان، مکان و زمينه ارزشيابي محاسبه ميشود. براي اين منظور، ما الگوريتمي مبتني بر توزيع بتا معرفي ميکنيم و يک معيار مبتني بر درخت جديد براي محاسبه شباهت معنايي بين زمينهها مورد استفاده قرار ميگيرد. در نهايت، ارزشيابي کاربر فعال با استفاده از ميانگينگيري وزني تخمين زده ميشود که مقادير اعتماد به عنوان وزن در ميانگينگيري منظور ميشوند. طرح پيشنهادي
بر روي سه مجموعه داده مطرح اجرا شده و ارزيابي و مقايسه نشان ميدهد که اين طرح، نتايج بهتري را از نظر ملاکهاي دقت و کارآمدي نسبت به روشهاي موجود ارائه ميکند.
کلیدواژه: اعتماد، پيشنهاد آگاه از زمينه، توزيع بتا، خوشهبندي، سيستمهاي پيشنهاددهنده.
1- مقدمه
در دهههاي اخير، توسعه و استفاده از سيستمهاي پيشنهاددهنده گسترش يافته است. اين سيستمها به کاربران کمک ميکنند تا اقلام و خدمات مورد علاقه خود را در حوزههاي کاربردي مختلف پيدا و انتخاب کنند. سيستمهاي پيشنهاددهنده از تکنيکهاي مبتني بر هوش مصنوعي بهره ميبرند تا حدس بزنند که يک کاربر احتمالاً به چه اقلامي علاقهمند خواهد بود و سپس اين اقلام را به کاربر پيشنهاد ميکنند. همچنين اين سيستمها با دنبالکردن واکنش و بازخورد کاربران نسبت به اقلام پيشنهادي در مورد ترجيحات کاربران ياد ميگيرند.
پالايش مشارکتي (CF)، يک رويکرد متداول مورد استفاده در سيستمهاي پيشنهاددهنده است. ايده اصلي در CF آن است که بر اساس شباهتهاي کاربر- کاربر و آيتم- آيتم، اقلامي به کاربر پيشنهاد شود [1] تا [5]. سيستمهاي پيشنهاددهنده مبتني بر پالايش مشارکتي بر اساس رفتار گذشته کاربر هدف و ساير کاربران، يک مدل ميسازند و سپس از اين مدل براي پيشبيني علايق کاربر استفاده ميکنند. اما به دليل مشکلات خلوتي دادهها و شروع سرد، رويکرد CF يک راه حل بيعيب و بدون نقص براي ارائه توصيههاي دقيق نيست [6] تا [9].
راه حلهاي مختلفي براي حل اين مشکلات توسط پژوهشگران پيشنهاد شده است. يکي از موفقترين تکنيکها در اين زمينه، واردکردن استنتاج اعتماد در رويکرد پالايش مشارکتي سنتي است [10] تا [12]. با وجود اين، اغلب سيستمهاي پيشنهاددهنده مبتني بر اعتماد فقط از يک فاکتور براي تخمين مقدار اعتماد استفاده ميکنند.
از طرف دیگر، پیشرفتهای اخیر در فناوریهای موبایل و ردیابی موقعیت مکانی، امکان توسعه سیستمهای پیشنهاددهنده مبتنی بر مکان را فراهم آوردهاند. به عنوان نمونه در چند کار تحقیقاتی مختلف، راهکارهایی مبنی بر درنظرگرفتن مکان کاربر، اطلاعات جغرافیایی و حرکت کاربر
پس از دریافت پیشنهادها به منظور بهبود صحت توصیههای سیستمهای پیشنهاددهنده و حل مشکل شروع سرد ارائه شده است [13] تا [16].
یک زمینه تحقیقاتی دیگر در حوزه سیستمهای پیشنهاددهنده، درنظرگرفتن پارامتر زمان برای شناسایی علایق کاربر است. در مدل ارائهشده برای اعمال پویایی زمانی ترجیحات کاربران از یک چارچوب تجزیه تنسور برای مدلسازی استفاده شده است [17]. در این مدل، وزن ترجیحات و ارزشیابیهای کاربر در گذشته بر مبنای یک ضریب فرسایش مبتنی بر زمان کاهش مییابد. همچنین در پژوهش دیگری، مؤلفان دو مدل را برای پیشنهاد POI ارائه کردهاند و هر دو فاکتور مکان و زمان را در نظر گرفتهاند [18].
همچنین برخی از کارهای تحقیقاتی اخیر از اعمال مفهوم زمینه و دسته (رده) اقلام و رابطه و شباهت بین زمینهها به عنوان یک رویکرد کارآمد برای دستیابی به توصیههای دقیقتر استفاده میکنند. به عنوان نمونه در مدل ارائهشده برای سیستم پیشنهاددهنده مبتنی بر روابط معنایی [19]، یک معیار شباهت معنایی برای یافتن همسایههای کاربر هدف و اقلام مورد علاقه وی پیشنهاد شده است.
کارآمدي و دقت سيستمهاي پيشنهاددهنده مبتني بر اعتماد با درنظرگرفتن پارامترهاي مختلف در تخمين اعتماد ميتواند بهبود يابد. مشخصاً درنظرگرفتن تأثير فاصله مکاني، زماني و زمينهاي در محاسبه اعتماد در اين راستا ميتواند مفيد باشد. در اين مقاله، يک رويکرد چندفاکتوري براي تخمين اعتماد بين کاربران سيستمهاي پيشنهاددهنده معرفي ميشود. در طرح پيشنهادي، ابتدا کاربران سيستم بر اساس شباهتهاي آنها از نظر مشخصات و تاريخچه ارزشيابيها، خوشهبندي
شکل 1: یک شبکه اعتماد نمونه.
ميشوند. براي تخمين ارزشيابي کاربر فعال به يک آيتم خاص، مقدار اعتماد بين او و ساير کاربران واقع در خوشه او با درنظرگرفتن فاکتورهاي زمان، مکان و زمينه ارزشيابيها محاسبه ميشود. براي اين منظور ما يک الگوريتم مبتني بر توزيع بتا ارائه ميکنيم. در آخرين مرحله، امتياز کاربر فعال با ميانگينگيري وزني و با درنظرگرفتن مقادير اعتماد به عنوان وزن تخمين زده ميشود.
مهمترين نوآوريهاي اين مقاله به شرح زير است:
• درنظرگرفتن فاکتورهاي زمان، مکان و زمينه در تخمين اعتماد
• ارائه يک روش بهبوديافته مبتني بر توزيع بتا براي محاسبه اعتماد
• بهرهگيري از يک معيار جديد مبتني بر درخت براي محاسبه شباهت معنايي بين زمينهها در طرح پيشنهادي
در ادامه و در بخش 2 کارهاي مرتبط در زمينه سيستمهاي پيشنهاددهنده مبتني بر اعتماد را بررسي ميکنيم. سپس در بخش 3 بيان مسأله مطرح ميشود. در بخش 4 رويکرد پيشنهادي را براي ارائه توصيهها با اعمال اعتماد چندفاکتوري مبتني بر توزيع بتا ارائه و توصيف ميکنيم. بخش 5 به ارائه و تحليل نتايج آزمايشها و ارزيابي روش پيشنهادي در مقايسه
با چند روش موجود اختصاص دارد و نهايتاً در بخش 6 نتيجهگيري و پيشنهادها براي کارهاي آينده ارائه ميشود.
2- کارهای مرتبط
در اين بخش، کارهاي مرتبط در زمينه سيستمهاي پيشنهاددهنده مبتني بر اعتماد، زمان، مکان و زمينه را بررسي و تحليل ميکنيم. الگوريتمهاي توصيه متعددي از سطح اعتماد بين کاربران براي مقابله
با چالشهاي خلوتي دادهها و بهبود پيشنهادها استفاده ميکنند. اعمال اعتماد ميتواند فرايند تصميمگيري را براي سيستم پيشنهاددهنده تسهيل کند. روابط اعتماد بين افراد در يک جامعه معمولاً با يک شبکه اعتماد نشان داده ميشود که يک گراف جهتدار است که رأسهاي آن، افراد جامعه و يالهاي آن، روابط اعتماد بين افراد را نشان ميدهند. معمولاً يالها با مقادير اعتماد (اغلب، اعداد حقيقي در بازه [1،0]) برچسبگذاري ميشوند. شکل 1 يک شبکه اعتماد نمونه را نشان ميدهد.
برخي از کارهاي تحقيقاتي از مدلهاي اعتماد پويا استفاده ميکنند که يکي از اين مدلها مدل FJ ناميده ميشود [20]. در اين مدل، نحوه تغییر و تحول نظرات افراد بر اساس نظرات قبلی آنها بررسی میشود. این بررسی بر اساس این فرض صورت میگیرد که افراد، نظراتشان را از طریق ترکیبی از نظرات خودشان و نظرات دیگران بهروزرسانی میکنند و در این ترکیب، وزن هر نظر به صورت خودکار توسط فرد و با توجه به پاسخ او به نظرات سایر افراد تعیین میشود. بیان ریاضی ایده فوق در (1) ارائه شده است
(1)
رابطه فوق براي تخمين نظرات اعتماد فرد در يک لحظه زماني خاص ارائه شده که در آن بردار نشاندهنده نظرات افراد در لحظه زمانی ، قابلیت کنشگرها برای نفوذهای بین فردی و ماتریس همانی است. منظور از کنشگرها افرادی هستند که نظرات آنها بر روی نظر فرد مورد بررسی تأثیر دارد و اهمیت نسبی کنشگرها را بر روی ترجیحات هر کاربر نشان میدهد. به بیان دقیقتر، مقدار میزان اهمیتی است که فرد برای نظر مطرحشده توسط فرد قائل میشود. مقادیر عناصر ماتریس به صورتی تنظیم میگردد که مجموع عناصر هر سطر ماتریس برابر با 1 است.
در برخی منابع برای درنظرگرفتن پویایی روابط اعتماد از یک گراف با برچسبهای یال متغیر با زمان برای بازنمایی شبکه اعتماد استفاده شده است [21]. الگوریتم پیشنهادی در این مرجع که DyTrust نامیده میشود از یک رویکرد پویا برای محاسبه مقدار اعتماد غیرمستقیم بین دو کاربر بهره میبرد؛ بهگونهای که در هر لحظه خاص، مسیرهای اعتماد قابل اتکا را شناسایی و انتشار اعتماد را بر اساس این مسیرها اعمال میکند.
در مدل انتشار اعتماد برای تشخیص هرزنامه [22]، روابط بین نظرات یک کاربر درباره جنبههای مختلف رضایت از یک آیتم هدف در نظر گرفته میشود. این رویکرد میتواند به نوعی یک روش انتشار اعتماد مبتنی بر زمینه تلقی گردد. البته هیچ روش یا معیار مشخصی برای اندازهگیری سطح روابط بین نظرات کاربران ارائه نشده است.
کارهای تحقیقاتی مختلفی با هدف بررسی تأثیر روابط اجتماعی، زمان، مکان و زمینه بر کارایی سیستمهای پیشنهاددهنده انجام شده است. به عنوان نمونه در یکی از کارهای تحقیقاتی در این زمینه، یک الگوریتم توصیه مبتنی بر مکان برای ارتقای صحت اقلام پیشنهادی بر اساس یادگیری با توجه به تحلیل پروفایل کاربر در شبکههای اجتماعی و موقعیت مکانی وی ارائه شده است [4]. اگرچه این الگوریتم، نوعی زمینه را در نظر میگیرد ولی تلقی آن از مفهوم زمینه با آنچه در مدل پیشنهادی ما مد نظر است، متفاوت میباشد. در واقع در مدل مذکور، اصطلاح زمینه به شرایط و حس و حال کاربر اطلاق میشود؛ در حالی که در مدل پیشنهادی ما منظور از زمینه، حوزه و دامنه اقلام پیشنهادی به کاربر است.
الگوریتم پیشنهاد POI [23] دو خاصیت زیر را برای پیشنهادهای POI بعدی در نظر میگیرد:
1) احتمالهای پیشرو و پسرو بین یک جفت POI که به صورت متوالی توسط کاربر مورد بازدید قرار میگیرند، نامتقارن هستند.
2) کاربران معمولاً POIهای متوالی مختلفی را در زمانهای مختلف ترجیح میدهند.
در پژوهشی دیگر، یک مدل گروهبندی کاربران ارائه شده تا اطلاعاتی در مورد کاربران از طریق یک شبکه اجتماعی مبتنی بر مکان (LBSN) به دست آید [15]. ترجیحات این کاربران، نزدیکی موقعیت مکانهای بازدیدشده توسط کاربران، روزهای فراغت کاربران و روابط اجتماعی بین آنها به صورت خودکار از سابقه مکان کاربران و پروفایلهای آنها در شبکه اجتماعی استخراج میشود. با ترکیب این فاکتورها شباهت بین کاربران تعیین میگردد و کاربران به گروههایی دستهبندی میشوند.
در رویکرد مدلسازی پویایی، ترجیحات کاربر در سیستمهای پیشنهاددهنده بر اساس چارچوب تجزیه تنسور زوجی [17] ترجیحات گذشته کاربر وزندهی میشوند و اهمیت آنها به تدریج بر اساس یک فاکتور موسوم به ضریب فرسایش زمانی فردی کاهش مییابد. مقدار این فاکتور به نرخ پویایی ترجیحات کاربر بر اساس [24] وابسته است که به صورت زیر محاسبه میشود
(2)
که و به ترتیب مجموعههای ژانرهای فیلمهایی است که کاربر در دوره زمانی گذشته و حال با آنها تعامل داشته است. همچنین مدل مذکور از مشخصات کاربران و شباهتهای بین آنها به عنوان دانش پیشین درباره پویایی ترجیحات کاربر استفاده میکند.
در تحقیقی دیگر، دو مدل برای ارائه توصیههای نظرات و مکانها با درنظرگرفتن فاکتورهای مکانی، متنی و زمانی نظرات کاربران و نیز تأثیر سابقه بازدید کاربران از مکانها و نفوذ اجتماعی نظرات کاربران پیشنهاد شده [24] که هر دو برای انتخاب مرتبطترین کاربران از پیشپالایش اطلاعات [25] استفاده میکنند. بر اساس تحقیقات صورتگرفته [26] و [27]، چهار دلیل اصلی تغییر ترجیحات کاربران یعنی کشف مکانهای جدید، تجربه کاربر، محبوبیت و نفوذ اجتماعی در نظر گرفته شدهاند.
در مدلسازی ترجیحات کاربر [24]، مدل پالایش مبتنی بر آیتم به دو روش توسعه مییابد: 1) اعمال فاکتور تقریب در محاسبه شباهت بین دو کاربر و 2) درنظرگرفتن تاریخچه نظرات فقط کاربران نزدیک به جای کلیه نظرات.
در مرور مفهومی رویکردهای سیستمهای پیشنهاددهنده مبتنی بر اعتماد [28]، مطالعات اخیر بر روی این سیستمها و همچنین تحلیلی از ملاکهای اعتماد مورد استفاده در این حوزه ارائه گردیده است. مؤلفان نتیجه میگیرند که در ساختن ملاک اعتماد باید زمان ارزشیابی همراه با اطلاعات ارزشیابی آیتم در نظر گرفته شود تا ملاکهای پویایی اعتماد، باکیفیتتر شود. آنها همچنین پیشنهاد میکنند که اطلاعات زمینهای و رفتاری کاربران و اقلام در ملاکهای اعتماد در نظر گرفته شوند تا معیارهای وابسته به زمینه تعیین گردند.
در رویکرد بین دامنهای برای سیستمهای پیشنهاددهنده گروهی [29]، پیشنهادهای ارائهشده توسط کاربران قابل اعتماد و خوشنام در گروه، پذیرش توصیهها را نسبت به پیشنهادهای سایر افراد گروه بهبود میدهد. سیستم به گونهای طراحی شده که اطلاعات زیردامنههای مختلف دامنه گردشگری را در نظر میگیرد.
سیستم پیشنهاددهنده بین دامنهای (CDRS) [30] از دادههای چندین دامنه برای کاهش مشکل خلوتی استفاده میکند. این سیستم اطلاعات اعتماد و بیاعتمادی را برای بهبود قابلیت اعتماد پیشنهادهای تولیدشده در نظر میگیرد.
در تحقیقی دیگر، یک رویکرد پسپالایش مبتنی بر اعتماد آگاه از زمینه برای غلبه بر مشکلات خلوتی دادهها و شروع سرد در سیستمهای پیشنهاددهنده پیشنهاد گردیده است [31] که از میانگین اختلاف نسبی بین زمینهها استفاده میکند. مؤلفان در ابتدا میانگین امتیاز را برای هر شرایط زمینهای محاسبه میکنند و همه ارزشیابیها را بر اساس وضعیت زمینهای هر چندگانه متوازن مینمایند. آنها همچنین از مفهوم اطمینان برای حذف کاربران غیرقابل اطمینان از شبکه اعتماد قبل از تولید پیشبینیها استفاده میکنند.
در سيستم پيشنهاددهنده آگاه از زمينه [32]، يک رويکرد معنايي براي پيشنهاد رستوران متناسب با علايق کاربر معرفي گردیده است. براي اين منظور، نام غذاهاي استخراجشده از نظرات کاربران خوشهبندي شده و احساسات آنها در مورد غذاها مورد تحليل قرار گرفته است. زمان کار رستورانها و ترجيحات کاربر، مؤلفههاي اصلي اطلاعات زمينهاي هستند که در توصيهها مورد استفاده قرار ميگيرند.
رویکردهای مختلفی براي رفع مشکل تغييرات در ترجيحات کاربر در تحقیقات ارائه شده است؛ از جمله سيستم پيشنهاددهنده آگاه از زمان [32] از يک فاکتور چندگذره و يک تابع زماني فراموشي براي درنظرگرفتن تغييرات علايق کاربر استفاده ميکند. سيستم مذکور همچنين از نظرات متني بهره ميگيرد و به صورت خودکار، فاکتورهاي مخفي در هر دوره زماني را دستهبندي ميکند و روش گذار را براي عنوان نظرات مرتبط در نظر ميگيرد.
سيستم پيشنهاددهنده مبتني بر آنتولوژي سابقه زمينه [33]، شباهت سابقه زمينه را با استفاده از روابط مترادفبودن و روابط مبتني بر مفهوم کلاس اندازهگيري ميکند. اين سوابق، امکان ارائه پيشنهادهاي شخصيتر را با توجه به ترجيحات ازپيشتعريفشده فراهم ميآورند.
اعمال فاکتورهاي زمان و مکان و زمينه بهويژه در حوزه پيشنهاد POI بسيار کارامد و در ارائه توصيههاي مناسب مؤثر است. در اين راستا چندين رويکرد در پژوهشهاي اخير معرفي شده که از جمله ميتوان به تخصيص پنهان ديريکله (LDA) مبتني بر اثر لنگري [34]، طبقهبندي نوع مکانها [35]، درنظرگرفتن اطلاعات زمينهاي جغرافيايي در سطح سراسري [36] و درج برچسب [37] اشاره کرد.
از طرف ديگر، برخي از طرحهاي مديريت اعتماد براي ارزيابي مقدار اعتماد بين دو گره از توزيع بتا استفاده ميکنند. اميد رياضي مقدار توزيع بتا با استفاده از رابطه زير به دست ميآيد
(3)
برخي از کارهاي تحقيقاتي، مقدار اعتماد را بر اساس رابطه فوق محاسبه ميکنند؛ به اين ترتيب که و را به عنوان تابعي از تعداد تعاملات همکارانه و غيرهمکارانه در نظر ميگيرند [38] تا [40]. براي اين منظور رابطه زير پيشنهاد شده است [39]
(4)
که در آن و به ترتيب تعداد تعاملات خوب و بد در مرحله را نشان ميدهند. اعتماد به عنوان اميد رياضي در نظر گرفته ميشود و بنابراين داريم
(5)
توزیع بتا به دلیل تطبیقپذیری و سادگی و در عین حال پایه قوی آماری آن به طور گسترده در تحلیل تعاملات بین افراد بر اساس مدارک و شواهد مورد استفاده قرار میگیرد [38]. به کمک این توزیع بر اساس تعداد تعاملات همکارانه و غیرهمکارانه یک فرد میتوان احتمال مشاهده رفتار همکارانه از فرد را محاسبه کرد. در تحقیقات ثابت گردیده که شهرت2
یا خوشنامی یک فرد از تابع توزیع بتا تبعیت میکند [39] و [40]. در سادهترین حالت، اگر تعداد تعاملات همکارانه و غیرهمکارانه یک فرد به ترتیب با و نشان داده شود، شهرت فرد مذکور برابر با مقدار تخمین زده میشود. با وجود این، مدلهای موجود برای محاسبه شهرت بر مبنای توزیع بتا عموماً تعاملات فرد مورد ارزیابی را به صورت دنبالهای از عملکردها در نظر میگیرند که ارزش دودویی (خوب یا بد و به عبارت دیگر رضایتبخش یا غیررضایتبخش) دارند
شکل 2: طرح كلي روش پيشنهادي.
[39]. در حالی که در اغلب کاربردها از جمله در مبحث سیستمهای پیشنهاددهنده، ارزشیابیها به صورت چندسطحی (مثلاً پنجسطحی) در دسترس هستند. به همین دلیل مدل ارائهشده در این مقاله، راهکاری را برای محاسبه اعتماد بر مبنای بازخوردهای چندسطحی پیشنهاد میکند.
مؤلفان مقاله حاضر در سال 1395 یک مدل لایهای اعتماد آگاه از اطمینان را برای بهبود دقت توصیهها در سیستمهای پیشنهاددهنده ارائه کردهاند [41]. مدل مذکور از چهار لایه ارزشیابی، اعتماد مستقیم، اعتماد غیرمستقیم و پیشنهاد تشکیل شده و برای تخمین سطح اعتماد از ترکیب اعتماد ضمنی و صریح بر اساس مدل منطق ذهنی استفاده میکند. اگرچه مدل مذکور، پارامتر زمان را برای محاسبه سطح اطمینان به اعتماد محاسبهشده مورد توجه و استفاده قرار میدهد، اما پارامترهای مکان و زمینه در آن در نظر گرفته نشده است. به همین دلیل در این مقاله، مدل جدیدی ارائه میکنیم که این دو پارامتر را هم در ارزیابی اعتماد اعمال میکند. نوآوری دیگر این مدل جدید و وجه تمایز آن با مدل قبلی [41]، رویکرد خوشهبندی کاربران بر اساس مشخصات و تاریخچه ارزشیابیها و همچنین استفاده از توزیع بتا برای محاسبه اعتماد چندفاکتوری است.
3- بیان مسأله
در این بخش، تعریفی فرمال از مسأله، ارائه و نمادهای مورد استفاده در ادامه مقاله تعریف میشود. به صورت فرمال، مسأله این تحقیق را میتوان به صورت زیر بیان کرد:
ورودی
• : شناسه کاربر فعال، یعنی کاربری که قرار است امتیاز او به آیتم هدف تخمین زده شود.
• : شناسه آیتم هدف، یعنی آیتمی که پیشبینی امتیاز برای آن قرار است انجام شود.
• : زمان فعلی
• : موقعیت مکانی کاربر فعال
خروجی
• : مقدار تخمینزدهشده برای امتیاز کاربر فعال به آیتم هدف در لحظه زمانی کنونی و موقعیت مکانی فعلی که به عنوان مقدار تابع نشان داده میشود.
مفروضات
• پایگاه داده ارزشیابیهای آگاه از زمان و مکان کاربران در دسترس است و یا در زمان شروع به کار سیستم، امکان ساختن آن از مجموعه ارزشیابیهای خام کاربران وجود دارد. هر رکورد این پایگاه داده به شکل یک پنجتایی است. این پنج فیلد به ترتیب شناسه کاربر، شناسه آیتم، زمان، مکان و مقدار ارزشیابی را نشان میدهند. البته مقدار در بسیاری از رکوردهای پایگاه داده تهی (نامعلوم) است.
• پروفایل کاربران سیستم پیشنهاددهنده در شبکههای اجتماعی یا حداقل برخی از فیلدهای پروفایل آنها و نیز شبکه مقادیر اعتماد صریح بین کاربران ممکن است در دسترس باشد که در این صورت، دقت پیشبینیها و پیشنهادها افزایش خواهد یافت.
4- مدل پیشنهادی
در این بخش، مدل پیشنهادی توصیف میشود. ابتدا در زیربخش 4-1 توصیف کلی مدل، روندنما و شبهکد رویکرد پیشنهادی را برای تخمین ارزشیابی و انتخاب آیتم برتر، ارائه و سپس در زیربخش 4-2 ماژول تخمین ارزشیابی را با جزئیات بیشتر تشریح میکنیم.
4-1 توصیف کلی مدل پیشنهادی
طرح کلی مدل پیشنهادی در شکل 2 نشان داده شده است. همان طور که دیده میشود، در ابتدای کار مقدار ارزشیابی کاربران به صورت خام در دسترس است. چند گام پیشپردازش بر روی این دادههای خام لازم است تا یک پایگاه داده ارزشیابی ساختیافته ساخته شود. به عنوان نمونه، ارزشیابیهای خام ممکن است در قالب متن باشند یا حتی ممکن است ارزشیابیها صریحاً در دسترس نباشند؛ بلکه لازم باشد تا ارزشیابیهای کاربران به صورت ضمنی بر اساس رفتار آنها با آیتمها (مثلاً تعداد دفعات تماشای یک فیلم یا مدت زمان ماندن بر روی یک صفحه وب) تخمین زده شود. از طرف ديگر اگر پروفايل کاربران در دسترس باشد، دادههاي پروفايل ميتواند مورد پردازش قرار گيرد تا ويژگيها و مشخصات کاربر استخراج شود. اين اطلاعات به عنوان يکي از مهمترين پارامترها براي محاسبه شباهتها بين کاربران و خوشهبندي آنها استفاده خواهد شد.
در گام بعدي، کاربران بر مبناي مقدار شباهت استخراجشده از پايگاه داده ارزشيابي و دادههاي پروفايل کاربر، خوشهبندي ميشوند. براي اين منظور هر الگوريتم خوشهبندي قابل استفاده است و ما از الگوريتم معروف K-means استفاده کرديم. براي تخمين ارزشيابي کاربر فعال به يک آيتم خاص، شناسههاي کاربر و آيتم، زمان جاري و موقعيت مکاني کاربر به عنوان چهار پارامتر ، ، و به عنوان ورودي به سيستم وارد ميشود. ابتدا در ماژول تخمين اعتماد، مقدار اعتماد بين کاربر فعال و هر يک از کاربران ديگر موجود در خوشه او با درنظرگرفتن سه فاکتور زمان، مکان و زمينه ارزشيابيها محاسبه ميشود. براي اين منظور ما يک الگوريتم مبتني بر توزيع بتا را ارائه ميکنيم. سپس در ماژول تخمين ارزشيابي، مقدار يعني ارزشيابي کاربر فعال به آيتم در زمان و مکان فعلي با استفاده از ميانگينگيري وزني تخمين زده ميشود که مقادير اعتماد به عنوان وزن در نظر گرفته ميشوند. در بخش بعدي عملکرد اين ماژولها را با جزئيات توصيف ميکنيم.
خروجي تابع تخمين ارزشيابي براي بهروزرساني پايگاه داده ارزشيابي استفاده ميشود و نيز به عنوان خروجي الگوريتم (جهت تعيين اين که آيا آيتم در بين آيتم برتر جهت پيشنهاد به کاربر قرار گيرد يا خير) مورد استفاده قرار ميگيرد. روندنمای فرايند تخمين اقلام مورد علاقه کاربر فعال در شکل 3 آمده است. همان طور که مشاهده ميشود، شناسه کاربر فعال ، زمان جاری و موقعیت مکانی کاربر به هنگام ورود او به سیستم دریافت میگردد. سپس باید اقلام کاندیدا برای ارائه به کاربر انتخاب شوند. این اقلام آنهایی هستند که محتمل است مورد علاقه
شکل 3: روندنمای فرايند استخراج آيتم برتر.
کاربر باشند. انتخاب اقلام کاندیدا در کارایی سیستم اهمیت زیادی دارد زیرا اگر قرار باشد که ارزشیابی کاربر به کل اقلام تخمین زده شود، این کار بسیار زمانبر خواهد بود. برای انتخاب اقلام کاندیدا پیشنهاد میکنیم که اقلام مشابه اقلام انتخابشده توسط کاربر فعال و همچنین اقلامی
که توسط کاربران مشابه کاربر فعال انتخاب شدهاند در نظر گرفته شوند. به عبارت دیگر برای تعیین لیست اقلام پیشنهادی ، ترکیب دو رویکرد کاربر- آیتم- آیتم و کاربر- کاربر- آیتم اعمال میشود.
در گام بعدی و در ماژول تخمین ارزشیابی، مقدار برای هر یک از اقلام لیست کاندیدا محاسبه میشود و جزئیات بیشتر در مورد این ماژول بعداً در این فصل ارائه میگردد. بعد از محاسبه ارزشیابی تخمینی کاربر به اقلام کاندیدا، این ارزشیابیها به عنوان رکوردهای جدید در پایگاه داده ارزشیابیها درج میشوند. در مرحله بعد، بر اساس ترتیب نزولی مقادیر ارزشیابی مرتب میگردد و بالاخره در آخرین گام، نخستین سطر انتخاب و به عنوان آیتم برتر به کاربر پیشنهاد میشود. شبهکد الگوریتم پیشنهادی در شکل 4 آمده است.
4-2 تخمين اعتماد و پيشبيني ارزشيابي
همان گونه که قبلاً اشاره شد، مهمترین بخش از مدل پیشنهادی، ماژول تخمين اعتماد و پيشبيني ارزشيابي است که هدف آن، تخمین مقدار میباشد که نحوه عملکرد اين ماژول در ادامه توضیح داده میشود.
شبهکد الگوريتم تخمين اعتماد و پيشبيني ارزشيابي کاربر فعال به يک آيتم مشخص در شکل 5 نشان داده شده است. وروديهاي اين الگوريتم عبارت هستند از شناسه کاربر فعال و شناسه آيتم مورد نظر . در
Input Set of items close to u's preferences Set of items selected by u's neighbors
For each item Begin Calculate Insert tuple into rating DB End Sort in descending order of the values of Recommend top N items in CL to u |
شکل 4: شبهكد الگوريتم پيشنهادي.
Function PredictRate Begin
For each user Begin
For each item Begin
If then
If then
End
End Return End |
شکل 5: شبهكد الگوريتم تخمين اعتماد و پيشبيني ارزشيابي كاربر فعال به يك آيتم مشخص.
اولين گام، اشتراک بين خوشه حاوي کاربر با مجموعه کليه کاربراني که آيتم را ارزشيابي کردهاند تعيين و به عنوان مجموعه در نظر گرفته ميشود. سپس براي هر کاربر از مجموعه ، مقدار اعتماد به محاسبه ميشود. براي اين منظور، ما يک گونه بهبوديافته از روش ارائهشده قبلی [39] را استفاده ميکنيم. در ابتدا به پارامترهاي توزيع بتا يعني و مقدار اوليه 1 داده ميشود. سپس براي هر آيتم که قبلاً توسط ارزشيابي شده است، ميزان شباهت اقلام و و شرايط ارزيابي آنها به عنوان محاسبه ميشود. روش محاسبه شباهت در ادامه بخش توضيح داده ميشود.
در گام بعدي، یک متغیر که یک معیار نرمالشده فاصله بین ارزشیابیهای و به است به صورت زیر محاسبه میشود
(6)
که تعداد سطوح ارزشیابی است. سپس مقدار بسته به مثبت یا منفیبودن مقدار به یا افزوده میشود. لازم به ذکر است که در این گام اگر مقدار صفر باشد، هیچ اقدامی صورت نمیگیرد. از آنجا
شکل 6: یک درخت زمینه نمونه برای انتشار اعتماد مبتنی بر زمینه در سیستمهای پیشنهاددهنده PoI.
شکل 7: نمادگذاری مورد استفاده در معیار شباهت زمینهای WuP [42].
که در اغلب سیستمهای ارزشیابی، تعداد سطوح ارزشیابی برابر با 5 است برای توضیح بیشتر این روال، پارامتر تغییریافته یا و مقدار با فرض (به عنوان نمونه) در جدول 1 نشان داده شده است. با استفاده از این تکنیک، هرچه ارزشیابیهای و به به هم نزدیکتر یا از هم دورتر باشند، مقادیر بزرگتری به ترتیب به یا افزوده میگردد که این موضوع به نوبه خود منجر به اعتماد به ترتیب بیشتر یا کمتر بین و خواهد شد زیرا ما از امید ریاضی توزیع بتا بر اساس (3) استفاده میکنیم. در نهایت، ارزشیابی کاربر فعال به آیتم کاندیدای با استفاده از میانگینگیری وزنی با درنظرگرفتن مقادیر اعتماد به عنوان وزن تخمین زده میشود
(7)
4-3 محاسبه شباهت
برای محاسبه شباهت بین ارزشیابیها، ما پارامترهای زمان، مکان و زمینه را در نظر میگیریم. شباهت مبتنی بر زمان و مکان بر اساس معیار فاصله اقلیدسی محاسبه میشود. برای محاسبه شباهت بین زمینهها، پیشنهاد میکنیم که روابط بین زمینهها در یک شکل سلسلهمراتبی با استفاده از درختی به نام درخت زمینه، نمایش داده شود. به عنوان مثال برای سیستمهای پیشنهاددهنده POI، درخت زمینه میتواند به صورت شکل 6 باشد. با استفاده از درخت زمينه شکل 6، اگر اعتماد از يک کاربر به کاربر در يک زمينه مشخص داده شده باشد، براي تخمين مقدار اعتماد در زمينه جاري ابتدا زوج گره متناظر با زمينههاي و در درخت با توجه به نوع POIها (يا در حالت کلي آيتمها) پيدا ميشوند. سپس مقدار نزديکبودن بين دو زمينه با استفاده از معيار فاصله (يا شباهت) محاسبه ميگردد. هرچه زمينههاي و نزديکتر باشند، انتشار اعتماد از به قويتر خواهد بود. براي محاسبه شباهت بين دو زمينه ميتوان از معيار شباهت 3WUP [41] استفاده کرد. بر اساس اين
جدول 1: پارامتر مورد تغییر یا و مقدار به ازای .
| 1 | 2 | 3 | 4 | 5 |
1 |
|
| - |
|
|
2 |
|
|
| - |
|
3 | - |
|
|
| - |
4 |
| - |
|
|
|
5 |
|
| - |
|
|
معيار براي تعيين مقدار شباهت بين گرههاي و در درخت، ابتدا پايينترين اَبَرمفهوم مشترک (LCS) گرههاي و به عنوان تعيين و سپس شباهت زمينهاي بين و به صورت رابطه زير محاسبه ميشود
(8)
همان طور که در شکل 7 دیده میشود، تعداد گرههای واقع در مسیر از به ، تعداد گرههای واقع در مسیر از به و تعداد گرههای واقع در مسیر از ریشه به است. علاوه بر WUP ما همچنین طول مسیر بین گرههای و را به عنوان یک معیار شباهت جایگزین امتحان کردیم. برای داشتن یک معیار کارامدتر میتوان به سطحها و یالهای درخت زمینه، برچسبهای وزنی اختصاص داد.
5- ارزیابی مدل پیشنهادی
در این بخش، نتایج ارزیابی مدل پیشنهادی بر اساس آزمایشهای مختلف را ارائه و تحلیل میکنیم. ابتدا در بخش 5-1 مجموعه دادههای مورد استفاده را معرفی میکنیم. پس از آن در بخش 5-2 معیارهای ارزیابی و الگوریتمهای مورد مقایسه توصیف میشوند. نهایتاً در بخش
5-3 نتایج ارزیابی رویکرد پیشنهادی را ارائه و با نتایج مربوط به چند روش موجود مقایسه میکنیم.
5-1 مجموعه دادهها
آزمایشها بر روی سه مجموعه داده عمومی واقعی یعنی Yelp [43]، Foursquare [44] و Gowalla [45] انجام شدهاند. توصیف این سه مجموعه داده به شرح زیر است:
- Yelp: این مجموعه داده اطلاعاتی در مورد ارزشیابیها و نظرات کاربران برای کسبوکارهایی از 10 شهر را دربردارد.
- Foursquare: این مجموعه داده، دادههای حضور کاربران را از
12 آپریل 2012 تا 16 فوریه 2013 در مکانهای مورد علاقه در شهر نیویورک دربردارد. ما مانند [23] برای دستیابی به دادههای کاربردیتر POIهایی را انتخاب کردیم که حداقل توسط 5 کاربر بازدید شده و کاربرانی که حداقل از 10 مکان بازدید کردهاند.
- Gowalla: این مجموعه داده، اطلاعات حضور کاربران در شهرهای مختلف در مکانهای مورد علاقه را در بازه زمانی فوریه 2009 تا اکتبر 2010 ارائه میکند. ما مشابه [23] رکوردهای مربوط به POIهای کالیفرنیا را انتخاب کردیم و مکانهای غیرمحبوب را که توسط کمتر از 15 کاربر بازدید شدهاند و همچنین کاربرانی را که کمتر از 20 مکان را بازدید کردهاند فیلتر کردیم.
اطلاعات آماری پایه در مورد سه مجموعه داده مورد پردازش در
جدول 2 ارائه شده است.
(الف)
(ب)
شکل 8: تحلیل حساسیت برای مقادیر مختلف بر حسب (الف) دقت و (ب) فراخوانی.
جدول 2: اطلاعات آماری مجموعه دادههای ارزیابی.
Dataset | #Users | #POIs | #Check-ins | #Avg. check-ins per user |
Yelp | 552338 | 77078 | 2225204 | 03/4 |
Foursquare | 1078 | 2944 | 71622 | 44/66 |
Gowalla | 2166 | 4047 | 100986 | 62/46 |
5-2 معیارهای ارزیابی و الگوریتمهای مورد مقایسه
ما سه معیار متداول را برای ارزیابی رویکرد پیشنهادی و مقایسه صحت و کارامدی آن با چند روش موجود مورد استفاده قرار دادیم:
(دقت): نسبت تعداد آیتمهای مرتبط در لیست آیتم برتر به . به عبارت دیگر این معیار به صورت زیر تعریف میشود
(9)
(فراخوانی/ بازخوانی/ یادآور/ یادآوری): نسبت تعداد آیتمهای مرتبط در لیست آیتم پیشنهادی به تعداد کل آیتمهای مرتبط. به عبارت دیگر از رابطه زیر تعیین میشود
(10)
: یک معیار برقراری توازن بین دقت و فراخوانی است که هر دو ملاک را در نظر میگیرد. این معیار به درک مصالحه بین صحت و پوشش کمک میکند و به صورت رابطه زیر تعریف میشود
(11)
ما نتایج مدل پیشنهادی را با پنج کار تحقیقاتی مشابه موجود شامل USSTC [18]، MEAP-T [23]، anchor-LDA [39]، AUC-MF [36] و LOCABAL+ [46] مقایسه کردیم.
5-3 نتایج و تحلیل
اولین آزمایش برای تحلیل حساسیت مدل پیشنهادی از نظر معیارهای دقت و فراخوانی نسبت به تغییرات مقدار برای پیشنهاد آیتم برتر
جدول 3: مقدار برای مجموعه دادههای
Yelp، Foursquare و Gowalla.
| Yelp | Foursquare | Gowalla |
USSTC | 0275/0 | 0307/0 | 0326/0 |
MEAP-T | 0294/0 | 0336/0 | 0352/0 |
LOCABAL+ | 0317/0 | 0362/0 | 0380/0 |
anchor-LDA | 0310/0 | 0349/0 | 0514/0 |
0211/0 | 0353/0 | 0586/0 | |
Proposed method | 0324/0 | 0381/0 | 0538/0 |
جدول 4: مقدار برای مجموعه دادههای
Yelp، Foursquare و Gowalla.
| Yelp | Foursquare | Gowalla |
USSTC | 194/0 | 299/0 | 303/0 |
MEAP-T | 234/0 | 326/0 | 330/0 |
LOCABAL+ | 296/0 | 347/0 | 345/0 |
anchor-LDA | 340/0 | 227/0 | 106/0 |
AUC-MF | 049/0 | 308/0 | 078/0 |
Proposed method | 507/0 | 347/0 | 353/0 |
جدول 5: مقدار برای مجموعه دادههای
Yelp، Foursquare و Gowalla.
| Yelp | Foursquare | Gowalla |
USSTC | 0482/0 | 0557/0 | 0589/0 |
MEAP-T | 0522/0 | 0609/0 | 0636/0 |
LOCABAL+ | 0573/0 | 0656/0 | 0685/0 |
anchor-LDA | 0568/0 | 0605/0 | 0692/0 |
AUC-MF | 0295/0 | 0633/0 | 0669/0 |
Proposed method | 0610/0 | 0687/0 | 0934/0 |
انجام شد. شکل 8 نتایج این آزمایش را برای مقادیر مختلف متغیر شامل بر روی سه مجموعه داده مورد استفاده نشان میدهد. همان طور که انتظار میرود با زیادشدن تعداد POIهای پیشنهادشده، دقت کاهش مییابد. این موضوع قابل درک است زیرا با افزایش POIهای بیشتر به کاربر، تعداد حالات منفی کاذب افزایش مییابد و از طرف دیگر با افزایش ، مقدار فراخوانی زیاد میشود. این موضوع به آن دلیل است که با پیشنهاد تعداد بیشتر POI، موارد مرتبط بیشتری هم به کاربر پیشنهاد میشوند. این موضوع به افزایش تعداد مثبتهای درست و افزایش مقدار پارامتر دقت میانجامد.
آزمایشهای دیگری برای ارزیابی کارایی روش پیشنهادی و مقایسه آن با روشهای دیگر انجام شد که در این آزمایشها ، و اندازهگیری گردید. جدول 3 خلاصه نتایج ارزیابی را بر حسب نشان میدهد. همان گونه که مشاهده میشود، روش پیشنهادی برای مجموعه دادههای Foursquare و Yelp بهترین نتایج را و در مورد مجموعه داده Gowalla، روش LOCABAL+ بهترین مقادیر دقت را ارائه میکند. جدول 4 نتایج روشهای مورد مقایسه را بر روی مجموعه دادههای مختلف نشان میدهد. با توجه به جدول، روش پیشنهادی بر روی مجموعه دادههای Yelp و Gowalla بهتر از روشهای دیگر عمل میکند. البته در مورد مجموعه داده Foursquare نتیجه روش پیشنهادی با روش LOCABAL+ برابر است. نهایتاً در جدول 5، مقادیر که بر اساس (11) برای کلیه حالتها محاسبه شده، آمده است. مطابق آنچه که در جدول مشاهده میشود، روش پیشنهادی، بهترین عملکرد کلی را بر حسب معیار ارائه میکند.
6- نتیجهگیری و کارهای آینده
این مقاله، یک رویکرد جدید را برای تخمین اعتماد بین کاربران سیستمهای پیشنهاددهنده ارائه میدهد. مدل پیشنهادی، 3 پارامتر مختلف شامل مکان، زمان و زمینه را در محاسبه مقدار اعتماد در نظر میگیرد. برای محاسبه اعتماد، الگوریتمی را مبتنی بر توزیع بتا ارائه کردیم. مدل ارائهشده از یک معیار مبتنی بر درخت برای محاسبه شباهت معنایی بین زمینهها استفاده میکند. نهایتاً ارزشیابی کاربر فعال با استفاده از میانگین وزنی تخمین زده میشود که مقادیر اعتماد به عنوان وزن در این میانگینگیری در نظر گرفته میشوند.
برای کارهای آینده قصد داریم تا پارامتر عدم قطعیت را در محاسبه و بهرهگیری از اعتماد در نظر بگیریم. یک ایده دیگر برای بسط و تکمیل این کار، استفاده یا ارائه معیارهای کارامدتر برای تخمین فاصله/ شباهت زمانی و مکانی است.
مراجع
[1] L. Yao, Z. Xu, X. Zhou, and B. Lev, "Synergies between association rules and collaborative filtering in recommender system: an application to auto industry," in Data Science and Digital Business, pp. 65-80, 2019.
[2] N. Rubens, et al., "Active learning in recommender systems," Recommender Systems Handbook, Springer, pp. 809-846, 2015.
[3] Y. M. Li, C. T. Wu, and C. Y. Lai, "A social recommender mechanism for e-commerce: combining similarity, trust, and relationship," Decision Support Systems, vol. 55, no. 3, pp. 740-752, Jun. 2013.
[4] N. S. Savage, M. Baranski, N. E. Chavez, and T. Höllerer, "I'm feeling LoCo: a location based context aware recommendation system," Advances in Location-Based Services: 8th Int. Symp. on Location-Based Services, Vienna: Springer Science & Business Media, 2011, pp. 37-54.
[5] A. Bączkiewicz, et al., "Methodical aspects of MCDM based
E-commerce recommender system," J. of Theoretical and Applied Electronic Commerce Research, vol. 16, no. 6, pp. 2192-2229, 2021.
[6] M. Elahi, M. Braunhofer, T. Gurbanov, and F.o Ricci, "User Preference Elicitation, Rating Sparsity and Cold Start," in Collaborative Recommendations, Ch.8, pp. 253-294, 2018.
[7] G. Antolić and L. Brkić, "Recommender system based on the analysis of publicly available data," in Proc. 40th IEEE Int. Conv. on Information and Communication Technology, Electronics and Microelectronics, MIPRO'17, pp. 1379-1384, Opatija, Croatia, 22-26 May 2017.
[8] C. Wangwatcharakul and S. Wongthanavasu, "A novel temporal recommender system based on multiple transitions in user preference drift and topic review evolution," Expert Systems with Applications, vol. 185, Article ID: 115626, Dec. 2021.
[9] M. Nilashi, O. Ibrahim, and K. Bagherifard, "A recommender system based on collaborative filtering using ontology and dimensionality reduction techniques," Expert Systems with Applications, vol. 92,
pp. 507-520, Feb. 2018.
[10] X. L. Zheng, et al., "A hybrid trust-based recommender system for online communities of practice," IEEE Trans. on Learning Technologies, vol. 8, no. 4, pp. 345-356, Oct./Dec.. 2015.
[11] N. S. Sani and F. N. Tabriz, "A new strategy in trust-based recommender system using k-means clustering," International J. of Advanced Computer Science and Applications, vol. 8, no. 9, pp. 152-156, Sept. 2017.
[12] V. Nobahari, M. Jalali, and S. J. S. Mahdavi, "ISoTrustSeq: a social recommender system based on implicit interest, trust and sequential behaviors of users using matrix factorization," J. of Intelligent Information Systems, vol. 52, no. 2, pp. 239-268, Jul. 2018.
[13] B. AlBanna, "Interest aware location-based recommender system using geo-tagged social media," ISPRS International J. of Geo-Information, vol. 5, no. 12, Article ID: 245, 2016.
[14] A. H. Celdrán, M. G. Pérez, F. J. García Clemente, and G. M. Pérez, "Design of a recommender system based on users' behavior and collaborative location and tracking," J. of Computational Science, vol. 12, pp. 83-94, Jan. 2016.
[15] E. Khazaei and A. Alimohammadi, "An automatic user grouping model for a group recommender system in location-based social networks," ISPRS International J. of Geo-Information, vol. 7, no. 2, Article ID: 67, 2018.
[16] H. Gao, et al., "Content-aware point of interest recommendation on location-based social networks," Proc. 29th AAAI Conf. on Artificial Intelligence, vol. 29, no. 1, pp. 1721-1727, Feb. 2015.
[17] H. Tahmasbi, M. Jalali, and H. Shakeri, "Modeling temporal dynamics of user preferences in movie recommendation," in Proc. 8th Int. Conf. on Computer and Knowledge Engineering, ICCKE'18, pp. 194-199, Mashhad, Iran, 25-26 Oct. 2018.
[18] P. Kefalas and Y. Manolopoulos, "A time-aware spatio-textual recommender system," Expert Systems with Applications, vol. 78, pp. 396-406, Jul. 2017.
[19] K. B. Fard, et al., "Recommender system based on semantic similarity," International J. of Electrical & Computer Engineering, vol. 3, no. 6, pp. 751-761, Dec. 2013.
[20] R. Urena, et al., "A review on trust propagation and opinion dynamics in social networks and group decision making frameworks," Information Sciences, vol. 478pp. 461-475, Apr. 2019.
[21] M. Ghavipour and M. R. Meybodi, "A dynamic algorithm for stochastic trust propagation in online social networks: learning automata approach," Computer Communications, vol. 123, pp. 11-23, Jun. 2018.
[22] H. Xue, Q. Wang, B. Luo, H. Seo, and F. Li, "Content-aware trust propagation toward online review spam detection," J. of Data and Information Quality, vol. 11, no. 3, Article ID: 11, 31 pp., 2019.
[23] H. Ying, et al., "Time-aware metric embedding with asymmetric projection for successive POI recommendation," World Wide Web, vol. 22, no. 5, pp. 2209-2224, Jun. 2019.
[24] D. Rafailidis and A. Nanopoulos, "Modeling users preference dynamics and side information in recommender systems," IEEE Trans. on Systems, Man, and Cybernetics: Systems, vol. 46, no. 6, pp. 782-792, Jun. 2015.
[25] G. Adomavicius and A. Tuzhilin, "Context-aware recommender systems," in Recommender Systems Handbook, Springer, pp. 191-226, 2011.
[26] N. Lathia, S. Hailes, L.Capra, and X. Amatriain, "Temporal diversity in recommender systems," in Proc. of the 33rd Int.l ACM SIGIR Conf. on Research and Development in Information Retrieval, pp. 210-217, Geneva Switzerland, 19-23 Jul. 2010.
[27] I. Xiong, et al., "Temporal collaborative filtering with bayesian probabilistic tensor factorization," in Proc. of the 2010 SIAM Int. Conf. on Data Mining, pp. 211-222, Columbus, OH, USA, 29 Apr.-1 May 2010.
[28] F. Roy and Hasan, "Comparative analysis of different trust metrics of user-user trust-based recommendation system," Computer Science, vol. 23, no. 2, pp. 335-373, 2020.
[29] P. Bedi, "Combining trust and reputation as user influence in cross domain group recommender system (CDGRS)," J. of Intelligent & Fuzzy Systems, vol. 38, no. 5, pp. 6235-6246, 2020.
[30] A. Richa and P. Bedi, "Trust and distrust based cross-domain recommender system," Applied Artificial Intelligence, vol. 35, no. 4, pp. 326-351, Mar. 2021.
[31] Z. El Yebdri, S. M. Benslimane, F. Lahfa, M. Barhamgi, and D.Benslimane, "Context-aware recommender system using trust network," Computing, vol. 103, no. 9, pp. 1-19, Sept. 2021.
[32] E. Asani, H. Vahdat-Nejad, and J. Sadri, "Restaurant recommender system based on sentiment analysis," Machine Learning with Applications, vol. 6, Article ID: 100114, Dec. 2021.
[33] I. M. G. Cardoso, J. L. V. Barbosa, B. M. Alves, L. P. S. Dias, L. C. Nesi, "Vulcont: A Recommender System based on Contexts History Ontology," IET Software, vol. 16, no. 1, pp. 111-123, Feb. 2022.
[34] Y. D. Seo and Y. S. Cho, "Point of interest recommendations based on the anchoring effect in location-based social network services," Expert Systems with Applications, vol. 164, Article ID: 114018, Feb. 2021.
[35] V. Milias and A. Psyllidis, "Assessing the influence of point-of-interest features on the classification of place categories," Computers, Environment and Urban Systems, vol. 86, Article ID: 101597, Mar. 2021.
[36] P. Han, et al., "Point-of-interest recommendation with global and local context," IEEE Trans. on Knowledge and Data Engineering, vol. 34, no. 11, pp. 5484-5495, Nov. 2021.
[37] S. Agrawal, D. Roy, and M. Mitra, "Tag embedding based personalized point of interest recommendation system," Information Processing & Management, vol. 58, no. 6, Article ID: 102690, Nov. 2021.
[38] W. Fang, et al., "A resilient trust management scheme for defending against reputation time-varying attacks based on BETA distribution," Science China Information Sciences, vol. 60, no. 4, pp. 1-11, Apr. 2017.
[39] M. E. Moe, B. E. Helvik, and S. J. Knapskog, "Comparison of
the beta and the hidden markov models of trust in dynamic environments," in Proc. IFIP Inte. Conf. on Trust Management, pp. 283-297, West Lafayette, IN, USA, 15-19, Jun. 2009.
[40] X. Wu, et al., "BLTM: beta and LQI based trust model for wireless sensor networks," IEEE Access, vol. 7, pp. 43679-43690, 2019.
[41] س. شيباني و ح. شاكري، "بهبود سيستمهاي پيشنهاددهنده با استفاده از يك مدل لايهاي اعتماد آگاه از اطمينان،" مجله فناروي اطلاعات در طراحي مهندسي، سال 9، شماره 2، صص. 73-62، پاييز و زمستان 1395.
[42] Z. Wu and M. Palmer, "Verbs semantics and lexical selection," in Proc. of the 32nd Annual Meeting on Association for Computational Linguistics, pp. 133-138, Las Cruces, NM, USA, Jun. 1994.
[43] Yelp, Yelp2018 Challenge Dataset, 2018.
[44] Y. Liu, T. –A. Nguyen Pham, G. Cong, and Q. Yuan, "An experimental evaluation of point-of-interest recommendation in location-based social networks," Proceedings of the VLDB Endowment, vol. 10, no. 10, pp. 1010-1021, Jun. 2017.
[45] E. Cho, S. A. Myers, and J. Leskovec, "Friendship and mobility: user movement in location-based social networks," in Proc. of the 17th ACM SIGKDD Int. Conf. on Knowledge Discovery and Data Mining, pp. 1082-1090, San Diego, CA, USA, 21-24 Aug. 2011.
[46] L. Ardissono and N. Mauro, "A compositional model of multi-faceted trust for personalized item recommendation," Expert Systems with Applications, vol. 140, Article ID: 112880, Feb. 2020.
سمانه شیبانی مدارک كارشناسي و كارشناسي ارشد خود را در رشته مهندسی کامپیوتر بهترتیب در سالهای 1392 و 1395 دریافت نمود و هماکنون دانشجوی دکتری رشته مهندسی کامپیوتر دانشگاه آزاد اسلامی مشهد میباشد. زمينههاي تحقيقاتي مورد علاقه ايشان عبارتند از سیستمهای پیشنهاددهنده، مدیریت اعتماد، شهر هوشمند و دادهکاوی.
حسن شاکری مدارک کارشناسی، کارشناسی ارشد و دکتری خود را به ترتیب در سالهای 1374، 1376 و 1393 از دانشگاههای فردوسی مشهد، صنعتی شریف و فردوسی مشهد دریافت کرد و از سال 1377 به عنوان عضو هیأت علمی گروه کامپیوتر در دانشگاه آزاد اسلامی واحد مشهد مشغول به کار است. زمینههای تحقیقاتی مورد علاقه ایشان عبارت است از امنیت سیستمهای کامپیوتری، دادهکاوی، سیستمهای پیشنهاددهنده، مدلسازی و تحلیل شبکههای اجتماعی و مدیریت اعتماد.
رضا شیبانی مدرک دکتری خود را در رشته انفورماتیک پزشکی در سال 1395 از دانشگاه علوم پزشکی مشهد دریافت کرد و در حال حاضر عضو هیأت علمی و مدیر گروه مهندسی کامپیوتر دانشگاه آزاد اسلامی مشهد میباشد. زمینههای تحقیقاتی مورد علاقه ایشان عبارت است از بیوانفورماتیک، سیستمهای پیشنهاددهنده و دادهکاوی.
[1] این مقاله در تاریخ 19 خرداد ماه 1401 دریافت و در تاریخ 13 مهر ماه 1401 بازنگری شد.
سمانه شیبانی، گروه مهندسي کامپيوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران، (email: s.sheibani@mshdiau.ac.ir).
حسن شاکری (نویسنده مسئول)، گروه مهندسي کامپيوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران، (email: shakeri@mshdiau.ac.ir).
رضا شیبانی، گروه مهندسي کامپيوتر، واحد مشهد، دانشگاه آزاد اسلامی، مشهد، ایران، (email: sheibani1063@mshdiau.ac.ir).
[2] . Reputation
[3] . Wu & Palmer