摘 要
电影推荐网站的研究对于解决电影数据复杂性以及用户需求多样性具有重要的意义。针对电影推荐系统网站中推荐准确率低,数据稀疏和冷启动等问题,详细阐述了国外六大主流电影推荐网站系统的内部结构,信息量和推荐方式;重点阐述了各网站的推荐异同以及可优化方案,进而通过新用户对电影进行评分的冷启动实验,详细分析冷启动解决方法与效果;最后指出当前电影推荐网站的现状及问题,对推荐系统相关理论及其发展趋势进行了分析和展望,并为实际应用中解决冷启动与数据稀疏等问题提供参考依据.针对现有推荐系统电影评分不实,影响推荐精确度的问题,本文设计了一个基于电影影评的电影推荐系统.本系统首先利用网络爬虫技术获取电影影评,然后对抓取到的数据进行分析和预处理,挖掘出电影影评中的关键词并进行正负词性的分类,然后计算出影评的好评率,根据好评率进行电影推荐,可以使得推荐结果更符合用户的偏好和需求.实验结果表明,利用影评好评率进行推荐大大提高了电影推荐的精确度,可以有效保证电影推荐系统的推荐质量。
本次电影推荐系统涉及到的编程语言包含Python、Html5、JQuery、CSS3以及SQLite数据库编程。用到的框架是Django重量级web框架,通过该框架连接系统的前、后端,用户首先需要填写用户名、密码以及邮箱注册系统,然后才能登陆推荐系统。
关键词:Python;Django;sqlite3;推荐系统;电影推荐
Abstract
The research of film recommendation website is of great significance to solve the complexity of film data and the diversity of user needs. Aiming at the problems of low recommendation accuracy, sparse data and cold start, this paper expounds the internal structure, information quantity and recommendation method of six major foreign film recommendation websites. Finally, the current situation and problems of film recommendation website are pointed out, and the related theory and development trend of recommendation system are analyzed and prospected. In view of the problem that the film score of the existing recommendation system is not real and affects the accuracy of the recommendation, this paper designs a film recommendation system based on the film review. The system first uses web crawler technology to obtain film reviews, then analyzes and preprocesses the captured data, excavates the key words in film reviews and classifies positive and negative words. Then calculate the film review rate, according to the rate of film recommendation, can make the recommended results more in line with user preferences and needs. The experimental results show that the recommendation rate greatly improves the accuracy of film recommendation and can effectively guarantee the recommendation quality of film recommendation system.
The programming language involved in this film recommendation system includes Python、Html5、JQuery、CSS3 and SQLite database programming. The framework used is Django heavyweight web framework, which connects the front and back end of the system. Users first need to fill in the user name, password and mailbox registration system before they can log in to the recommendation system.
Keywords: Python;Django;sqlite3; recommendation system; movie recommendation
目 录
摘 要
Abstract
1绪论
1.1选题背景及意义
1.2国内外研究现状
1.3推荐算法研究
1.3.1协同过滤算法
1.3.2基于内容的推荐算法
1.3.4基于标签的推荐算法
1.4本文研究目标和研究内容
2相关技术介绍
2.1系统实现相关技术的研究
2.2 Python语言研究
2.3 Django框架研究
2.4 SQLite数据库研究
3系统分析
3.1需求分析
3.2可行性分析
3.2.1社会可行性分析
3.2.2 技术可行性分析
3.3用户功能需求
4系统设计
4.1系统总体架构
4.2电影爬虫的模型设计
4.3数据库介绍与设计
4.3.1实验数据集介绍
4.3.2数据库逻辑结构设计
4.4.3系统E-R图
4.4.4系统数据表设计
5系统实现
5.1数据集处理模块
5.2注册登录模块
5.3电影分类模块
5.4用户评分反馈模块
5.5用户评分记录模块
5.6推荐算法模块
5.7显示推荐模块
6系统测试
6.1测试方法
6.2系统功能测试
7总结与展望
7.1总结
7.2不足之处及未来展望
参考文献
致 谢