文 献 综 述
1、前言
所有企业的生存和发展除了依仗经济和市场以外,还有左右其发展的一个重要因素那就是当时环境下的国家政策。这也是作为一个企业管理者所必备的一项技能。众所周知,当今的政策每时每刻都在因为适应新的格局或者解决新的问题在不断的做着修改和制定,所以这其中的信息量是非常大的。而且政策类型多种多样,有宏观到国家整体发展的,也有细微到落实在各个地方时产生的新的地方政策,涵盖了科研、医疗、民生、经济等等各个方面。那么如何及时的准确的找到与自身企业有关的,甚至是能直接裨益企业当下发展的政策,成为了一个亟待解决的问题。
而在目前个性化推荐系统的研究备受瞩目,它现在多数是建立在海量数据挖掘基础上的一种高级商务智能平台,向顾客提供个性化的信息服务和决策支持。它的主要功能是通过综合并利用用户的兴趣偏好、属性,商品的属性、内容、分类,以及用户之间的社交关系等等,挖掘用户的喜好和需求,主动向用户推荐其感兴趣或者需要的商品。所以这就为本研究提供了一个方向,通过建立一个专门服务于企业根据其特性和需求为其提供精准有效政策信息的个性化推荐系统,来解决上述问题。
为此本研究收集了国内外相关的各种文献资料,希望能从这些资料中受到启发,学习他们的研究方法和研究思路,并在这些基础上提出新的见解。
2.国外研究现状
Adomavicius G和Sankaranarayanan R[1]提出了一种多维推荐系统(md)的方法,它可以在现有推荐系统中的用户和项目的典型信息之外,根据额外的上下文信息提供建议。这种方法支持多维度、特征分析信息和建议的分层聚合。他们还提出了一种多维评级估计方法,能够选择与推荐上下文相关的二维评级段,并将标准协同滤波或其他传统的二维评级估计技术应用于这些段。对多维和二维评价方法进行了比较,并对两者之间的权衡进行了研究。此外,他们有一个进步点在于介绍了一种联合评价方法,该方法能够识别md方法优于标准二维方法的情况,并在其他情况下使用md方法和标准二维方法。不过单单根据上下文分析信息其实还是有一定的分析缺陷的,因为这样可能因为分析规则制定的局限性不能给出更加细致的建议。
Robin Burke[2]认为抽象推荐系统表示用户首选项,目的是建议购买或检查的项目。它们已成为电子商务和信息获取的基本应用,提供了有效减少大量信息空间的建议,从而使用户能够选择最符合其需要和喜好的项目。为执行建议提出了各种技术,包括基于内容的、协作的、以知识为基础的技术和其他技术。为了提高性能,这些方法有时会被混合推荐。他调查了实际和可能的混合推荐人的情况,介绍了一种新型的混合推荐系统,即以知识为基础的推荐和协同过滤相结合的推荐餐馆的系统。他的进步在于从系统的知识部分得到的语义评分进一步提高了协同过滤的有效性,而且这种方法以知识为基础可以进一步提高用户深入了解推荐餐厅的兴趣。
Azene Zenebe和Anthony F[3]认为项目特征的抽象表示和用户反馈,以及关于它们之间关系的推理是推荐系统中的主要问题。这是因为项目特征和用户反馈是主观的、不精确的和模糊的。他们提出了一种模糊集理论方法,用于处理由于数据的主观性、模糊性和不准确性而引起的非随机不确定性,以及所考虑的领域知识和任务。研究进一步推进了模糊建模在Ronald Yager首次提出的基于内容的推荐系统中的应用。他们的研究其实为我们提供了一个新的可能性,那就是在模糊环境中如何推进并完善的用户画像。
Jonathan L. Herlocker和Joseph A. Konstan[4]认为推荐系统的评价方法很多,往往是无与伦比的。他们回顾了评估协同过滤推荐系统的关键决策:被评估的用户任务,被使用的分析和数据集的类型,测量预测质量的方法,除质量以外的预测属性的评估,并对整个系统进行基于用户的评价。除了回顾先前研究者使用的评估策略外,他们还提出了在一个内容域上对各种精度度量的分析的经验结果,在这个域中,所有被测试的度量大致都分解为三个等价类。每个等价类内的度量都有很强的相关性,而来自不同等价类的度量则是不相关的。因为度量的层次性的规划,能够更直观的用户评价的反馈做出更加细节性的分析和处理。
Fidel Cacheda和 Víctor Carneiro[5]认为协同过滤技术在生成个性化推荐方面尤为成功。尽管没有对不同的策略进行比较,但十多年的研究已经产生了许多算法。事实上,目前还没有一种公认的协作过滤算法。在这项工作中,他们比较了文献中发现的不同技术,并研究了每种技术的特点,突出了它们的主要优点和缺点。使用最流行的度量和算法进行了几个实验。此外,还提出了两个新的指标,用于衡量好的项目的精确度。结果表明,特别是在稀疏性条件下,许多算法在从用户配置文件中提取信息时存在缺陷。他们还确认了其他作者已经报道的基于svd的技术的良好结果。他们对于协同过滤技术的研究让我们能够更加深入的了解协同过滤的特点,指定的新的指标也有助于我们更好的去从用户配置文件中提取信息的完成。
3.国内文献述评
王培培[6]认为,互联网用户已达数以亿计的规模,不同的用户具有的用户特征也千差万别,如何根据用户特征预测用户的兴趣,在互联网众多繁杂的资源中为用户推荐其感兴趣或者潜在需要的信息,显然成为当前所研究的热点方向。她从用户特征的角度对推荐算法进行相关的研究,针对用户的标签特征和用户个体的重要程度,她提出一种基于多标签聚类和核心用户的推荐算法。首先,充分考虑用户个体的重要程度,先利用密度峰值聚类算法对用户标签进行聚类,然后研究用户间和标签间的潜在关系,初次定义用户与标签类簇关联度和用户位置权重概念,提出一种基于多标签聚类的核心用户确定方法。她应用这种聚类的方法去设置权重,让我们在预测用户兴趣的过程中多了一条分析的方法。
郭艳霞[7]认为以某市人才中心的真实数据为出发点,提取数据库中的求职信息、招聘信息相关的数据表作为研究的对象。对数据表进行预处理,如除去空缺严重的字段及重复录入的文档,然后进行分词处理,最后再进行双方匹配。在数据表中,以文本描述为主的字段作为本文信息匹配的数据集,针对文本字段采用最大逆向匹配的分词方法,进行分词预处理及向量化表示。可以采用三种方法进行匹配探索。第一种方法:以求职者向量与公司向量之间的相同词汇的个数作为相似度,针对相似度排序。以求职者为主体,为个人推荐5个公司,反之以公司为主体,向公司推荐10个求职者。通过调阅相关的求职与招聘信息,发现匹配效果不够理想。第二种方法:改进相似度的定义方法,具体做法是借助外部数据筛选人才中心的特征词,给出特征词的权重,利用权重计算相似度,即将第一种方法中的特征词权重1改为卡方值,匹配效果较好。第三种方法:与第二种相似,也是改进相似度的定义方法,区别在于借助自身的其它属性中的分类信息筛选特征词,给出特征词权重。她的分词匹配方法,重视在实际中的应用,所以从真实数据进行分析,给出的特征词的权重分配也更加具有落地性。
赵泉[8]认为在个性化推荐中, 首先探讨用户兴趣的获取, 进而建立兴趣模型, 将其保存在兴趣库的存储介质中, 在以后的使用过程中, 其兴趣是不断修正的, 将兴趣与图书标记相匹配, 则其结果就是推荐。要实现个性化的推荐, 首先要得到个性化。获得用户兴趣的方法很多, 主要有几种:第一种是用户自己确定, 可以采用用户注册的时候直接确定兴趣的方法来实现, 但如果用户兴趣发生变化的话, 就会变得比较麻烦, 所以, 这种方式用来解决推荐系统冷启动等问题比较好。第二种方法是系统自动获得, 系统根据用户的浏览记录或借阅记录, 来逐步地确定用户的兴趣, 这是一个不断修正的过程, 也是目前研究比较多的内容。第三种方法是他人推荐, 通过采集与用户在一个圈子, 同一个社区等的兴趣, 通过这些共性的兴趣来进行推荐, 也就是说, 你朋友喜欢的, 你也应该喜欢。另外, 还可以借鉴微博等的标签的概念, 让读者在阅读书籍后可以对此书做一些标记, 即加标签。这些标记以及所加的标签是可以帮助推荐的。他更加注重用户画像的建立,而且它突出的特点在于不停的修正,这个特点非常好,因为人不是一成不变的是在不停变化的,这种分析兴趣的方式能既有更长的生命力。
彭玉钒[9]认为个性化推荐技术是一种信息过滤的手段,可以挖掘用户兴趣偏好,并根据目标用户的兴趣向用户推荐他们感兴趣的信息,提供针对用户的个性化服务,解决了信息过载的问题,降低用户搜索、整理、分析资料的时间和金钱成本。推荐系统的关键技术之一是围绕用户兴趣的建模,只有准确地挖掘出用户的兴趣,才能研究出准确度高的推荐算法,进而提升用户的体验。他的研究目标非常的明确那就是针对用户兴趣的建模,把用户体验放在第一位是我们所有服务类技术的第一标准。
王国霞和刘贺平[10]认为解决信息超载问题的一个非常有潜力的办法是个性化推荐系统, 它是根据用户的信息需求、兴趣等, 将用户感兴趣的信息、产品等推荐给用户的个性化信息推荐系统。和搜索引擎相比推荐系统通过研究用户的兴趣偏好,进行个性化计算, 由系统发现用户的兴趣点, 从而引导用户发现自己的信息需求。一个好的推荐系统不仅能为用户提供个性化的服务, 还能和用户之间建立密切关系, 让用户对推荐产生依赖。他们提出的依赖性目前也是我们在设计过程非常关键的一环,一个不能产生用户依赖的系统是不能长时间运作下去的。
张野[11]认为现在对于推荐算法的研究,由于对准确率的追求,导致各类算法越来越臃肿,性能消耗太大,难于投用在实际中,所以推荐系统中推荐算法仍然有待于改进。并发现随机行走算法的低计算量和高精确度特性使它成为一个很好的基础算法,加上对用户历史上下文信息的偏移,可以使得结果更偏向用户历史中评分更高,更愿意选择的项目。再加上一些对上下文属性学习的研究,使得整体推荐结果更好。他的研究更加推荐融合随机行走算法的特点,确实能够因地制宜的提高推荐系统的效率性,但是对于准确率的要求才是推荐系统晋升的方向,只是目前我们没有一个合适的算法来解决这方面的问题。
王凯[12]强认为面对海量数据,如何把这些数据转化为结构化数据,更加准确地抽取目标信息,并基于这些信息进一步研究成为当前的热点研究方向。基于微博的用户数据,从特征工程入手,从不同角度提取用户的特征,主要包括数值特征、主题特征、文本特征以及根据社交网络提取并优化的用户网络特征,进而将用户的信息抽取转化为一个多分类问题,并基于半监督学习的级联模型进行了用户职业关系抽取,提高了社交网络环境下关系抽取的准确性。并且在用户职业关系抽取的基础上设计了人才圈发现框架。该框架从基本用户特征、时空特征、语义特征、文本特征、网络特征等多个维度对用户进行相似度计算,同时应用逻辑回归算法确定不同类型特征的权重,进而设计了用户综合相似度计算的方法,并应用DBSCAN算法优化K-means算法初始点的选取,提高人才圈发现的准确性。他在实际模型中做了信息特征性的分析,设计出了人才圈发现的结构框架,在目前的互联网环境下,确实能够解决很多评级问题,但是更多的发现更多的特性依旧是该结构的发展方向。
顾娉娉[13]认为作为电子商务平台上必不可少的推荐系统,模拟线下的销售员和用户面对面沟通,向用户推荐商品,通过和用户的交互让用户最终完成购买等这一连串在销售行为中最为核心的过程。她提出一种适合垂直B2C电子商务平台上的推荐系统,它会利用电子商务平台上既有的商品类目结构来优化推荐结果,并针对垂直B2C电子商务平台所独有的特点来完善推荐系统的效果,还会把B2C电子商务平台一些基于知识或经验的规则应用到这个推荐系统里面。她提出的的模拟推荐过程确实是推荐系统自动化完成的一个重要部分,但是如何批量完成个性化推荐依旧是一个需要解决的问题。
倪鹏飞[14]认为电子商务个性化推荐系统(Personalized Recommendation System in E-commerce),是建立在数据挖掘基础上的一种高级智能商务系统,帮助电子商务网站为其顾客购物提供个性化的商品推荐和信息服务。电子商务个性化推荐系统在电子商务网站得到了广泛应用,扮演着重要角色,在为网站顾客提供快速准确的商品推荐、促进顾客购买、提供个性化服务、提高网站交叉销售能力等方面发挥越来越重要的作用。在他的系统中,顾客满意度则是企业提高竞争力的重要因素,能够提升顾客的忠诚度并促进顾客的重复购买。因此,提高个性化推荐系统的顾客满意度对电子商务企业具有重要意义。
谢克武[15]认为大数据背景下, 各行各业都需要数据支持, 如何在浩瀚的数据中获取自己感兴趣的数据, 在数据搜索方面, 现在的搜索引擎虽然比刚开始有了很大的进步, 但对于一些特殊数据搜索或复杂搜索, 还不能很好的完成, 利用搜索引擎的数据不能满足需求, 网络安全, 产品调研, 都需要数据支持, 而网络上没有现成的数据, 需要自己手动去搜索、分析、提炼, 格式化为满足需求的数据, 而利用网络爬虫能自动完成数据获取, 汇总的工作, 大大提升了工作效率。在目前来看,网络爬虫在搜素引擎中的应用确实很关键,自动化的批量完成数据获取是当前非常重要的一门技术。
朱后坤[16]认为推荐系统直接与用户交互,模拟商家向用户提供商品推荐服务,在海量的商品信息中发现用户真正所需的商品。近年来,关于推荐系统的研究在理论上和实践上取得巨大的进展,然而它依然面临着一系列的挑战,比如推荐准确度、关系矩阵的稀疏性等。协同过滤是推荐系统中最核心和应用最为广泛的技术之一。基于内存的协同过滤是协同过滤技术的重要分支通常被划分为两类:基于用户的协同过滤和基于项目的协同过滤。不论以上哪种协同过滤技术,其关键在于选取真正相似的邻居集。他的推荐系统的重要关注点在于分析后的准确性,并提出协同过滤中的邻居集的观点,把握了协同过滤的关键点
孔维梁[17]认为人们在享受Internet带来的便利的同时,也不得不面对浩如烟海的数据以及大量的垃圾信息,这就带来了著名的“信息过载”和“信息迷航”问题。个性化推荐系统此时应运而生,它能够感知用户的兴趣或需求,而后实现个性化的资源推荐,有效的解决了“信息过载”和“信息迷航”问题。在个性化推荐系统中,协同过滤算法是目前最成功也是应用最广泛的技术之一,但随着用户数的增加以及系统规模的扩大,协同过滤技术面临诸多挑战。
朱文奇[18]认为推荐系统是一种个性化的信息服务,能够很好地充当用户和信息资源之间的桥梁。推荐系统通过建立模型,对用户的需求进行描述,再通过某种推荐策略将特定的信息资源主动推荐给目标用户。由于推荐系统具有个性化和智能化等特点,其在电子商务、社交网站和影音站点取得了巨大的成功,已经成为这些应用平台的核心子系统。基于协同过滤的推荐系统是应用最为广泛、研究最为深入的一类推荐系统,这类推荐系统算法的关键是寻找用户或者项目的邻居,邻居寻找的准确性决定了最后推荐结果的质量,而邻居的寻找依赖于用户或者项目相似度的计算,因此设计一个适合的相似度计算方法是推荐算法成功的关键问题。他认为的寻找邻居是实现建模的关键,所以提出了相似度的计算是完成协同过滤的重要方法。
薛光明[19]认为利用中国知网文献查询系统, 按“主题”依次对“北京中关村创新发展”、“北京中关村创新政策”、“北京中关村创新政策分类”进行查询, 截至2016年11月3日, 三个主题的文献数量依次为926份、233份、13份, 年份跨度依次为1989-2016、1994-2016、2003-2016。由查询结果可以看出,即从创新政策分类角度研究北京中关村创新发展的文献数量较少。其中, 有代表性的是张永安等 (2016) 在研究区域科技创新政策时, 将政策分类为权威型、指导型、紧迫型及阶段型四个类别, 以中关村的数据为基础, 并通过功能类型、作用强度、资源供给、金额力度及持续效力对比分析了不同类型区域科技创新政策的特点。现在的政策分类太多门类,需要一个比较统一的分类方法。
4.结论
从国内外学者的研究方向,我们不难发现,在未来,个性化推荐的研究方向还是朝着完全智能化的道路前进,从目前的从旁侧推的分析用户需求、兴趣和习惯,会转变成收集个人的所有数据完成每个人的个人信息画像,从更加细节的方面分析用户的所有可能性。我们的生活中的智能化将会成为日常生活中的一项常见生活环境,我们的信息的获取从目前的自我主动获取会转变信息的主动涌递。这对于生活环境的丰富性增添了新的可能。智能推荐系统以后也一定会成为所有检索系统中的一项必备子系统,智能化也会成为时代的潮流。
参考文献
[1] Adomavicius G, Sankaranarayanan R, Shahana S, et al.Incorpo rating contextual information in recommendation systems us ing a multidimensional approach[J].ACM Transactions on Infor mation Systems, 2005, 23 (1) :103-145.
[2 ]Hybrid Recommender Systems: Survey and Experiments[J] . Robin Burke. User Modeling and User-Adapted Interaction . 2002 (4)
[3] Norcio; Representation, similarity measures and aggregation methods using fuzzy sets for content-based recommender systems[J] . Azene Zenebe,Anthony F. Norcio. Fuzzy Sets and Systems . 2008 (1)
[4] Evaluating collaborative filtering recommender systems[J] . Jonathan L. Herlocker,Joseph A. Konstan,Loren G. Terveen,John T. Riedl. ACM Transactions on Information Systems (TOIS) . 2004 (1)
[5] Comparison of collaborative filtering algorithms[J] . Fidel Cacheda,Víctor Carneiro,Diego Fernández,Vreixo Formoso. ACM Transactions on the Web (TWEB) . 2011 (1)
[6]王培培. 基于用户特征的个性化推荐算法研究[D].山东师范大学,2018.
[7]郭艳霞. 求职与招聘信息匹配算法的研究[D].东北师范大学,2016.
[8]赵泉.高校图书馆图书推荐系统研究[J].新余学院学报,2018,23(03):90-95.
[9]彭玉钒. 基于用户兴趣的推荐算法研究[D].江苏科技大学,2016.
[10]王国霞,刘贺平.个性化推荐系统综述[J].计算机工程与应用,2012,48(07):66-76.
[11]张野. 基于移动终端应用的用户兴趣推荐算法的研究与实现[D].北京邮电大学,2016.
[12]王凯强. 大数据环境下的用户信息抽取与分析[D].北京邮电大学,2018.
[13]顾娉娉. 基于商品类目结构的自适应推荐系统[D].浙江大学,2009.
[14]倪鹏飞. 基于顾客满意度的电子商务个性化推荐系统评价研究[D].河北大学,2015.
[15]谢克武.大数据环境下基于python的网络爬虫技术[J].电子制作,2017(09):44-45.
[16]朱后坤. 关于推荐系统的统计预测研究[D].上海交通大学,2010.
[17]孔维梁. 协同过滤推荐系统关键问题研究[D].华中师范大学,2013.
[18]朱文奇. 推荐系统用户相似度计算方法研究[D].重庆大学,2014.研究[D].江苏科技大学,2016.
[19]薛光明.北京中关村创新政策研究——基于一个政策分类框架[J].现代商贸工业,2016,37(32):121-123.