一、开题依据(研究目的、意义及国内外研究概况,附主要参考文献)
1. 研究目的、意义
随着计算机Office等软件和计算机网络的普及,电子版实验报告(Electronic experiment report)作为一种电子形式的作业类型,在各大高等院校和中等职业学校乃至中学的实验教学中被普遍采用。虽然它带来了许多方便:节约纸张、提交方便、随时批改等,但也存在学生抄袭方便快捷又不易的缺点。目前大学毕业论文的抄袭在很多的网上都有查重系统,通过比对其他发表的论文来检查是否出现重复抄袭的情况。但实验报告并没有一套对应的查重系统,专门关于实验报告抄袭的识别文献几乎没有,这并不意味着实验报告就没有抄袭的现象。
实验教学是高等院校实现人才培养目标的重要教学环节之一,是巩固理论教学、强化动手能力、培养创新意识和创新能力的重要环节,也是培养学生创造性思维、养成严谨、规范的操作习惯和照旧应用型人才的有效途径。而实验报告是把实验的目的、方法、过程、结果等记录下来,经过整理,写成的书面汇报。实验报告是检验学生实验过程是否认真的重要依据。学生的实验报告做得如何,关系到了学生的成绩如何,这就导致了部分学生为了得到好的成绩或者是为了应付老师,而抄袭他人的实验报告。
学生抄袭是不得不重视的学术现象,是一种非常不好的风气。学生把网络作为抄袭的工具和信息来源,利用“google”、“百度”、“万方数据”等搜集各种所需的实验报告,复制粘贴修改后就成为了自己的实验报告,不仅以方便为成本扼杀创新的才能,更以机会成本替代实验价值。不仅导致学风的败坏,产生浮躁的心理,还违背科学实验精神,制造实验泡沫,降低了科学实验水平。
对于学生个人,做实验是巩固理论,强化动手能力,培养创新意识和创新能力的重要环节。而对于老师而言,实验报告是检验学生对课程学习的一个程度指标,而学生实验报告查重是一件负担较重的任务,为了降低老师对实验报告查重部分的负担,提高过程监控质量,本论文实现一个便捷低成本的 基于SSM的实验报告查重系统,本系统主要采用Java、MySQL以及HTML技术,该系统为老师和学生提供实验报告查重服务,实现电子版实验报告的格式自动检查、抄袭自动识别等功等功能。在一定程度上对学生们起到一个警示作用:杜绝抄袭、踏实地做实验。
2.国内外研究概况
近年来,由于电子文档便于保存,查找和维护,目前高校学生提交的实验报告逐步由纸质版转向电子版。电子文档在带来便利的同时,也为学生的抄袭提供了极大便利。为了防止学生实验报告出现抄袭现象以及教师批改完报告需要人工汇总分数,统计缺交情况,这些功能那个费时费力,且容易出错,教师急需有效的查重和统分工具来减轻负担,把宝贵的精力投入到更有意义的工作中去。
在此之前,已经有人发表过论文查重系统。该系统能预防和打击学术不断的行为,营造良好的学术范围;同时可以迅速处理文章,大大提高编辑的工作效率,提升刊物的学术影响力。而当今论文查重系统可以说已经普遍用于各大毕业论文,例如知网,万方,维普等等。他们也给我们很多的案例。例如知网的硕士论文查重系统他分为几个模块,首先先从知网上录入数据并建立数据库后通过比对算法来算出查重率,从而判断一篇论文是否抄袭等等,虽然这些查重系统普遍存在漏洞但是仍然很有效果,大大减少了论文抄袭的现象。
现在中国知网(CNKI)旗下的有多种版本的检测系统,比较常见的如VIP(学术不端文献检测系统)、TMLC(学位论文学术不端行为检测系统)、 AMLC(科技期刊学术不端检测系统)、SMLC(社科期刊学术不端检测系统)、英文检测系统、中英文对照检测系统等。最近PMLC(大学生论文抄袭检测系统)和中学生作文检测系统也陆续推出……在国内掀起了一股反学术不端行为的狂潮。CNKI的TMLC2系统是目前最受关注的检测系统,因其为广大院校所采用,用于检测学生(硕博)学位论文的原创性和真实性。上传论文后,系统会自动检测该论文的章节信息,如果有自动生成的目录信息,那么系统会将论文按章节分段检测,否则会自动分段检测。
同时知网论文查重存在着一些不足之处,例如知网查重体系录入文献完好性问题,万方、维普数据库与国内很多期刊具有协作,但三家数据库所录入的期刊并不彻底重合。形成各家录入论文存在差异,导致学术不端检测的成果呈现差异。假如抄袭了回溯建库之前的文献,则数据库无法查实。并且万方数据库都别离与部分科技期刊编辑部签订了独家协作协议,形成其他数据库的计算原源献的缺失。此外,现在知网检测体系对图书的录入还有很大空缺,假如论文抄袭的是图书内容,现有体系无法检测数来。
基于此,本系统将实验报告原模板剔除,用SanHash+海明距离计算相似度,同时加入百度的图片查重接口,提高实验报告查重的质量。
3. 参考文献
[1]潘理虎,张雷,解丹,陈立潮,赵淑芳.面向实践教学的作业查重系统[J].软件工程,2019,22(05):35-38.
[2]王添男,冯锋.基于SimHash的文本相似检测算法研究[J].电子测试,2019(15):87-89.
[3]冉崇善,邵春霞.Simhash算法在试题查重中的应用[J].软件导刊,2018,17(02):151-153+157.