硕士研究生中期考核表
学 号
|
:
|
|
姓 名
|
:
|
|
研究题目
|
:
|
基于混合空间曲线的HBase多维索引构建及查询优化问题研究
|
导 师
|
:
|
|
学科专业
|
:
|
软件工程
|
学 院
|
:
|
信息学院
|
考核成绩
|
:
|
|
考核等级
|
:
|
○优秀 ○良好 ○合格 ○不合格
|
填 表 说 明
1、考核工作由各学院统一安排,各相关负责人组织和实施。
2、时间原则上安排在每年春季,一般于研究生入学后第四学期结束前完成,具体完成时间应按照我校对应的硕士研究生培养方案中所在学科中期考核的有关规定执行。
3、研究生本人在考核前通过研究生信息管理系统打印成绩单,附于中期考核表后,填写中期考核表中的自我评定栏目,并提交获奖证书、发表论文、录用函等相关证明材料。
4、导师对研究生的业务能力写出综合评定意见。
5、由各班辅导员在研究生自我评定和听取同学评议的基础上,统一对研究生思想品德状况进行量化考核,总分低于6分者视为不合格。
6、学院分党委或党总支对研究生的政治思想品德写出评定意见。
7、由班长统一将中期考核表交到各学院研究生秘书处进行研究生成绩审核和评分,并就开题报告是否完成进行审核。
8、研究生以PPT方式向考核小组汇报入学以来在课程学习、是否按照开题报告研究内容和进度开展科研工作、学位论文工作阶段成果、下一步研究计划及存在的问题、按期完成论文工作的可能性等方面的情况,时间应不少于10分钟,并接受考核小组提问,时间应不少于5分钟。
9、根据研究生的汇报及递交的材料,结合导师的评语及建议,由考核小组依据研究生中期考核表中的科研业务能力评估表客观、公正地逐项进行评审打分,并给出相应评定等级。
10、学院学位评定分委员会签署综合考核意见。
11、由相关负责人签署培养质量监控重点跟踪对象整改意见。
12、考核后的硕士生中期考核材料由学院存入学生个人培养档案。
13、此表用A4纸双面打印。
一、自我评定
|
1、个人总结(包括政治思想,业务学习、社会实践、健康情况,不少于300字。)
时光匆匆,一眨眼研究生生涯已过半。回首过去的一年多,我深感学有所获,同时也历经一些挑战。这段时间对我的成长和成熟起到了积极的推动作用。
在政治思想和道德品质方面,虽然未能如愿加入中国共产党,但我一直怀揣党的宗旨,时刻以党员的标准要求自己。运用科学发展观审视世界,认识社会,我清醒地意识到自己所承担的社会责任,对个人的人生理想和发展目标有了更为成熟的认识。我会继续努力,争取早日加入中国共产党,为党的事业贡献自己的一份力量。
在学习方面,我根据自身研究方向的要求,有针对性地深入研读了核心课程,为科研工作打下了坚实基础。在导师的指导下,积极参与了一些课题的研究,通过阅读教材、查阅学术资料和参考书籍,不断提升理论知识与实践水平。这个过程不仅增强了我的实践动手能力,也使我对研究方向有了更深入的了解,具备了自我学习、认真思考、善于钻研的能力。
在生活中,我与同学友好相处,积极参与各项集体活动。通过这段研究生生涯,我不仅在学业和科研上有了显著进步,个人素质也得到了全面培养。这段经历将成为我宝贵的人生财富。在未来的工作和学习中,我将保持严谨治学的态度,兢兢业业,争取让每一天都更充实、更有意义。
|
2、学位论文进展情况(包括论文开题以来学位论文研究工作进展情况、已取得的阶段成果、下一步工作计划与研究内容、目前遇到的困难、预计论文答辩时间等,不少于700字。)
本课题题目为基于混合空间曲线的HBase多维索引构建及查询优化问题研究。已取得的阶段性成果有:1、编写了Z、Hilbert、Onion、Gray等单一空间填充曲线的编码算法,并由此提出了混合空间填充曲线算法,并对这些空间填充曲线进行了性质测量。混合空间填充曲线提供了返回精度之上的裁剪功能,为后续的多维索引提供了支持二划分、性质比单一Z曲线更好的混合空间填充曲线。2、研究了齐父分布数据集与真实数据集分布特征的关系,能够通过代码生成可变维度、指定数量、固定种子的实验数据集。3、在MDHBase的基础上,提出了基于FullIndex、SparkStreaming的SFIHBase结构,提升了插入速度,并提供了并行插入的特性,编写了相关的系统代码。4、研究了SFIHBase的范围查询、KNN查询算法,并编写代码测试5、在课题组戴尔工作站上基于虚拟机搭建了Hadoop集群,并安装了HBase、ZooKeeper、Spark、Kafka等实验需要的组件。6、编写了MDHBase、GeoMesa、Hibase、Phoenix、HCIndex的插入代码,在工作站上完成了插入500万和1000万条数据的实验,初步编写测试了上述索引系统的范围查询、KNN查询代码。
下一步的工作计划和研究内容如下:1、SFIHBase索引表存储桶大小决定了数据索引层能够支持的粒度大小,从范围查询、KNN查询的底层角度建立查询代价公式。2、在前期基础上,设计范围查询和KNN查询实验,对比SFIHBase、MDHBase、GeoMesa、Hibase、Phoenix、HCIndex的范围查询、KNN查询的查询时间,验证SFIHBase查询性能。3、整理SFIHBase实现的实现细节,将SFIHBase的实现思路总结成示意图和伪代码。
目前遇到的困难:1、桶大小公式的自动化推导取决于如何设置查询,且根据目前的实验结果,查询所涉及到的因素众多,简单的线性化公式难以衡量。2、受到查询自主性的影响,难以衡量不同空间曲线之间点查询效率的不同,也就难以直观的量化具备优良性质的空间填充曲线的优势。对于第一个点,拟采用基于HBase Server端的查询代价而不是基于客户端查询时间的方法进行衡量。对于第二个点,通过使用齐父分布倾斜程度较高的数据集来解决,在足够倾斜的数据量预期会产生显著的实验结果。
基于以上叙述,预计将在一个月内完成工作计划和研究内容,于2024年二月初完成论文初稿,后续完善论文编写,于四月提交论文盲审,并于2024年六月进行论文答辩。
|
3、在学期间发表论文情况
|
论文名称
|
刊物
|
水平或等级
|
发表时间
|
本人排序
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
研究生签字:
年 月 日
|
二、思想品德考核(15分)
|
评估要素
(二级指标)
|
评估内容
(三级指标)
|
评分
标准
|
得分
|
政治素质
|
对四项基本原则的态度;参加政治学习和政治活动的态度;对党现行路线、方针、政策的态度
|
0-2
|
|
治学态度
|
学习目的、学习态度、刻苦钻研精神
|
0-2
|
|
道德修养
|
道德品质,尤其是学术道德品质
|
0-2
|
|
集体观念
|
关心集体、团结协作精神
|
0-2
|
|
组织纪律
|
党纪国法及校纪校规的遵守情况
|
0-2
|
|
获奖情况
|
获校级(含)以上奖励(附获奖证书复印件)
|
1-5
|
|
无
|
0
|
思想品德考核总评分
|
|
辅导员签字:
年 月 日
|
2、学院分党委/党总支对研究生思想品德综合评定意见:
负责人签字(加盖公章):
年 月 日
|
三、学习成绩考核(35分)
|
审核
项目
|
课程学习
总学分
|
30
|
学位课
总学分
|
23
|
是(否)完成培养方案要求
|
√ 是
○ 否
|
学分积
|
83.6
|
应扣分
|
0
|
学习成绩
|
29.2
|
开题报告是(否)完成
|
√ 是 ○ 否
|
备注:(1)学分积=∑(课程成绩×学分)/∑学分,不及格研究生课程成绩(含0分成绩)及重修成绩均纳入该公式计算。
(2)如所修课程未完成培养方案学分要求,则硕士研究生学位课:每缺一学分(-1分);选修课:每缺一学分(-0.5分)。
(3)硕士研究生学位课:每重修一门(-1.5分);选修课:每重修一门(-1分)。
(4)学习成绩=学分积×35%—应扣分。
|
学院研究生秘书核对无误后签字(章):
年 月 日
|
四、导师评价
|
评价内容:
该生学习态度端正,研究工作中严谨认真,能够定期与导师和团队沟通,积极进行研究工作研讨、交流,能够按照开题内容有计划地开展论文相关工作。
目前已经完成1.完成了空间曲线的编码和性质研究,实现了混合空间曲线算法2.完成了SFIHBase索引系统的结构设计,结构较其他研究具有创新度,并完成了基于该系统的优化的点查询、范围查询、KNN查询算法。3.完成了实验环境的搭建,完成了插入实验。4.已完成软著一篇,并获得纸质证书。
该生具有从事科研和工程项目能力,有继续培养的潜质。应进一步深入开展理论研究,1.根据查询实验推导桶大小参数对于查询的影响因素,在系统中实现桶大小参数的自动化设定2.完善范围查询和KNN查询算法,优化查询性能。并进一步完善实验,在实验环境下设计并进行范围查询和KNN查询实验,尽早完成全部研究工作。
|
导师签字:
年 月 日
|
五、科研业务能力考核(由考核小组评分)(50分)
|
评估要素
(二级指标)
|
评估内容
(三级指标)
|
评定
等级
|
评分
标准
|
得分
|
开题以来学位
论文进展情况
|
A、论文、标准、教材、专著、专利、报告、奖励和软硬产品进展好,阶段成果十分明显,能按期完成学位论文。
|
优秀
|
30-35
|
|
B、论文、标准、教材、专著、专利、报告、奖励和软硬产品进展较好,阶段成果比较明显,能按期完成学位论文。
|
良好
|
20-30
|
C、论文、标准、教材、专著、专利、报告、奖励和软硬产品进展一般,已取得部分阶段成果,基本能按期完成学位论文。
|
合格
|
10-20
|
D、论文、标准、教材、专著、专利、报告、奖励和软硬产品进展缓慢,尚未取得任何科研阶段成果,不能按期完成学位论文。
|
不合格
|
<10
|
学术论文
发表情况
|
A、正式发表学术论文1篇(含)以上(附正式文章发表复印件)、标准/教材/专著/专利/报告/奖励/软硬产品1项。
|
优秀
|
10-15
|
|
B、正式录用学术论文1篇(含)以上(附录用函复印件和稿样),或在申请标准/教材/专著/专利/报告/奖励/软硬产品1项。
|
良好
|
5-10
|
C、已撰写完成学术论文1篇(含)以上(附清样,同时需导师签字确认),或已完成标准/教材/专著/专利/报告/奖励/软硬产品1项。
|
合格
|
1-5
|
D、未撰写或未撰写完成学术论文、未完成标准/教材/专著/专利/报告/奖励/软硬产品。
|
不合格
|
0
|
科研业务考核总评分
|
|
评价内容(包括完成的主要工作、存在的主要问题和改进建议等):
1. 多维索引构建用在什么系统,目标是什么?
多维索引构建在分布式Nosql数据库HBase之上,目标是为HBase建立一套非主键索引,并提供高效点查询、范围查询、KNN查询方法。
2. 如何评价方法有效的?
在课题研究中,复现了GeoMesa、MDHBase等经典的系统,并与之进行了插入、查询上的性能对比实验,以验证本课题提出的索引性能。
3. 代码工作和伪代码的编写顺序问题?
顺序是反的,应该将代码工作写在前面,代码编写是系统编写的工作,伪代码编写工作是论文相关的工作。
4. 算法较为繁杂,建议梳理一下之间的关系,把他们连接在一起。
梳理相关算法和系统代码,形成易于阅读的文章内容。
|
考
核
小
组
|
组成
|
姓名
|
职称
|
工作单位
|
签字
|
组长
|
王春玲
|
副教授
|
北京林业大学信息学院
|
|
成员
|
杨波
|
副教授
|
北京林业大学信息学院
|
|
成员
|
段瑞枫
|
副教授
|
北京林业大学信息学院
|
|
成员
|
|
|
|
|
六、学科考核意见
|
建议考核等级:○ 优秀(90-100分) ○ 良好(80-89分)
○ 合格(60-79分) ○ 不合格(60分以下)
培养质量监控重点跟踪对象的确定:
○ 否
○ 是 整改环节:□ 思想品德 □ 学习成绩 □ 科研业务
年 月 日前完成整改(3个月内)。
需说明的其他情况:
负责人签字:
年 月 日
|
七、学院分委员会审核意见
|
是否同意学科考核意见:
主席签章(学院公章):
年 月 日
|
八、质量监控重点跟踪对象的整改情况
|
整改意见:
相关环节负责人签字:
年 月 日
|
注:表中需要选择的项目请在相应栏目中划“√”。