子课题的主要任务
数字化信息系统中,信息的快速存储与传递至关重要。然而,在信息系统进行信息采集和传输过程中,后台数据存储中心存在大量的冗余数据,冗余数据会造成通讯和存储资源浪费,并消耗系统宝贵的电源。本子课题的主要任务是基于在线重复数据删除技术,优化系统的数据存储和传输机制,提高存储空间和带宽利用率,减少系统功耗。
子课题的要求
1、了解和掌握在线重复数据删除技术的基本原理;
2、设计基于信息系统的重复数据删除机制;
3、在Linux环境下实现一个基于信息系统的重复数据删除原型系统,并进行初步验证和性能测试。
毕业设计(论文)完成的形式
1. 需求分析和设计文档;
2. 程序模块;
3. 毕业论文。
毕业设计(论文)进度安排
序号 毕业设计(论文)各阶段内容 时间安排 备注
1 理解任务书要求并完成开题 2013.11.10~2013.11.21
2 阅读参考资料 2013.11.21~2013.12.31
3 完成方案设计与初步实现 2014.01.01~2014.02.10
4 系统实现与测试 2014.02.11~2014.05.15
5 撰写论文并提交审查 2014.05.16~2014.05.31
6 毕业论文评阅、答辩 2014.06.01~2014.06.10
任务起止时间 2013年11月至2014年6月
主要参考文献
[1]敖莉,舒继武,李明强. 重复数据删除技术[J]. 软件学报,2010,21(5):916-929
[2]付印金,肖侬,刘芳。重复数据删除关键技术研究进展[J]. 计算机研究与发展. 2012,49(1):12-20
[3]Benjamin Zhu, Kai Li, Hugo Patterson. Avoiding the Disk Bottleneck in the Data Domain Deduplication File System [C]. In Proceedings of the 6th USENIX Conference on File and Storage Technologies (FAST‘08), Berkeley, CA, USA: USENIX, 2008: 269~282.
[4]BiplobDebnath, SudiptaSengupta, Jin Li. ChunkStash: Speeding up Inline Storage Deduplication using Flash Memory[C]//Proc of the USENIX ATC’10. Berkeley, CA, USA: USENIX, 2010: 215~230.
[5]Y. Fu, H. Jiang, N. Xiao, L. Tian, F. Liu, “AA-Dedupe: An Application-Aware Source Deduplication Approach for Cloud Backup Services in the Personal Computing Environment,” Proc. of the 13th IEEE International Conference on Cluster Computing (Cluster’11), pp.112-120, 2011.