开 题 报 告
————桌面搜索系统
一: 课题研究背景
由于现代化社会的高速发展,在知识经济的时代,我们在完成同样事情中,谁有效率,高质量的完成事情,谁就能在知识战中取得胜利。百度搜索引擎、google搜索引擎,等众多提供搜索的公司,他们几是因为能给工作者们提供高效率的捷径,所以他们成动,出名!搜索能提高工作效率,提高劳动力的利用等,所以对该课题桌面搜索系统的研究是很有意义的。
二:什么是搜索引擎
搜索引擎指自动从英特网搜集信息,经过一定整理以后,提供给用户进行查询的系统。英特网上的信息浩瀚万千,而且毫无秩序,所有的信息象汪洋上的一个个小岛,网页链接是这些小岛之间纵横交错的桥梁,而搜索引擎,则为你绘制一幅一目了然的信息地图,供你随时查阅。
搜索引擎的工作原理 http://www.16sheji8.cn
搜索引擎的工作原理大致可以分为:
1、搜集信息:搜索引擎的信息搜集基本都是自动的。搜索引擎利用称为网络蜘蛛(spider)的自动搜索机器人程序来连上每一个网页上的超连结。机器人程序根据网页链到其他中的超链接,就象日常生活中所说的“一传十,十传百……”一样,从少数几个网页开始,连到数据库上所有到其他网页的链接。理论上,若网页上有适当的超连结,机器人便可以遍历绝大部分网页。
2、整理信息:搜索引擎整理信息的过程称为“建立索引”。搜索引擎不仅要保存搜集起来的信息,还要将它们按照一定的规则进行编排。这样,搜索引擎根本不用重新翻查它所有保存的信息而迅速找到所要的资料。想象一下,如果信息是不按任何规则地随意堆放在搜索引擎的数据库中,那么它每次找资料都得把整个资料库完全翻查一遍,如此一来再快的计算机系统也没有用。
3、接受查询:用户向搜索引擎发出查询,搜索引擎接受查询并向用户返回资料。搜索引擎每时每刻都要接到来自大量用户的几乎是同时发出的查询,它按照每个用户的要求检查自己的索引,在极短时间内找到用户需要的资料,并返回给用户。目前,搜索引擎返回主要是以网页链接的形式提供的,这些通过这些链接,用户便能到达含有自己所需资料的网页。通常搜索引擎会在这些链接下提供一小段来自这些网页的摘要信息以帮助用户判断此网页是否含有自己需要的内容。http://www.16sheji8.cn
三、课题研究的意义
桌面搜索系统类似搜索引擎,只是功能没那么强大,所以设计思路也一样的按照上面搜索引擎的原理来实现!
该系统能让对文件操作多的工作人员更快捷的找到文件,能查找不同的文件格式等,虽然微软已经做了文件搜索的,但是里面如何实现也不为人所知道。就好象有很多公司也做搜索引擎一样的,我想根据不同用户的要求做个桌面搜索引擎!
四、课题研究内容
桌面系统搜索系统功能分析:
结构图:
五、系统关键技术和难度
该系统看是功能模块不多,每个模块都很有技术难度,并且难度很大。第一要实现对不同文件格式的查找。第二,根据文件题目来查询文件。第三,更改查询方式根据文件里面的内容来查找文件,通过文件内容对搜索文本的匹配程度排序。第四,当通过不同方式把所有的文件显示出来的时候。第五:点击文件名就能显示出文件里面的匹配的部分内容。就是完成这五点都是很有技术难度的。另外,搜索是要高效率的,在对整个系统搜索的时候,电脑里面的文件是很多的,有可能一开始搜索就出现死机状态,或者半天出不了结果,这也是最困难的问题。如何实现算法,做搜索算法的优化,如何实现搜索时间跟短,耗用资源更少,这也是搜索系统要解决的问题http://www.16sheji8.cn